Supervise Learning
Supervised Learning dalam bahasa indonesia adalah pembelajaran yang ada supervisornya. Maksud disini ada supervisornya adalah label di tiap data nya. Label maksudnya adalah tag dari data yang ditambahkan dalam machine learning model. Contohnya gambar kucing di tag “kucing” di tiap masing masing image kucing dan gambar anjing di tag “anjing” di tiap masing gambar anjing. Machine learning kategori dapat berupa clasification (“anjing”, “kucing”, “beruang”, dsb) dan regression ( berat badan, tinggi badan dsb). Supervised learning banyak digunakan dalam memprediksi pola dimana pola tersebut sudah ada contoh data yang lengkap, jadi pola yang terbentuk adalah hasil pembelajaran data lengkap tersebut. Tentunya jika kita memasukan data baru, setelah kita melakukan ETL (Extract Transform Load) maka kita mendapat info feature feature dari sample baru tersebut. Kemudian dari feature feature tersebut di compare dengan pattern clasification dari model yang didapat dari labeled data. Setiap label akan dicompare sampai selesai, dan yang memiliki percentage lebih banyak akan diambil sebagai prediksi akhir.
30 Alagoritmanya
Decision Trees: Membuat model keputusan berbasis aturan yang diambil dari data pelatihan.Hidden Markov Model (HMM): Model statistik untuk proses berurutan yang berguna dalam pengenalan pola seperti penandaan bagian dari teks.Gaussian Naive Bayes: Varian Naive Bayes yang mengasumsikan bahwa distribusi data adalah Gaussian.Elastic Net: Menggabungkan penalti L1 dan L2 dari regresi Ridge dan Lasso.Perceptron: Unit dasar dari jaringan saraf yang dapat digunakan untuk klasifikasi biner.Random Forest: Kumpulan dari banyak pohon keputusan yang digunakan untuk meningkatkan akurasi prediksi.Ridge Regression: Memasukkan penalti L2 untuk mengurangi overfitting dalam regresi linear.Bagging: Menggabungkan beberapa model untuk mengurangi varians.Kernel SVM: Varian SVM yang menggunakan fungsi kernel untuk memodelkan hubungan non-linier.Boosting: Metode untuk meningkatkan performa model dengan menambahkan model baru yang memperbaiki kesalahan dari model sebelumnya.Support Vector Machines (SVM): Memisahkan data ke dalam kategori yang berbeda dengan mencari hyperplane terbaik.Gradient Boosting: Meningkatkan performa model dengan membangun model secara bertahap, masing-masing mengoreksi kesalahan dari model sebelumnya.Graph Neural Networks (GNN): Jaringan saraf yang dirancang untuk memproses data yang direpresentasikan dalam bentuk graf, seperti jaringan sosial atau teks dengan hubungan antar kata.Lasso Regression: Memasukkan penalti L1 untuk menghasilkan model yang lebih sederhana dengan beberapa koefisien menjadi nol.Logistic Regression (Multinomial): Ekstensi regresi logistik untuk klasifikasi multikelas.Convolutional Neural Networks (CNN): Digunakan terutama untuk pengenalan citra tetapi dapat diterapkan pada teks dengan teknik tertentu.Recurrent Neural Networks (RNN): Digunakan untuk data berurutan seperti teks, dengan unit seperti LSTM atau GRU.Stacking: Menggabungkan beberapa model menggunakan meta-model untuk prediksi final.K-Means Clustering: Meskipun lebih sering digunakan dalam unsupervised learning, k-means dapat digunakan untuk klasifikasi setelah fase clustering.Polynomial Regression: Regresi yang memperluas model linier untuk menangkap hubungan non-linier antara variabel.K-Nearest Neighbors (K-NN): Klasifikasi berdasarkan kedekatan data baru dengan data pelatihan.Logistic Regression: Memodelkan probabilitas kejadian biner.Linear Discriminant Analysis (LDA): Digunakan untuk mencari kombinasi fitur yang memisahkan dua atau lebih kelas.Transformers: Model yang sangat efektif untuk berbagai tugas NLP, termasuk prediksi teks dan klasifikasi.AdaBoost: Algoritma boosting yang menggabungkan beberapa model lemah untuk membuat model yang kuat.Naive Bayes: Menggunakan teorema Bayes dengan asumsi independensi antar fitur untuk klasifikasi.Multilayer Perceptron (MLP): Jaringan saraf dengan beberapa lapisan yang dapat mempelajari hubungan non-linier.Quadratic Discriminant Analysis (QDA): Varian LDA yang mengasumsikan distribusi Gaussian untuk setiap kelas.Hierarchical Clustering: Teknik clustering yang juga dapat diterapkan untuk klasifikasi dalam beberapa kasus.Linear Regression: Memodelkan hubungan linier antara variabel independen dan dependen.
Komentar
Posting Komentar