Jenis umum algoritma pembelajaran
mesin, tidak cukup untuk mencakup semua algoritma, kita akan fokus pada algoritma
yang paling umum.
Naïve Bayes Classifier
(Pembelajaran/Klasifikasi Terawasi) : kata “naif” karena asumsinya adalah bahwa
variabel-variabel tersebut independen satu sama lain, yaitu kemunculan satu
variabel tidak ada hubungannya dengan yang lain, algoritma Naïve Bayes
Classifier terbukti cukup efektif dan cepat berkembang. Ada asumsi lain yang
perlu diperhatikan juga : asumsi apriori, yaitu prediksi akan salah jika data
telah berubah. Ada tiga variasi pada Naïve Bayes Classifier : (1) Bernoulli, jika
memiliki data biner (benar/salah, ya/tidak). (2) Multinomial : jika datanya
diskrit, seperti jumlah halaman buku. (3) Gaussian : jika bekerja dengan data
yang sesuai dengan distribusi normal. Kasus penggunaan yang umum untuk
Pengklasifikasi Naïve Bayes adalah analisis teks. Contohnya termasuk deteksi
spam email, segmentasi pelanggan, analisis sentimen, diagnosis medis, dan
prediksi cuaca, pendekatan ini berguna dalam mengklasifikasikan data
berdasarkan fitur dan pola utama.
K-Nearest Neighbor
(Pembelajaran/Klasifikasi Terbimbing) : K-Nearest Neighbor (k-NN) adalah metode
untuk mengklasifikasikan dataset (k mewakili jumlah data yang berdekatan).
Teorinya adalah bahwa nilai-nilai yang berdekatan cenderung menjadi prediktor
yang baik untuk sebuah model. Kasus penggunaan k-NN adalah skor kredit, yang
didasarkan pada berbagai faktor seperti pendapatan, riwayat pembayaran, lokasi,
kepemilikan rumah, dan sebagainya. Algoritma akan membagi dataset menjadi
segmen pelanggan yang berbeda. Kemudian, ketika ada pelanggan baru yang
ditambahkan ke basis, akan terlihat dia termasuk dalam klaster apa, dan ini
akan menjadi nilai kreditnya. Untuk menggunakan k-NN, harus menentukan jarak
antara nilai terdekat. Jika nilainya numerik, itu bisa didasarkan pada jarak
Euclidian, yang melibatkan rumus matematika rumit. Atau, jika ada data
kategori, maka dapat menggunakan metrik tumpang tindih (di mana datanya sama
atau sangat mirip).
Regresi Linier (Pembelajaran
Terbimbing/Regresi) : dalam statistik, regresi linier adalah pendekatan linier
untuk memodelkan hubungan antara respons skalar dan satu atau lebih variabel
penjelas (juga dikenal sebagai variabel dependen dan independen). Kasus satu
variabel penjelas disebut regresi linier sederhana; untuk lebih dari satu,
prosesnya disebut regresi linier berganda. Regresi linier menunjukkan hubungan
antar variabel tertentu. Persamaan, dengan asumsi ada cukup data berkualitas,
dapat membantu memprediksi hasil berdasarkan masukan.
Sumber : T. Taulli, 2019, Artificial Intelligence Basics A Non-Technical Introduction, Apress
Comments
Post a Comment