Pengantar Kecerdasan Buatan (Bagian 9)

 

Jenis umum algoritma pembelajaran mesin, tidak cukup untuk mencakup semua algoritma, kita akan fokus pada algoritma yang paling umum.


 

 

Naïve Bayes Classifier (Pembelajaran/Klasifikasi Terawasi) : kata “naif” karena asumsinya adalah bahwa variabel-variabel tersebut independen satu sama lain, yaitu kemunculan satu variabel tidak ada hubungannya dengan yang lain, algoritma Naïve Bayes Classifier terbukti cukup efektif dan cepat berkembang. Ada asumsi lain yang perlu diperhatikan juga : asumsi apriori, yaitu prediksi akan salah jika data telah berubah. Ada tiga variasi pada Naïve Bayes Classifier : (1) Bernoulli, jika memiliki data biner (benar/salah, ya/tidak). (2) Multinomial : jika datanya diskrit, seperti jumlah halaman buku. (3) Gaussian : jika bekerja dengan data yang sesuai dengan distribusi normal. Kasus penggunaan yang umum untuk Pengklasifikasi Naïve Bayes adalah analisis teks. Contohnya termasuk deteksi spam email, segmentasi pelanggan, analisis sentimen, diagnosis medis, dan prediksi cuaca, pendekatan ini berguna dalam mengklasifikasikan data berdasarkan fitur dan pola utama.

 

K-Nearest Neighbor (Pembelajaran/Klasifikasi Terbimbing) : K-Nearest Neighbor (k-NN) adalah metode untuk mengklasifikasikan dataset (k mewakili jumlah data yang berdekatan). Teorinya adalah bahwa nilai-nilai yang berdekatan cenderung menjadi prediktor yang baik untuk sebuah model. Kasus penggunaan k-NN adalah skor kredit, yang didasarkan pada berbagai faktor seperti pendapatan, riwayat pembayaran, lokasi, kepemilikan rumah, dan sebagainya. Algoritma akan membagi dataset menjadi segmen pelanggan yang berbeda. Kemudian, ketika ada pelanggan baru yang ditambahkan ke basis, akan terlihat dia termasuk dalam klaster apa, dan ini akan menjadi nilai kreditnya. Untuk menggunakan k-NN, harus menentukan jarak antara nilai terdekat. Jika nilainya numerik, itu bisa didasarkan pada jarak Euclidian, yang melibatkan rumus matematika rumit. Atau, jika ada data kategori, maka dapat menggunakan metrik tumpang tindih (di mana datanya sama atau sangat mirip).

 

Regresi Linier (Pembelajaran Terbimbing/Regresi) : dalam statistik, regresi linier adalah pendekatan linier untuk memodelkan hubungan antara respons skalar dan satu atau lebih variabel penjelas (juga dikenal sebagai variabel dependen dan independen). Kasus satu variabel penjelas disebut regresi linier sederhana; untuk lebih dari satu, prosesnya disebut regresi linier berganda. Regresi linier menunjukkan hubungan antar variabel tertentu. Persamaan, dengan asumsi ada cukup data berkualitas, dapat membantu memprediksi hasil berdasarkan masukan.

 

Sumber : T. Taulli, 2019, Artificial Intelligence Basics A Non-Technical Introduction, Apress 

 

Comments