Pada bagian ini akan kembali dibahas
kasus penggunaan untuk pembelajaran mesin, proses dan algoritma yang umum
digunakan yaitu Deviasi Standar, Distribusi Normal, Teorema Bayes, Korelasi dan
Ekstraksi Fitur.
Teorema Bayes : sebuah teorema yang
menjelaskan bagaimana probabilitas bersyarat dari setiap rangkaian penyebab
yang mungkin untuk hasil tertentu yang diamati dapat dihitung dari pengetahuan
tentang probabilitas dari setiap penyebab dan probabilitas bersyarat dari hasil
dari setiap penyebab. Ambilah sebuah contoh, seorang peneliti melakukan tes
untuk jenis kanker tertentu, dan telah terbukti 80% akurat, dikenal sebagai
positif asli (true positive). Tetapi 9,6% tes akan mengidentifikasi orang
tersebut menderita kanker meskipun dia tidak mengidapnya, yang dikenal sebagai
positif palsu (false positive), misalnya mengacu pada 1% populasi menderita
kanker. Mengingat semua ini, jika seorang dokter menggunakan tes pada pasien
dan menunjukkan bahwa pasien menderita kanker, berapa kemungkinan pasien
tersebut benar-benar menderita kanker ? teorema Bayes akan menunjukkan
jalannya. Perhitungan ini menggunakan faktor-faktor seperti tingkat akurasi,
positif palsu, dan tingkat populasi untuk menghasilkan probabilitas, berikut
langkahnya (1) langkah #1 : tingkat akurasi 80% × kemungkinan memiliki kanker
(1%) = 0,008, (2) langkah #2 : kemungkinan
tidak terkena kanker (99%) × 9,6% positif palsu = 0,09504, dan (3) langkah #3 :
kemudian masukkan angka-angka di atas ke dalam persamaan berikut: 0,008 /
(0,008 + 0,09504) = 7,8%. Rumus teorema Bayes adalah :
Di mana :
P(A|B) – probabilitas kejadian A
terjadi, dengan pertimbangan kejadian B telah terjadi
P(B|A) – probabilitas kejadian B
terjadi, dengan pertimbangan kejadian A telah terjadi
P(A) – probabilitas kejadian A
P(B) – probabilitas kejadian B
Perhatikan bahwa kejadian A dan B
adalah kejadian yang saling bebas (yaitu, kemungkinan hasil dari kejadian A
tidak bergantung pada kemungkinan hasil dari kejadian B).
Korelasi : menjelaskan bagaimana satu
atau lebih variabel terkait satu sama lain. Variabel-variabel ini dapat menjadi
fitur input data yang telah digunakan untuk meramalkan variabel target. Korelasi,
teknik statistik yang menentukan bagaimana suatu variabel bergerak/berubah serta
hubungannya dengan variabel yang lain, memberi gagasan tentang tingkat hubungan
dua variabel. Korelasi adalah ukuran analisis bivariat yang menggambarkan
hubungan antara variabel yang berbeda. Di sebagian besar bisnis, berguna untuk
mengungkapkan satu subjek dalam hubungannya dengan orang lain, misalnya : jumlah
pengujian vs jumlah kasus positif Corona maka (1) jika dua variabel berkorelasi
erat, maka dapat memprediksi satu variabel dari variabel lainnya. (2) korelasi
memainkan peran penting dalam menemukan variabel penting yang bergantung pada
variabel lain. (3) digunakan sebagai dasar untuk berbagai teknik pemodelan. (4)
analisis korelasi yang tepat menghasilkan pemahaman data yang lebih baik. (5) korelasi
berkontribusi terhadap pemahaman hubungan sebab akibat (bila ada). Jenis
korelasi : (1) Korelasi Positif (lebih dari 0) : dua fitur (variabel) dapat
berkorelasi positif satu sama lain. Artinya ketika nilai salah satu variabel
meningkat maka nilai variabel lainnya juga meningkat. (2) Korelasi Negatif
(kurang dari 0) : dua fitur (variabel) dapat berkorelasi negatif satu sama
lain. Artinya, ketika nilai satu variabel meningkat maka nilai variabel lainnya
menurun. (3) Tidak Ada Korelasi (0) : dua fitur (variabel) tidak berkorelasi
satu sama lain. Artinya ketika nilai satu variabel naik atau turun maka nilai
variabel lainnya tidak naik atau turun.
Ekstraksi fitur : proses pengurangan
dimensi di mana sekumpulan awal data mentah direduksi menjadi grup yang lebih
mudah dikelola untuk diproses. Karakteristik kumpulan data besar ini adalah
sejumlah besar variabel yang membutuhkan banyak sumber daya komputasi untuk
diproses. Ekstraksi fitur adalah nama untuk metode yang memilih dan/atau
menggabungkan variabel ke dalam fitur, secara efektif mengurangi jumlah data
yang harus diproses, sambil tetap mendeskripsikan kumpulan data asli secara
akurat dan lengkap. Proses ekstraksi fitur berguna saat perlu mengurangi jumlah
sumber daya yang diperlukan untuk pemrosesan tanpa kehilangan informasi penting
atau relevan. Ekstraksi fitur juga dapat mengurangi jumlah data yang berlebihan
untuk analisis tertentu. Juga, pengurangan data dan upaya mesin dalam membangun
kombinasi variabel (fitur) memfasilitasi kecepatan pembelajaran dan
langkah-langkah generalisasi dalam proses pembelajaran mesin. Contohnya adalah
model komputer yang mengidentifikasi laki-laki atau perempuan dari sebuah foto.
Bagi manusia, hal ini cukup mudah dilakukan dan cepat, sesuatu yang intuitif.
Tetapi jika seseorang meminta anda untuk menjelaskan perbedaannya, apakah dapat
melakukannya ? Bagi kebanyakan orang, itu akan menjadi tugas yang sulit. Namun,
jika kita ingin membangun model pembelajaran mesin yang efektif, kita perlu
melakukan ekstraksi fitur dengan benar dan ini bisa bersifat subyektif. Ekstraksi
fitur juga memiliki beberapa masalah nuansa. Salah satunya adalah potensi bias,
misalnya, apakah orang memiliki prasangka tentang seperti apa wajah pria atau
wanita ? Jika demikian, hal ini dapat mengakibatkan model yang memberikan hasil
yang salah, sebaiknya memiliki sekelompok ahli yang dapat menentukan fitur yang
tepat.
Sumber : T. Taulli, 2019, Artificial Intelligence Basics A Non-Technical Introduction, Apress
Comments
Post a Comment