Pengantar Kecerdasan Buatan (Bagian 5)

 

Pada bagian ini akan kembali dibahas kasus penggunaan untuk pembelajaran mesin, proses dan algoritma yang umum digunakan yaitu Deviasi Standar, Distribusi Normal, Teorema Bayes, Korelasi dan Ekstraksi Fitur.

 

Teorema Bayes : sebuah teorema yang menjelaskan bagaimana probabilitas bersyarat dari setiap rangkaian penyebab yang mungkin untuk hasil tertentu yang diamati dapat dihitung dari pengetahuan tentang probabilitas dari setiap penyebab dan probabilitas bersyarat dari hasil dari setiap penyebab. Ambilah sebuah contoh, seorang peneliti melakukan tes untuk jenis kanker tertentu, dan telah terbukti 80% akurat, dikenal sebagai positif asli (true positive). Tetapi 9,6% tes akan mengidentifikasi orang tersebut menderita kanker meskipun dia tidak mengidapnya, yang dikenal sebagai positif palsu (false positive), misalnya mengacu pada 1% populasi menderita kanker. Mengingat semua ini, jika seorang dokter menggunakan tes pada pasien dan menunjukkan bahwa pasien menderita kanker, berapa kemungkinan pasien tersebut benar-benar menderita kanker ? teorema Bayes akan menunjukkan jalannya. Perhitungan ini menggunakan faktor-faktor seperti tingkat akurasi, positif palsu, dan tingkat populasi untuk menghasilkan probabilitas, berikut langkahnya (1) langkah #1 : tingkat akurasi 80% × kemungkinan memiliki kanker (1%) = 0,008, (2)  langkah #2 : kemungkinan tidak terkena kanker (99%) × 9,6% positif palsu = 0,09504, dan (3) langkah #3 : kemudian masukkan angka-angka di atas ke dalam persamaan berikut: 0,008 / (0,008 + 0,09504) = 7,8%. Rumus teorema Bayes adalah :



Di mana :

P(A|B) – probabilitas kejadian A terjadi, dengan pertimbangan kejadian B telah terjadi

P(B|A) – probabilitas kejadian B terjadi, dengan pertimbangan kejadian A telah terjadi

P(A) – probabilitas kejadian A

P(B) – probabilitas kejadian B

Perhatikan bahwa kejadian A dan B adalah kejadian yang saling bebas (yaitu, kemungkinan hasil dari kejadian A tidak bergantung pada kemungkinan hasil dari kejadian B).

 

Korelasi : menjelaskan bagaimana satu atau lebih variabel terkait satu sama lain. Variabel-variabel ini dapat menjadi fitur input data yang telah digunakan untuk meramalkan variabel target. Korelasi, teknik statistik yang menentukan bagaimana suatu variabel bergerak/berubah serta hubungannya dengan variabel yang lain, memberi gagasan tentang tingkat hubungan dua variabel. Korelasi adalah ukuran analisis bivariat yang menggambarkan hubungan antara variabel yang berbeda. Di sebagian besar bisnis, berguna untuk mengungkapkan satu subjek dalam hubungannya dengan orang lain, misalnya : jumlah pengujian vs jumlah kasus positif Corona maka (1) jika dua variabel berkorelasi erat, maka dapat memprediksi satu variabel dari variabel lainnya. (2) korelasi memainkan peran penting dalam menemukan variabel penting yang bergantung pada variabel lain. (3) digunakan sebagai dasar untuk berbagai teknik pemodelan. (4) analisis korelasi yang tepat menghasilkan pemahaman data yang lebih baik. (5) korelasi berkontribusi terhadap pemahaman hubungan sebab akibat (bila ada). Jenis korelasi : (1) Korelasi Positif (lebih dari 0) : dua fitur (variabel) dapat berkorelasi positif satu sama lain. Artinya ketika nilai salah satu variabel meningkat maka nilai variabel lainnya juga meningkat. (2) Korelasi Negatif (kurang dari 0) : dua fitur (variabel) dapat berkorelasi negatif satu sama lain. Artinya, ketika nilai satu variabel meningkat maka nilai variabel lainnya menurun. (3) Tidak Ada Korelasi (0) : dua fitur (variabel) tidak berkorelasi satu sama lain. Artinya ketika nilai satu variabel naik atau turun maka nilai variabel lainnya tidak naik atau turun.

 

Ekstraksi fitur : proses pengurangan dimensi di mana sekumpulan awal data mentah direduksi menjadi grup yang lebih mudah dikelola untuk diproses. Karakteristik kumpulan data besar ini adalah sejumlah besar variabel yang membutuhkan banyak sumber daya komputasi untuk diproses. Ekstraksi fitur adalah nama untuk metode yang memilih dan/atau menggabungkan variabel ke dalam fitur, secara efektif mengurangi jumlah data yang harus diproses, sambil tetap mendeskripsikan kumpulan data asli secara akurat dan lengkap. Proses ekstraksi fitur berguna saat perlu mengurangi jumlah sumber daya yang diperlukan untuk pemrosesan tanpa kehilangan informasi penting atau relevan. Ekstraksi fitur juga dapat mengurangi jumlah data yang berlebihan untuk analisis tertentu. Juga, pengurangan data dan upaya mesin dalam membangun kombinasi variabel (fitur) memfasilitasi kecepatan pembelajaran dan langkah-langkah generalisasi dalam proses pembelajaran mesin. Contohnya adalah model komputer yang mengidentifikasi laki-laki atau perempuan dari sebuah foto. Bagi manusia, hal ini cukup mudah dilakukan dan cepat, sesuatu yang intuitif. Tetapi jika seseorang meminta anda untuk menjelaskan perbedaannya, apakah dapat melakukannya ? Bagi kebanyakan orang, itu akan menjadi tugas yang sulit. Namun, jika kita ingin membangun model pembelajaran mesin yang efektif, kita perlu melakukan ekstraksi fitur dengan benar dan ini bisa bersifat subyektif. Ekstraksi fitur juga memiliki beberapa masalah nuansa. Salah satunya adalah potensi bias, misalnya, apakah orang memiliki prasangka tentang seperti apa wajah pria atau wanita ? Jika demikian, hal ini dapat mengakibatkan model yang memberikan hasil yang salah, sebaiknya memiliki sekelompok ahli yang dapat menentukan fitur yang tepat.

 

Sumber : T. Taulli, 2019, Artificial Intelligence Basics A Non-Technical Introduction, Apress  

Comments