Pengantar Kecerdasan Buatan (Bagian 8)

 

Beberapa algoritma cukup mudah dihitung, sementara yang lain membutuhkan langkah -langkah kompleks dan matematika. Sedangkan untuk pembelajaran mesin, algoritma biasanya berbeda dari yang tradisional. Alasannya adalah bahwa langkah pertama adalah memproses data dan kemudian, komputer akan mulai belajar. Meskipun ada ratusan algoritma pembelajaran mesin yang tersedia, mereka sebenarnya dapat dibagi menjadi empat kategori utama : pembelajaran yang diawasi (supervised learning), pembelajaran tanpa pengawasan (unsupervised learning), pembelajaran penguatan (reinforcement learning), dan pembelajaran semi-diawasi (semi-supervised learning).




 

Pembelajaran yang diawasi : Pembelajaran yang diawasi menggunakan data berlabel. Misalnya kita memiliki satu set foto anjing yang berjumlah ribuan. Data dianggap diberi label jika setiap foto mengidentifikasi masing-masing untuk setiap jenis anjing. Ini akan membuatnya lebih mudah dianalisis karena dapat membandingkan hasil dengan jawaban yang benar. Salah satu kunci dengan pembelajaran yang diawasi adalah bahwa harus ada sejumlah besar data. Ini membantu memperbaiki model dan menghasilkan hasil yang lebih akurat. Contohnya Facebook, pada tahun 2018, perusahaan mengumumkan memanfaatkan basis data foto-foto yang sangat besar dari Instagram, yang diberi label dengan tagar (hashtags). Memang, pendekatan ini memiliki kekurangannya, tagar dapat memberikan deskripsi non-visual tentang foto tersebut. Inilah sebabnya mengapa Facebook menyebut pendekatannya "data yang diawasi dengan lemah." Tetapi para insinyur di perusahaan menemukan beberapa cara untuk meningkatkan kualitas, seperti dengan membangun model prediksi tagar yang canggih. Secara keseluruhan, semuanya berjalan cukup baik. Model pembelajaran mesin Facebook, yang mengelola 3,5 miliar foto, memiliki tingkat akurasi 85,4%, yang didasarkan pada tolok ukur pengakuan Imagenet. Itu yang tercatat tertinggi dalam sejarah, sebesar 2%.




 

Pembelajaran tanpa pengawasan : saat menggunakan data yang tidak berlabel, berarti akan menggunakan algoritma pembelajaran yang mendalam untuk mendeteksi pola. Pendekatan yang paling umum untuk pembelajaran tanpa pengawasan adalah pengelompokan, yang membutuhkan data yang tidak berlabel dan menggunakan algoritma untuk memasukkan item serupa ke dalam kelompok. Proses biasanya dimulai dengan tebakan, dan kemudian ada iterasi perhitungan untuk mendapatkan hasil yang lebih baik. Inti dari ini adalah menemukan item data yang berdekatan, yang dapat dicapai dengan berbagai metode kuantitatif : (1) Metrik Euclidean : ini adalah garis lurus antara dua poin data. Metrik Euclidean cukup umum dengan pembelajaran mesin. (2) Metrik Kesamaan Cosinus : Sesuai namanya, akan menggunakan cosinus untuk mengukur sudut. Idenya adalah untuk menemukan kesamaan antara dua titik data dalam hal teori. (3) Manhattan Metric : ini mengambil jumlah jarak absolut dari dua titik pada koordinat grafik, disebut "Manhattan" karena merujuk tata letak jalan kota, yang memungkinkan jarak yang lebih pendek untuk perjalanan. Dalam hal penggunaan kasus untuk pengelompokan, salah satu yang paling umum adalah segmentasi pelanggan, yaitu untuk membantu menargetkan pesan pemasaran yang lebih baik. Sebagian besar, kelompok yang memiliki karakteristik serupa cenderung berbagi minat dan preferensi. Aplikasi lain adalah analisis sentimen, menambang data media sosial dan menemukan tren. Untuk perusahaan fesyen, ini bisa sangat penting dalam memahami bagaimana menyesuaikan gaya dari jajaran pakaian yang akan datang.




 

Pembelajaran Penguatan : bidang pembelajaran mesin yang berkaitan dengan bagaimana agen cerdas harus mengambil tindakan di lingkungan untuk memaksimalkan gagasan kumulatif. Pembelajaran penguatan berbeda dari pembelajaran yang diawasi karena tidak membutuhkan pasangan input/output berlabel untuk disajikan, dan karena tidak membutuhkan tindakan sub-optimal untuk dikoreksi secara eksplisit. Sebaliknya fokusnya adalah menemukan keseimbangan antara eksplorasi (wilayah yang belum dipetakan) dan eksploitasi (pengetahuan saat ini). Pada tingkat yang lebih tinggi, ini analog dengan pembelajaran penguatan. Ini telah menjadi kunci untuk beberapa pencapaian paling menonjol dalam AI, seperti yang berikut (1) Game : mereka ideal untuk pembelajaran penguatan sejak ada aturan yang jelas, skor, dan berbagai kendala (seperti papan permainan). Saat membangun model, mengujinya dengan jutaan simulasi, yang berarti bahwa sistem akan dengan cepat menjadi lebih pintar dan lebih pintar. Beginilah program dapat belajar mengalahkan juara dunia go atau catur. (2) Robotika : kuncinya adalah mampu menavigasi dalam ruang, dan ini membutuhkan evaluasi lingkungan di berbagai titik. Jika robot ingin pindah ke, katakanlah, dapur, itu perlu menavigasi furnitur dan hambatan lainnya. Jika misalnya menabrak sesuatu, akan ada tindakan penguatan negatif.


 

Pembelajaran semi-diawasi : ini adalah campuran dari pembelajaran yang diawasi dan tidak diawasi. Ini muncul ketika memiliki sejumlah kecil data yang tidak berlabel. Tetapi dapat menggunakan sistem pembelajaran yang mendalam untuk menerjemahkan data yang tidak diawasi ke data yang diawasi, suatu proses yang disebut pelabelan semu. Setelah ini, dapat menerapkan algoritma. Kasus penggunaan yang menarik dari pembelajaran semi-diawasi adalah interpretasi MRI (Magnetic Resonance Imaging). Ahli radiologi pertama-tama dapat memberi label pemindaian, dan setelah ini, sistem pembelajaran yang mendalam dapat menemukan sisa polanya.

 

Sumber : T. Taulli, 2019, Artificial Intelligence Basics A Non-Technical Introduction, Apress  

Comments