Beberapa algoritma cukup mudah
dihitung, sementara yang lain membutuhkan langkah -langkah kompleks dan
matematika. Sedangkan untuk pembelajaran mesin, algoritma biasanya berbeda dari
yang tradisional. Alasannya adalah bahwa langkah pertama adalah memproses data
dan kemudian, komputer akan mulai belajar. Meskipun ada ratusan algoritma
pembelajaran mesin yang tersedia, mereka sebenarnya dapat dibagi menjadi empat
kategori utama : pembelajaran yang diawasi (supervised learning), pembelajaran
tanpa pengawasan (unsupervised learning), pembelajaran penguatan (reinforcement
learning), dan pembelajaran semi-diawasi (semi-supervised learning).
Pembelajaran yang diawasi :
Pembelajaran yang diawasi menggunakan data berlabel. Misalnya kita memiliki
satu set foto anjing yang berjumlah ribuan. Data dianggap diberi label jika
setiap foto mengidentifikasi masing-masing untuk setiap jenis anjing. Ini akan
membuatnya lebih mudah dianalisis karena dapat membandingkan hasil dengan
jawaban yang benar. Salah satu kunci dengan pembelajaran yang diawasi adalah
bahwa harus ada sejumlah besar data. Ini membantu memperbaiki model dan
menghasilkan hasil yang lebih akurat. Contohnya Facebook, pada tahun 2018,
perusahaan mengumumkan memanfaatkan basis data foto-foto yang sangat besar dari
Instagram, yang diberi label dengan tagar (hashtags). Memang, pendekatan ini
memiliki kekurangannya, tagar dapat memberikan deskripsi non-visual tentang
foto tersebut. Inilah sebabnya mengapa Facebook menyebut pendekatannya
"data yang diawasi dengan lemah." Tetapi para insinyur di perusahaan
menemukan beberapa cara untuk meningkatkan kualitas, seperti dengan membangun
model prediksi tagar yang canggih. Secara keseluruhan, semuanya berjalan cukup
baik. Model pembelajaran mesin Facebook, yang mengelola 3,5 miliar foto,
memiliki tingkat akurasi 85,4%, yang didasarkan pada tolok ukur pengakuan
Imagenet. Itu yang tercatat tertinggi dalam sejarah, sebesar 2%.
Pembelajaran tanpa pengawasan : saat menggunakan
data yang tidak berlabel, berarti akan menggunakan algoritma pembelajaran yang
mendalam untuk mendeteksi pola. Pendekatan yang paling umum untuk pembelajaran tanpa
pengawasan adalah pengelompokan, yang membutuhkan data yang tidak berlabel dan
menggunakan algoritma untuk memasukkan item serupa ke dalam kelompok. Proses
biasanya dimulai dengan tebakan, dan kemudian ada iterasi perhitungan untuk
mendapatkan hasil yang lebih baik. Inti dari ini adalah menemukan item data
yang berdekatan, yang dapat dicapai dengan berbagai metode kuantitatif : (1) Metrik
Euclidean : ini adalah garis lurus antara dua poin data. Metrik Euclidean cukup
umum dengan pembelajaran mesin. (2) Metrik Kesamaan Cosinus : Sesuai namanya,
akan menggunakan cosinus untuk mengukur sudut. Idenya adalah untuk menemukan
kesamaan antara dua titik data dalam hal teori. (3) Manhattan Metric : ini
mengambil jumlah jarak absolut dari dua titik pada koordinat grafik, disebut
"Manhattan" karena merujuk tata letak jalan kota, yang memungkinkan
jarak yang lebih pendek untuk perjalanan. Dalam hal penggunaan kasus untuk
pengelompokan, salah satu yang paling umum adalah segmentasi pelanggan, yaitu
untuk membantu menargetkan pesan pemasaran yang lebih baik. Sebagian besar,
kelompok yang memiliki karakteristik serupa cenderung berbagi minat dan
preferensi. Aplikasi lain adalah analisis sentimen, menambang data media sosial
dan menemukan tren. Untuk perusahaan fesyen, ini bisa sangat penting dalam
memahami bagaimana menyesuaikan gaya dari jajaran pakaian yang akan datang.
Pembelajaran Penguatan : bidang
pembelajaran mesin yang berkaitan dengan bagaimana agen cerdas harus mengambil
tindakan di lingkungan untuk memaksimalkan gagasan kumulatif. Pembelajaran
penguatan berbeda dari pembelajaran yang diawasi karena tidak membutuhkan
pasangan input/output berlabel untuk disajikan, dan karena tidak membutuhkan
tindakan sub-optimal untuk dikoreksi secara eksplisit. Sebaliknya fokusnya
adalah menemukan keseimbangan antara eksplorasi (wilayah yang belum dipetakan)
dan eksploitasi (pengetahuan saat ini). Pada tingkat yang lebih tinggi, ini
analog dengan pembelajaran penguatan. Ini telah menjadi kunci untuk beberapa
pencapaian paling menonjol dalam AI, seperti yang berikut (1) Game : mereka
ideal untuk pembelajaran penguatan sejak ada aturan yang jelas, skor, dan
berbagai kendala (seperti papan permainan). Saat membangun model, mengujinya
dengan jutaan simulasi, yang berarti bahwa sistem akan dengan cepat menjadi
lebih pintar dan lebih pintar. Beginilah program dapat belajar mengalahkan
juara dunia go atau catur. (2) Robotika : kuncinya adalah mampu menavigasi
dalam ruang, dan ini membutuhkan evaluasi lingkungan di berbagai titik. Jika
robot ingin pindah ke, katakanlah, dapur, itu perlu menavigasi furnitur dan
hambatan lainnya. Jika misalnya menabrak sesuatu, akan ada tindakan penguatan
negatif.
Pembelajaran semi-diawasi : ini
adalah campuran dari pembelajaran yang diawasi dan tidak diawasi. Ini muncul
ketika memiliki sejumlah kecil data yang tidak berlabel. Tetapi dapat
menggunakan sistem pembelajaran yang mendalam untuk menerjemahkan data yang
tidak diawasi ke data yang diawasi, suatu proses yang disebut pelabelan semu.
Setelah ini, dapat menerapkan algoritma. Kasus penggunaan yang menarik dari
pembelajaran semi-diawasi adalah interpretasi MRI (Magnetic Resonance Imaging).
Ahli radiologi pertama-tama dapat memberi label pemindaian, dan setelah ini,
sistem pembelajaran yang mendalam dapat menemukan sisa polanya.
Sumber : T. Taulli, 2019, Artificial Intelligence Basics A Non-Technical Introduction, Apress
Comments
Post a Comment