Pengantar Kecerdasan Buatan (Bagian 7)

 

Proses Pembelajaran Mesin

Agar berhasil menerapkan pembelajaran mesin (machine learning) pada suatu masalah tertentu, penting untuk mengambil pendekatan yang sistematis, jika tidak, hasilnya bisa jauh dari harapan. Pertama-tama, harus melalui proses data, lalu ada baiknya melakukan visualisasi data. Apakah sebagian besar tersebar ? Atau ada beberapa pola ? Jika jawabannya ya, maka data tersebut bisa menjadi kandidat yang baik untuk pembelajaran mesin. Tujuan dari proses pembelajaran mesin adalah untuk membuat model yang didasarkan pada satu atau lebih algoritma, mengembangkan hal ini dengan melatihnya. Tujuannya adalah bahwa model harus memberikan prediktabilitas tingkat tinggi.

 

Langkah #1Urutan Data : jika data diurutkan, maka ini dapat mengarahkan hasilnya. Artinya, algoritma pembelajaran mesin dapat mendeteksi ini sebagai sebuah pola ! Ide bagus untuk mengacak urutan data.

Langkah #2 Pilih Model : memilih sebuah algoritma. Ini akan menjadi tebakan yang cerdas, yang akan melibatkan proses coba-coba.

Langkah #3 Latih Model : Data pelatihan, yang akan menjadi sekitar 70% dari kumpulan data lengkap, akan digunakan untuk membuat hubungan dalam algoritme. Misalnya, misalkan sedang membangun sistem pembelajaran mesin untuk menemukan nilai mobil bekas. Beberapa fitur akan mencakup tahun pembuatan, pembuatan, model, jarak tempuh, dan kondisi. Dengan mengolah data pelatihan ini, algoritma akan menghitung bobot untuk masing-masing faktor tersebut. Misalkan kita menggunakan algoritma regresi linier, yang memiliki format sebagai berikut :

y = m * x + b

Pada fase pelatihan, sistem akan menghasilkan nilai m (yang merupakan kemiringan pada grafik) dan b (yang merupakan perpotongan y).

Langkah #4 Evaluasi Model : Anda akan mengumpulkan data uji, yang merupakan 30% sisa dari kumpulan data. Itu harus mewakili rentang dan jenis informasi dalam data pelatihan. Dengan data pengujian, Anda dapat melihat apakah algoritme tersebut akurat. Dalam contoh mobil bekas kita, apakah nilai pasar konsisten dengan apa yang terjadi di dunia nyata ? akurasi adalah salah satu ukuran keberhasilan algoritma. Tapi dalam beberapa kasus, menyesatkan, Pertimbangkan situasi dengan deduksi penipuan (fraud deduction). Biasanya ada sejumlah kecil fitur jika dibandingkan dengan kumpulan data. Tapi kehilangan satu bisa sangat merusak, merugikan perusahaan , inilah mengapa digunakan pendekatan lain seperti teorema Bayes.

Langkah #5 Sempurnakan Model : pada langkah ini, kita dapat menyesuaikan nilai parameter dalam algoritma. Ini untuk melihat apakah bisa mendapatkan hasil yang lebih baik. Saat menyempurnakan model, mungkin juga ada hyperparameter. Ini adalah parameter yang tidak dapat dipelajari langsung dari proses pelatihan.

 

Sumber : T. Taulli, 2019, Artificial Intelligence Basics A Non-Technical Introduction, Apress  

Comments