Proses Pembelajaran Mesin
Agar berhasil menerapkan pembelajaran
mesin (machine learning) pada suatu masalah tertentu, penting untuk mengambil pendekatan yang
sistematis, jika tidak, hasilnya bisa jauh dari harapan. Pertama-tama, harus
melalui proses data, lalu ada baiknya melakukan visualisasi data. Apakah
sebagian besar tersebar ? Atau ada beberapa pola ? Jika jawabannya ya, maka
data tersebut bisa menjadi kandidat yang baik untuk pembelajaran mesin. Tujuan
dari proses pembelajaran mesin adalah untuk membuat model yang didasarkan pada
satu atau lebih algoritma, mengembangkan hal ini dengan melatihnya. Tujuannya
adalah bahwa model harus memberikan prediktabilitas tingkat tinggi.
Langkah #1Urutan Data : jika data
diurutkan, maka ini dapat mengarahkan hasilnya. Artinya, algoritma pembelajaran
mesin dapat mendeteksi ini sebagai sebuah pola ! Ide bagus untuk mengacak
urutan data.
Langkah #2 Pilih Model : memilih
sebuah algoritma. Ini akan menjadi tebakan yang cerdas, yang akan melibatkan
proses coba-coba.
Langkah #3 Latih Model : Data
pelatihan, yang akan menjadi sekitar 70% dari kumpulan data lengkap, akan
digunakan untuk membuat hubungan dalam algoritme. Misalnya, misalkan sedang
membangun sistem pembelajaran mesin untuk menemukan nilai mobil bekas. Beberapa
fitur akan mencakup tahun pembuatan, pembuatan, model, jarak tempuh, dan
kondisi. Dengan mengolah data pelatihan ini, algoritma akan menghitung bobot
untuk masing-masing faktor tersebut. Misalkan kita menggunakan algoritma
regresi linier, yang memiliki format sebagai berikut :
y = m * x + b
Pada fase pelatihan, sistem akan
menghasilkan nilai m (yang merupakan kemiringan pada grafik) dan b (yang
merupakan perpotongan y).
Langkah #4 Evaluasi Model : Anda akan
mengumpulkan data uji, yang merupakan 30% sisa dari kumpulan data. Itu harus
mewakili rentang dan jenis informasi dalam data pelatihan. Dengan data
pengujian, Anda dapat melihat apakah algoritme tersebut akurat. Dalam contoh
mobil bekas kita, apakah nilai pasar konsisten dengan apa yang terjadi di dunia
nyata ? akurasi adalah salah satu ukuran keberhasilan algoritma. Tapi dalam
beberapa kasus, menyesatkan, Pertimbangkan situasi dengan deduksi penipuan
(fraud deduction). Biasanya ada sejumlah kecil fitur jika dibandingkan dengan
kumpulan data. Tapi kehilangan satu bisa sangat merusak, merugikan perusahaan ,
inilah mengapa digunakan pendekatan lain seperti teorema Bayes.
Langkah #5 Sempurnakan Model : pada
langkah ini, kita dapat menyesuaikan nilai parameter dalam algoritma. Ini untuk
melihat apakah bisa mendapatkan hasil yang lebih baik. Saat menyempurnakan
model, mungkin juga ada hyperparameter. Ini adalah parameter yang tidak dapat
dipelajari langsung dari proses pelatihan.
Sumber : T. Taulli, 2019, Artificial Intelligence Basics A Non-Technical Introduction, Apress
Comments
Post a Comment