Pengantar Kecerdasan Buatan (Bagian 13)


Bagian ini akan membahas Jaringan Neural (Neural Networks). Jenis paling dasar dari jaringan saraf adalah jaringan saraf yang terhubung penuh. Sesuai namanya, di sinilah semua neuron memiliki koneksi dari lapisan ke lapisan. Jaringan ini sebenarnya cukup populer karena menggunakan sedikit penilaian saat membuat model. Lalu apa sajakah jaringan saraf lainnya? Yang umum termasuk jaringan saraf berulang (Recurrent Neural Network atau RNN), jaringan saraf convolutional (Convolutional Neural Network atau CNN), dan jaringan adversarial generatif (Generative Adversarial Network atau GAN).

 

Jaringan Syaraf Berulang. Dengan jaringan saraf berulang (RNN), fungsinya tidak hanya memproses input yang baru masuk tetapi juga input sebelumnya. Contohnya adalah apa yang terjadi saat memasukkan karakter di aplikasi pesan. Saat mulai mengetik, sistem akan memprediksi kata-kata. Jadi, jika pengguna mengetuk "He", komputer akan menyarankan "He", "Hello", dan "Here’s". RNN pada dasarnya adalah serangkaian jaringan saraf yang saling memberi input berdasarkan algoritma yang kompleks. RNN memang memiliki kekurangan. Ada masalah gradien hilang, yang berarti bahwa akurasi berkurang saat model menjadi lebih besar. Model juga bisa memakan waktu lebih lama untuk dilatih. Google menggunakan RNN melalui aplikasi terjemahannya (Google Translate), yang menangani lebih dari 100 bahasa dan memproses lebih dari 100 miliar kata setiap hari. Diluncurkan pada tahun 2006, awalnya menggunakan sistem pembelajaran mesin. Namun pada tahun 2016, Google beralih ke deep learning dengan membuat Google Neural Machine Translation. Secara keseluruhan, ini menghasilkan tingkat akurasi yang jauh lebih tinggi.

 

Convolutional Neural Network (CNN) Secara intuitif, masuk akal untuk menghubungkan semua unit dalam jaringan saraf. Tetapi ada skenario yang jauh dari optimal, seperti pengenalan gambar. Bayangkan betapa rumitnya model di mana setiap piksel adalah satu kesatuan ! Hal itu bisa dengan cepat menjadi tidak terkendali. Akan ada juga komplikasi lain seperti overfitting. Di sinilah data tidak mencerminkan apa yang sedang diuji atau fokus pada fitur yang salah. Untuk mengatasi semua ini, menggunakan jaringan saraf convolutional (CNN). Sistem ini mencontoh pengambilan gambar dari retina  mata dan memprosesnya dalam tahapan yang berbeda, dari yang mudah hingga yang lebih kompleks. Setiap tahapan disebut konvolusi. Misalnya, level pertama adalah mengidentifikasi garis dan sudut; selanjutnya, korteks visual akan menemukan bentuk; dan kemudian akan mendeteksi objek. Misalkan akan membangun sebuah model yang dapat mengidentifikasi sebuah huruf. CNN akan memiliki input berupa gambar yang memiliki 3.072 piksel. Setiap piksel akan memiliki nilai dari 0 hingga 255, yang menunjukkan intensitas keseluruhan. Dengan menggunakan CNN, komputer akan melalui beberapa variasi untuk mengidentifikasi fitur-fiturnya. Yang pertama adalah lapisan convolutional, yang merupakan filter yang memindai gambar. Dalam contoh ini, ini bisa menjadi 5 × 5 piksel. Prosesnya akan membuat peta fitur, yang merupakan deretan angka yang panjang. Selanjutnya, model akan menerapkan lebih banyak filter ke gambar. Dengan melakukan ini, CNN akan mengidentifikasi garis, tepi, dan bentuk, semuanya dinyatakan dalam angka. Dengan berbagai lapisan keluaran, model akan menggunakan penyatuan, yang menggabungkannya untuk menghasilkan satu keluaran, dan kemudian membuat jaringan saraf yang terhubung sepenuhnya.

 

Generative Adversarial Network  : Ian Goodfellow, yang memperoleh gelar master dalam ilmu komputer di Stanford dan gelar PhD dalam pembelajaran mesin di Université de Montréal, melanjutkan bekerja di Google, dia ikut menulis salah satu buku AI, berjudul Deep Learning, dan juga membuat inovasi dengan Google Maps. Tahun 2014 dia melakukan terobosan, ketika dia berbicara dengan beberapa temannya tentang bagaimana pembelajaran mendalam dapat membuat foto. Pada saat itu, pendekatannya adalah menggunakan model generatif, tetapi sering kali kabur (blur) dan tidak masuk akal. Goodfellow menyadari bahwa harus ada alasan yang lebih baik. Jadi mengapa tidak menggunakan teori permainan ? Artinya, membuat dua model bersaing satu sama lain dalam putaran umpan balik yang ketat. Ini juga dapat dilakukan dengan data yang tidak berlabel. Inilah alur kerja dasar :

• Generator : Jaringan saraf ini menciptakan segudang kreasi baru, seperti foto atau kalimat.

• Diskriminator : Jaringan saraf ini mengamati kreasi untuk melihat mana yang nyata.

• Penyesuaian : Dengan kedua hasil tersebut, model baru akan mengubah kreasi menjadi serealistis mungkin. Melalui banyak iterasi, diskriminator tidak perlu lagi digunakan.

Hasilnya adalah model pembelajaran mendalam baru : jaringan adversarial generatif atau GAN. GAN juga telah terbukti membantu penelitian ilmiah yang canggih. Misalnya, membantu meningkatkan akurasi pendeteksian perilaku partikel subatomik di Large Hadron Collider di CERN di Swiss. Namun sayang, ada kegunaan GAN yang kurang baik, salah satu contohnya adalah menggunakannya untuk deepfake, yang melibatkan pemanfaatan jaringan saraf untuk membuat gambar atau video yang menyesatkan.

 

Sumber : T. Taulli, 2019, Artificial Intelligence Basics A Non-Technical Introduction, Apress 

Comments