⚡ HARI TERAKHIR 98% OFF ⚡
Belajar Data Science 12 BULAN Bersertifikat hanya Rp 180K!
0 Hari 4 Jam 17 Menit 33 Detik

Mari Berkenalan dengan Reinforcement Learning, Tipe Machine Learning yang Sedang Hits Akhir-Akhir Ini

Yovita 27-November-2020
https://dqlab.id/files/dqlab/cache/5a2370f2eb3245474d98c255d4dbb5bd_x_Thumbnail800.jpg

Reinforcement learning adalah tipe algoritma machine learning yang bisa membuat agent software dan mesin bekerja secara otomatis untuk menentukan perilaku yang ideal sehingga dapat memaksimalkan kinerja algoritmanya. DAlam beberapa tahun terakhir, penggunaan reinforcement learning terus meningkat, contohnya DeepMind and the Deep Q learning pada tahun 2014, AlphaGo di tahun 2016, dan OpenAI dan PPO di tahun 2017. Algoritma reinforcement learning didefinisikan sebagai metode machine learning yang berkaitan dengan cara software agent mengambil tindakan di environmentnya. Algoritma ini merupakan bagian dari metode deep learning yang akan memaksimalkan sebagian reward kumulatif. 

Dalam algoritma reinforcement learning, ada beberapa istilah penting yang akan sering digunakan, yaitu agent, environment (e), reward (r), state (s), policy (Ï€), value (V), value function, model of the environment, model based methods, dan Q value atau action value (Q). Pada artikel kali ini, DQLab akan mengupas reinforcement learning mulai dari istilah penting, algoritmanya, hingga penggunaan reinforcement learning. Penasaran? Yuk simak artikelnya!

1. Istilah Penting Dalam Reinforcement Learning

Seperti yang sudah dijelaskan di awal, algoritma reinforcement learning memiliki beberapa istilah penting yang akan selalu dipakai saat kita bekerja dengan algoritma ini. Agent adalah entitas yang diasumsikan melakukan tindakan di environment untuk mendapatkan beberapa reward, environment (e) adalah skenario yang harus dihadapi agen, reward (r) adalah pengembalian langsung yang diberikan kepada agen ketika dia melakukan tindakan atau tugas tertentu, state adalah keadaan yang mengacu pada situasi saat ini yang dikembalikan oleh environment, policy (Ï€) adalah strategi yang diterapkan oleh agent untuk memutuskan tindakan selanjutnya berdasarkan keadaan saat ini, value(V) adalah pengembalian jangka panjang, value function adalah fungsi yang menentukan nilai state yang merupakan jumlah total reward, model of environment merupakan model yang bertugas untuk menirukan keadaan lingkungan. Fungsi ini akan membuat kesimpulan dan menentukan bagaimana environment bekerja. Model based method merupakan metode pemecahan masalah reinforcement learning yang menggunakan metode berbasis model. Q value atau action value (Q) sangat mirip dengan value, satu-satunya perbedaan antara keduanya adalah Q value membutuhkan parameter tambahan untuk actionnya.

Baca juga : 3 Jenis Algoritma Machine Learning yang Dapat Digunakan di Dunia Perbankan

2. Algoritma, Karakter, dan Tipe dari Reinforcement Learning

Ada tiga pendekatan yang bisa kita gunakan untuk mengimplementasikan algoritma Reinforcement Learning, yaitu value-based, policy-based, dan model-based. Pendekatan berdasarkan value-based kita harus mencoba memaksimalkan value function. Dalam metode ini, agent mengharapkan long-term return dari policy Ï€. Dalam metode reinforcement learning policy-based, kita mencoba menghasilkan policy sedemikian rupa sehingga tindakan yang dilakukan di setiap state dapat membantu mendapatkan reward maksimum. Sedangkan dalam algoritma reinforcement learning model-based, kita perlu membuat model virtual untuk setiap environment dan agent belajar untuk bekerja di environment  tersebut. Algoritma reinforcement learning memiliki beberapa karakteristik penting, antara lain algoritma ini tidak memerlukan supervisor, jadi hanya menggunakan bilangan real atau reward, pengambilan keputusan dengan algoritma ini dilakukan secara beruntun. Selain itu, dalam algoritma reinforcement, waktu sangat berperan penting dan feedback yang diterima selalu delay (tertunda). 

Algoritma reinforcement learning memiliki dua tipe yaitu positif dan negatif. Reinforcement learning positif didefinisikan sebagai peristiwa yang akan terjadi karena perilaku tertentu. Algoritma ini akan meningkatkan kekuatan dan frekuensi yang akan berdampak positif pada tindakan yang akan diambil oleh agent. Algoritma reinforcement learning positif ini akan membantu memaksimalkan kinerja dan mempertahankan perubahan waktu. Namun, terlalu banyak reinforcement juga dapat menyebabkan pengoptimalan state yang berlebih sehingga dapat mempengaruhi hasil. Tipe algoritma reinforcement yang kedua adalah algoritma reinforcement negatif. Algoritma ini diartikan sebagai penguatan perilaku yang terjadi karena adanya kondisi negatif yang seharusnya dihentikan atau dihindari. Algoritma tipe ini membantu kita untuk menentukan standar kerja minimum. 

3. Contoh Pengaplikasian Reinforcement Learning di Beberapa Sektor

Contoh pertama penggunaan reinforcement learning adalah di sektor manufaktur. Beberapa perusahaan manufaktur menggunakan robot dengan reinforcement learning untuk mengambil barang dari satu tempat ke tempat lain. Robot ini akan dilatih untuk menghafal objek dan melakukan pekerjaan dengan kecepatan dan presisi yang tinggi. Selain itu robot-robot ini juga bisa digunakan untuk menyortir berjuta-juta produk di gudang supermarket atau e-commerce. Tujuan pemanfaatan robot ini adalah untuk menghindari human error sehingga produk tersebut dapat dikirim ke konsumen yang tepat. Pabrik tesla pun menggunakan lebih dari 160 robot yang bekerja untuk merakit mobil sehingga dapat mengurangi resiko cacat saat proses produksi.

Algoritma reinforcement learning juga dapat diaplikasikan pada power system. Reinforcement learning dan teknik pengoptimalan digunakan untuk menilai keamanan sistem tenaga listrik dan meningkatkan kinerja Microgrid. Metode adaptive learning digunakan untuk mengembangkan sistem pengontrol dan pelindung. Teknologi transmisi dengan perangkat High-Voltage Direct Current (HVDC) dan Flexible Alternating Current Transmission System devices (FACTS) berdasarkan reinforcement learning dapat membantu mengurangi transmisi dan emisi CO2 secara efektif. Reinforcement learning digunakan untuk mengembangkan struktur kontrol yang terdistribusi untuk satu set sumber pembangkit. 

Selain di sektor manufaktur dan power system, reinforcement learning juga dapat digunakan di sektor keuangan. Perusahaan Pit.AI merupakan perusahaan pertama yang memanfaatkan reinforcement learning untuk mengevaluasi strategi perdagangan. Algoritma ini ternyata menjadi tool yang kuat pada sistem pelatihan untuk mengoptimalkan tujuan keuangan. Algoritma reinforcement learning ini memiliki peran yang sangat besar dalam perdagangan pasar saham karena algoritma Q-Learning (salah satu tipe reinforcement learning) dapat mempelajari strategi perdagangan yang optimal melalui satu instruksi sederhana dengan memaksimalkan nilai portofolio.

Reinforcement learning adalah algoritma yang tidak terlepas dari data science. Kedua teknologi ini saling melengkapi satu sama lain. Hal ini karena data science adalah ilmu yang dapat diterapkan di teknologi manapun. Bahkan saat ini, hampir semua perusahaan sudah mulai menerapkan data science untuk meningkatkan kinerjanya. Tak heran jika belakangan ini lowongan pekerjaan data scientist semakin meningkat. Tingginya lapangan pekerjaan di bidang data science membuat banyak orang mulai tertarik mempelajari ilmu ini secara serius. Uniknya, tidak ada syarat latar pendidikan tertentu untuk mempelajari ilmu data science ini sehingga orang-orang dengan background pendidikan apapun bisa belajar ilmu "mahal" ini.

Baca juga : Belajar Data Science: Pahami Penggunaan Machine Learning pada Python

4. Yuk, Mulai Belajar Data Science bersama DQLab secara GRATIS!

Tidak memiliki background IT? Jangan khawatir, kamu tetap bisa menguasai Ilmu Data Science untuk siap berkarir di revolusi industri 4.0. Bangun proyek dan portofolio datamu bersama DQLab untuk mulai berkarir di industi! Sign up sekarang untuk #MulaiBelajarData di DQLab!

Simak informasi di bawah ini untuk mengakses gratis module "Introduction to Data Science":

  1. Buat Akun Gratis dengan Signup di DQLab.id/signup

  2. Akses module Introduction to Data Science

  3. Selesaikan modulenya, dapatkan sertifikat & reward menarik dari DQLab

  4. Subscribe DQLab.id untuk Akses Semua Module Premium!


Penulis: Galuh Nurvinda Kurniawati

Editor: Annissa Widya Davita

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login