Reinforcement learning adalah sebuah model pembelajaran terhadap apa yang dilakukan, dan sebagai umpan balik bagaimana memetakan perubahan situasi lingkungan terhadap aksi yang dilakukan untuk memaksimalkan keuntungan. Model proses pembelajar ini tidak harus mendikte aksi yang mana yang harus dilakukan dulu seperti umumnya pada model mesin learning. Tetapi sistem harus menjelajahi dulu seluruh aksi yang mana yang menghasilkan reward terbesar dengan cara mencobanya dan mengerjakannya, Humphrys (1997).
Wednesday, July 2, 2014
Decision tree - Bukan Pohon Biasa
Decision tree adalah salah satu metode klasifikasi yang paling populer karena mudah untuk diinterpretasi oleh manusia. Decision tree adalah model prediksi menggunakan struktur pohon atau struktur berhirarki. Konsep dari decision tree adalah mengubah data menjadi pohon keputusan dan aturan-aturan keputusan. Manfaat utama dari penggunaan decision tree adalah kemampuannya untuk mem-break down proses pengambilan keputusan yang kompleks menjadi lebih simpel sehingga pengambil keputusan akan lebih menginterpretasikan solusi dari permasalahan.
Algoritma A* (A Star / A Bintang) Algoritma
Algoritma A* (A Star / A Bintang) Algoritma - A* (dibaca "A bintang"/"A star") adalah algoritma pencarian graf/pohon yang mencari jalur dari satu titik awal ke sebuah titik akhir yang telah ditentukan. Algoritma A* menggunakan pendekatan heuristik h(x) yang memberikan peringkat ke tiap-tiap titik x dengan cara memperkirakan rute terbaik yang dapat dilalui dari titik tersebut. Setelah itu tiap-tiap titk x tersebut dicek satu-persatu berdasarkan urutan yang dibuat dengan pendekatan heuristik tersebut. Maka dari itulah algoritma A* adalah contoh dari best-first search. Algoritma ini pertama kali ditemukan pada tahun 1968 oleh Peter Hart, Nils Nilsson dan Bertram Raphael. Dalam tulisan mereka, algoritma ini dinamakan algoritma A. Penggunaan algoritma ini dengan fungsi heuristik yang tepat dapat memberikan hasil yang optimal, maka algoritma inipun disebut A*. Beberapa terminologi dasar yang terdapat pada algoritma ini adalah starting point, simpul (nodes), A, open list, closed list, harga (cost), halangan (unwalkable).
Subscribe to:
Posts (Atom)