PROMO 10.10 BEJIBUN, MANTUL!
Belajar Data Science 6 BULAN Bersertifikat hanya Rp 100K!
0 Hari 2 Jam 57 Menit 50 Detik

Array Python dalam Implementasi Decision Tree

Belajar Data Science di Rumah 18-Agustus-2022
https://dqlab.id/files/dqlab/cache/3a75204502ad3e0ce88c1f566bc4a219_x_Thumbnail800.jpg

Python adalah bahasa pemrograman fleksibel yang terutama disukai oleh para insinyur perangkat lunak dan organisasi teknologi di seluruh dunia, dari bisnis baru hingga yang lebih besar. Ilmuwan Data menggunakannya secara luas untuk analisis data dan pembuatan pengetahuan, sementara banyak organisasi memilihnya karena kemudahan, ekstensibilitas, koherensi,transparansi, dan kelengkapan perpustakaan standarnya.


Keterampilan pemrograman Python sangat diminati dan mempelajarinya dapat membuka jalan menuju peluang tanpa akhir dalam Ilmu Data, Pembelajaran Mesin, Kecerdasan Buatan, pengembangan web, dan banyak lagi. 


Python untuk Ilmu Data digunakan untuk membangun keterampilan yang kuat dalam konsep dasar yang wajib untuk Ilmu Data. Ini termasuk penanganan data, rekayasa fitur, analisis statistik, dan pemrograman Python.


Saat Anda mulai membangun pondasi di Python untuk Ilmu Data, Anda membangun dan menerapkan algoritma analitik prediktif (regresi dan perkiraan), serta algoritma Pembelajaran Mesin klasifikasi dan segmentasi (K Means dan Random Forest) menggunakan Python. 


Python dengan Ilmu Data memungkinkan fleksibilitas dan membuat integrasi pemrograman menjadi mudah dengan sistem yang kompleks. Ini semua karena pemrograman Python yang sangat dinamis dan portabel dan karena ini, penggunaan Python luas di industri. 


Salah satu algoritmanya adalah decision tree. Decision Tree adalah alat yang paling kuat dan populer untuk klasifikasi dan prediksi. Pohon keputusan adalah struktur pohon seperti diagram alur, di mana setiap simpul internal menunjukkan pengujian pada atribut, setiap cabang mewakili hasil pengujian, dan setiap simpul daun (simpul terminal) memegang label kelas.


Bagaimana implementasi Algoritma Decision Tree dengan menggunakan Array? Yuk simak sekarang yah!


1. Apa itu Decision Tree secara Kompleks?

Sebuah pohon dapat "dipelajari" dengan membagi set sumber menjadi subset berdasarkan tes nilai atribut. Proses ini diulang pada setiap subset turunan secara rekursif yang disebut partisi rekursif. Rekursi selesai ketika subset pada node semua memiliki nilai yang sama dari variabel target, atau ketika pemisahan tidak lagi menambah nilai prediksi. 


Konstruksi pengklasifikasi pohon keputusan tidak memerlukan pengetahuan domain atau pengaturan parameter, dan oleh karena itu sesuai untuk penemuan pengetahuan eksplorasi. Pohon keputusan dapat menangani data berdimensi tinggi.


Secara umum pengklasifikasi pohon keputusan memiliki akurasi yang baik. Induksi pohon keputusan adalah pendekatan induktif yang khas untuk mempelajari pengetahuan tentang klasifikasi.


Baca juga: Tutorial Coding Python untuk Pemula Data


2. Kasus untuk Pohon Keputusan: Playing Tennis or Not

python

Source: geeksforgeeks.org 


Pohon keputusan mengklasifikasikan instance dengan mengurutkannya ke bawah pohon dari akar ke beberapa simpul daun, yang menyediakan klasifikasi instance. Sebuah instance diklasifikasikan dengan memulai dari simpul akar pohon, menguji atribut yang ditentukan oleh simpul ini, kemudian bergerak ke bawah cabang pohon yang sesuai dengan nilai atribut seperti yang ditunjukkan pada gambar di atas. 

Proses ini kemudian diulang untuk subtree yang berakar pada node baru. Pohon keputusan pada gambar di atas mengklasifikasikan pagi tertentu menurut apakah cocok untuk bermain tenis dan mengembalikan klasifikasi yang terkait dengan daun tertentu. (dalam hal ini Ya atau Tidak).

Misalnya, contoh :


(Outlook = Sunny, Temperature = Hot, Humidity = High, Wind = Strong )


akan diurutkan ke bawah cabang paling kiri dari pohon keputusan ini dan karena itu akan diklasifikasikan sebagai contoh negatif. Dengan kata lain, kita dapat mengatakan bahwa pohon keputusan mewakili disjungsi konjungsi kendala pada nilai atribut instance.


(Outlook = Cerah ^ Kelembaban = Normal) v (Outlook = Mendung) v (Outlook = Hujan ^ Angin = Lemah)


3. Indeks Nilai Gini

Indeks Nilai Gini adalah skor yang mengevaluasi seberapa akurat pemisahan di antara kelompok yang diklasifikasikan. Indeks Gini mengevaluasi skor dalam kisaran antara 0 dan 1, di mana 0 adalah ketika semua pengamatan termasuk dalam satu kelas, dan 1 adalah distribusi acak dari elemen-elemen dalam kelas.


Dalam hal ini, kami ingin memiliki skor indeks Gini serendah mungkin. Indeks Gini adalah metrik evaluasi yang akan kita gunakan untuk mengevaluasi Model Pohon Keputusan kita.


4. Implementasi Code in Python

python

Baca juga: Belajar Python: Mengenal Array pada Bahasa Pemrograman Python


Belajar memulai karir sebagai praktisi data science dengan menggunakan Python, R dan SQL sederhana dengan sign up dan login melalui DQLab Academy! Yuk nikmati kemudahan belajar tanpa ribet melalui live code editor DQLab. Belajar sambil buat portfolio dengan modul DQLab! 


Signup sekarang atau isi form dibawah ini ya Sahabat DQ!

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login