Penerapan Algoritma Data Science dalam Mengatasi Kecelakaan Lalu Lintas

Belajar Data Science di Rumah 22-November-2021

https://dqlab.id/files/dqlab/cache/94b28b60d736b725356b381f34eaeec3_x_Thumbnail800.png

Kecelakaan lalu lintas merupakan penyebab kematian yang cukup tinggi hampir di seluruh negara saat ini. Meningkatnya jumlah kecelakaan lalu lintas dari tahun ke tahun membutuhkan perhatian dan penanggulangan yang serius yang mana mengingat kecelakaan lalu lintas menjadi faktor pembunuh yang cukup tinggi. Penanggulangan kecelakaan lalu lintas dapat dilakukan dengan melakukan langkah “ langkah pendekatan seperti sosialisasi dan pengawasan terhadap rambu “ rambu serta trafik pada jalan raya. Untuk dapat mencari solusi penanggulangan yang tepat maka diperlukan informasi mengenai kecelakaan lalu lintas yang terjadi. Dengan informasi kecelakaan lalu lintas yang tepat maka dapat diambil langkah-langkah penanggulangan yang efektif sehingga dapat menurunkan angka kecelakaan lalu lintas yang terjadi. Kecelakaan lalu lintas sangat sering terjadi yang mana tidak terlepas dari meningkatnya pertumbuhan penduduk sehingga meningkatkan mobilitas masyarakat. Kecelakaan lalu lintas merupakan penyebab kematian tertinggi ketiga di Indonesia.

Kecelakaan lalu lintas merupakan kejadian dimana beberapa kendaraan saling bersinggungan sehingga menyebabkan kerugian baik dalam bentuk materi maupun kesehatan. Kecelakaan lalu lintas timbul karena adanya interaksi antara eksposur dan risiko. Secara umum, eksposur dapat didefinisikan sebagai jumlah situasi yang potensial menyebabkan suatu jenis kecelakaan akan terjadi pada suatu waktu dan lokasi tertentu, sedangkan resiko adalah probabilitas bahwa suatu kecelakaan telah timbul. Eksposur kecelakaan pada umumnya direpresentasikan oleh arus lalu lintas, sementara resiko kecelakaan merupakan fungsi dari berbagai faktor yang saling berinteraksi terhadap kejadian kecelakaan lalu lintas. Dalam berbagai penelitian menggunakan algoritma data science telah dibuktikan. Hal ini didukung melalui peranan berbagai algoritma yang digunakan. Penelitian yang telah dilakukan menggunakan pendekatan yang berbeda “ beda dimana itemset yang digunakan dapat bervariatif seperti brand atau merek kendaraan, jenis kendaraan, umur pengendara yang terlibat dan sebagainya. Nah, kira-kira penggunaan algoritma apa saja ya yang digunakan untuk membantu mengatasi kecelakaan lalu lintas? Pastinya kalian penasaran nih. Pada artikel DQLab kali ini, kita akan memberikan informasi tentang penggunaan algoritma data science untuk mengatasi kecelakaan lalu lintas. Dengan harapan bisa menjadi tambahan insight dan rekomendasi bagi kalian calon praktisi data untuk memutuskan belajar data science. Jangan lewatkan artikel berikut ini, pastikan simak baik-baik, stay tune and keep scrolling on this article guys!

1. Algoritma Apriori

Algoritma apriori merupakan algoritma yang digunakan untuk menemukan subset yang memenuhi minimum confidence. Apriori menggunakan proses berulang pada k buah itemset untuk mencari (k+1) itemset. Itemset disusun pada setiap iterasi dimana L1 akan digunakan untuk menyusun L2, L2 akan digunakan untuk menyusun L3 dan seterusnya. Algoritma apriori menjadi pelopor dalam algoritma analisis asosiasi untuk menemukan kandidat itemset frequent dan pembangkitan aturan asosiasi untuk menemukan kandidat itemset frequent dan pembangkitan aturan asosiasi dapat dibentuk.Hal utama dalam teorema algoritma apriori menggunakan prinsip jika sebuah itemset merupakan itemset frequent, semua subset dari itemset tersebut juga dapat dipastikan frequen. Penelitian “ penelitian yang telah dilakukan menggunakan metode Apriori mampu menghasilkan informasi pola keterkaitan antar variabel dari kecelakaan lalu lintas yang berguna dalam menentukan langkah yang tepat dalam menanggulangi meningkatnya angka kecelakaan lalu lintas.

2. Algoritma Decision Tree

Algoritma Decision Tree merupakan bagian dari classification. Decision Tree merupakan salah satu model klasifikasi yang dapat menggunakan variabel data nominal dan numeral. Di dalam data mining juga akan dilakukan klasifikasi data kecelakaan lalu lintas berdasarkan faktor yang mempengaruhinya. Ada berbagai macam algoritma pada metode atau teknik Decision Tree yaitu algoritma ID3, algoritma random forest, algoritma CHAID, algoritma C4.5 dan lainnya. Khusus untuk algoritma C4.5 adalah salah satu algoritma yang sering dipakai karena merupakan pengembangan dari algoritma pendahulunya yaitu algoritma ID3. Berikut langkah-langkah algoritma C4.5 dalam membangun Decision Tree adalah sebagai berikut:

Pilih atribut sebagai akar.
Buat cabang untuk tiap-tiap nilai.
Bagi kasus dalam cabang.
Ulangi proses untuk setip proses cabang sampai semua kasus pada cabang memiliki kelas yang sama.

Perbedaan antara algoritma C4.5 yang merupakan perbaikan dari algoritma ID3 terletak pada pruning yaitu pemangkasan outlier atau noise data untuk kebutuhan akurasi pada klasifikasi dan prediksi. Algoritma C4.5 menghitung gain ratio untuk masing-masing atribut, dan atribut yang memiliki nilai yang tertinggi akan dipilih sebagai simpul. Penggunaan gain ratio ini memperbaiki kelemahan dari ID3 yang menggunakan information gain.

3. Algoritma FP-Growth

Algoritma Fp-growth ini merupakan algoritma yang berfungsi jika menggunakan teknik association rule yang saling berkaitan dan menggunakan himpunan data yang paling sering muncul dari beberapa faktor pendukung.Algoritma ini merupakan pengembangan dari algoritma apriori yang dikembangkan lebih lanjut pada metode scanning database dan akurasi rulesnya. Algoritma fp-growth memiliki kelebihan yaitu pada pengambilan data sampling yang hanya menggunakan 1 data dengan faktor pendukungnya sedangkan pada algoritma apriori harus menggunakan data pendukung yang banyak dan diambil data sampling yang sering muncul pada semua data yang diperoleh. Namun, kedua algoritma ini memiliki tujuan yang sama untuk menentukan frequent itemset.

Pada algoritma fp-growth ini memiliki tiga metode dasar dengan tahapan sebagai berikut, yaitu yang pertama tahap pembangkitan atau conditional pattern base yang merupakan sub-database yang berisi prefix path dan suffix pattern (pola akhiran) , pada tahap yang kedua yaitu tahap pembangkitan Conditional fp-tree, dimana tahap ini perhitungan dukungan atau support count dari setiap item untuk conditional pattern base yang dijumlahkan menjadi satu acuan data. Yang ketika tahap pencarian frequent itemset, merupakan lalu lintas tunggal atau single path, kemudian didapatkan quent itemset dengan melakukan kombinasi item untuk sistem yang mengacu pada conditional fp-tree.

4. Algoritma CPAR

CPAR merupakan perluasan dari Algoritma Predictive Rule Mining (PRM), dan PRM itu sendiri merupakan perluasan dari First Order Inductive Learner (FOIL). CPAR memiliki keunggulan sebagai berikut: (1) CPAR menghasilkan aturan prediktif yang berkualitas tinggi yang jauh lebih kecil yang diambil secara langsung dari himpunan data; (2) untuk menghindari produksi rules yang berlebihan, CPAR menghasilkan tiap-tiap rules dengan mempertimbangkan himpunan aturan-aturan yang sudah di-generate; dan (3) ketika memprediksi label kelas dari sebuah example, CPAR menggunakan rule k terbaik yang dipenuhi oleh example yang bersangkutan

5. Belajar Data Science Tanpa Laptop Berspesifikasi Tinggi Bersama DQLab!

Kini Sahabat Data DQLab sudah tidak perlu khawatir lagi. Karena dengan belajar data science di DQLab sekarang tidak perlu menggunakan laptop berspek tinggi loh. Jika kamu penasaran dengan data science dan ingin belajar data science dan excel secara langsung, caranya mudah banget. Kamu bisa loh untuk coba bikin akun gratisnya kesini di DQLab.id dan lakukan signup untuk dapatkan info-info terbaru serta belajar data science. Kamu juga bisa loh cobain Modul Platinum Excel untuk mengasah kemampuan excel kamu biar lebih oke lagi dan bisa diakses tanpa batas. Nikmati pengalaman belajar data science yang menarik bersama DQLab yang seru dan menyenangkan. Dapatkan keuntungan-keuntungan yang didapatkan salah satunya tidak perlu install software tambahan. Karena kalian belajar secara langsung terhubung dengan live code editor dari device yang kalian gunakan.

Tersedia berbagai macam modul-modul yang terupdate mulai dari free hingga platinum semua dapat diakses jika kamu ingin berlangganan buat akses seluruh modul lengkapnya. Kalian juga bisa mencoba studi kasus penerapan real case industry dan kamu juga diberikan kesempatan mendapatkan job connector dari perusahaan ternama di ranah industri data. Uniknya kamu bisa langsung apply dari akun kamu loh. Ayo persiapkan dirimu untuk berkarir sebagai praktisi data yang kompeten! Buruan SIGNUP Sekarang ya!

Penulis: Reyvan Maulid

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.