JULY SPECIAL ! DISKON 96%
Belajar Data Science Bersertifikat, 12 Bulan hanya 180K!
1 Hari 9 Jam 11 Menit 20 Detik

Kenali Karakteristik Metrik Model pada Data Scientist

Belajar Data Science di Rumah 06-September-2023
https://dqlab.id/files/dqlab/cache/longtail-selasa-02-2023-09-06-110123_x_Thumbnail800.jpg

Dewasa ini khususnya dalam era data besar, Data Scientist perlu mampu mengelola dan menganalisis jumlah data yang besar dan kompleks. Dalam kesehariannya, Data Scientist sering dapat memberikan wawasan baru yang dapat mengarah pada inovasi dalam model bisnis atau pendekatan baru dalam pengambilan keputusan.


Maka dari itu, dibutuhkan suatu pelatihan untuk menguji dan memberikan pemahaman secara mendalam bagi calon data scientist agar siap dalam mengatasi permasalahan di dunia kerja yang berkaitan dengan analisis dan visualisasi data.


Secara keseluruhan, pelatihan Data Scientist bertujuan untuk menciptakan individu yang mampu menerjemahkan data menjadi informasi berharga, mengatasi tantangan analitis, dan mendukung pengambilan keputusan berbasis bukti di berbagai industri dan bidang.


Data Scientist yang terlatih memiliki pemahaman yang mendalam tentang data yang digunakan dalam model. Mereka tahu bagaimana data dikumpulkan, diproses, dan berpotensi memiliki bias atau anomali. Ini membantu mereka merancang metrik yang mempertimbangkan karakteristik data secara menyeluruh.


Pemilihan metrik yang tepat sangat penting dalam mengevaluasi kinerja model. Data Scientist terlatih dapat menentukan metrik yang sesuai dengan tujuan bisnis atau penelitian yang spesifik. Mereka juga dapat menghindari kesalahan umum seperti memilih metrik yang tidak cocok dengan masalah yang dihadapi. 


Ada beberapa metrik yang bisa dipahami oleh seorang calon data scientist agar mereka bisa menerapkan sesuai dengan kebutuhan, situasi dan kondisi yang dihadapinya. So, apa aja metrik yang digunakan dalam membangun model? Simak yuk sahabat DQLab!


1. Presisi

Presisi adalah salah satu metrik evaluasi yang penting dalam data science, terutama dalam konteks klasifikasi (classification). Metrik ini memberikan gambaran tentang sejauh mana model klasifikasi mampu mengidentifikasi dengan tepat kasus-kasus yang sebenarnya positif dari semua kasus yang diprediksi sebagai positif oleh model. 


Data Scientist 


Jadi, presisi adalah perbandingan antara jumlah positif yang benar-benar diidentifikasi oleh model (True Positives) dengan jumlah keseluruhan yang diprediksi sebagai positif oleh model (True Positives + False Positives).


Presisi adalah metrik yang berguna ketika Anda ingin meminimalkan jumlah False Positives, yaitu kasus-kasus yang secara keliru diklasifikasikan sebagai positif oleh model. Misalnya, dalam aplikasi medis di mana hasil positif dapat berdampak besar terhadap pasien, Anda mungkin ingin memaksimalkan presisi.


Baca juga : Mengenal Profesi Data Scientist


2. AUC-ROC

AUC-ROC adalah metrik evaluasi yang umum digunakan dalam data science, terutama dalam konteks evaluasi model klasifikasi, seperti model regresi logistik, Support Vector Machines (SVM), dan model klasifikasi lainnya. AUC-ROC adalah singkatan dari "Area Under the Receiver Operating Characteristic Curve" atau sering disebut sebagai ROC-AUC.


Secara singkat, AUC-ROC digunakan untuk mengukur sejauh mana model klasifikasi mampu membedakan antara sampel positif dan negatif. Semakin besar nilai AUC, semakin baik kemampuan model dalam melakukan klasifikasi.


Model dengan AUC yang tinggi cenderung memiliki ROC Curve yang mendekati sudut kiri atas grafik (TPR tinggi dan FPR rendah), yang mengindikasikan bahwa model memiliki tingkat Recall yang baik tanpa mengorbankan tingkat presisi.


3. F1 Score

F1 Score adalah metrik evaluasi yang digunakan dalam data science, terutama dalam konteks klasifikasi (classification). Ini adalah ukuran yang menggabungkan Precision (presisi) dan Recall (recall) untuk memberikan gambaran yang lebih komprehensif tentang kinerja model klasifikasi.


Seperti yang telah dijelaskan sebelumnya, Precision adalah rasio True Positives (kasus yang benar-benar positif) dibagi dengan keseluruhan hasil yang diprediksi sebagai positif oleh model (True Positives + False Positives). Recall adalah rasio True Positives dibagi dengan keseluruhan kasus yang seharusnya positif (True Positives + False Negatives).


F1 Score adalah rata-rata harmonik (harmonic mean) antara Precision dan Recall, dan dihitung dengan rumus berikut:

Data Scientist


Baca juga : Yuk Kenal Role Data Scientist, Profesi Menarik Dengan Gaji Besar


4. Recall

Recall adalah salah satu metrik evaluasi yang penting dalam data science, terutama dalam konteks klasifikasi (classification). Metrik ini membantu kita memahami sejauh mana model klasifikasi mampu mengidentifikasi semua sampel yang seharusnya masuk ke dalam kategori positif (True Positive) dari semua yang benar-benar ada.

Data Scientist


Jadi, recall adalah perbandingan antara jumlah positif yang benar-benar diidentifikasi oleh model (True Positives) dengan jumlah keseluruhan yang seharusnya positif (True Positives + False Negatives).


Recall adalah metrik yang berguna dalam situasi di mana kesalahan false negatives lebih berbahaya daripada false positives. Misalnya, dalam pengujian penyakit, lebih baik memiliki false alarm (false positives) daripada melewatkan kasus penyakit (false negatives).


Dalam pengembangan model yang sukses, metrik yang baik adalah kunci untuk menilai kinerja dan membuat perbaikan yang diperlukan. Pelatihan Data Scientist membekali individu dengan pengetahuan, keterampilan, dan pemahaman yang diperlukan untuk merancang, menerapkan, dan mengelola metrik model yang efektif. Yuk perdalam skill data scientist kamu bersama DQLab! 


DQLab merupakan suatu platform belajar online yang berfokus pada pengenalan Data Science & Artificial Intelligence (AI) dengan menggunakan berbagai bahasa pemrograman populer. Selain itu DQLab merupakan platform edukasi pertama yang mengintegrasi fitur ChatGPT.


DQLab juga menggunakan metode HERO, yaitu Hands-On, Experiential Learning & Outcome-based, yang dirancang ramah untuk pemula. Untuk bisa merasakan pengalaman belajar yang praktis & aplikatif yuk langsung saja sign up di DQLab.id/signup dan ikuti DQLab LiveClass Bootcamp Machine Learning and AI for Beginner sekarang! 


Penulis: Reyvan Maulid


Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login