Ingin Belajar Data Scientist? 3 Case Studies Ini Wajib Dicoba
Machine Learning merupakan salah satu skill yang wajib dimiliki oleh seorang Data Scientist, dan juga menjadi salah satu mata pelajaran yang pasti akan kamu dapatkan dan kamu pelajari ketika kamu memutuskan untuk mulai belajar Data Scientist, sebab Machine Learning dapat membantu proses bisnis dalam melakukan analisis prediktif berdasarkan data-data yang telah dikumpulkan. Case studies atau studi kasus adalah cara yang baik untuk langsung mempraktekkan materi tentang Machine Learning, karena ini akan sangat rumit jika kamu hanya sebatas membaca teorinya tanpa langsung mempraktekkannya.
Untuk menjadi Data Scientist, kamu akan memiliki tantangan berat kedepannya. Karena harus menguasai berbagai keterampilan. Namun, itu semua sepadan dengan manfaat yang akan kita dapatkan. Perusahaan dan instansi-instansi akan menghargai orang yang dapat mengubah data mentah menjadi keputusan yang lebih cerdas, produk yang lebih baik, pelanggan yang lebih bahagia dan pada akhirnya akan mendatangkan profit untuk perusahaan juga. Selain itu, kamu akan dapat memecahkan masalah menarik yang akan menghasilkan sebuah teknologi yang dapat bermanfaat.
Jadi, dalam artikel kali ini, kami akan membagikan artikel tentang 3 case studies yang wajib kamu coba yang bisa kamu jadikan sebagai portfolio data kamu. So, Keep Scrolling and Reading, ya !
1. Sentiment Analysis
Yang menjadi urutan pertama dan patut dicoba ketika kamu memutuskan ingin belajar Data Scientist adalah sentiment analysis. Sentiment analysis atau analisis sentimen adalah sebuah metode yang digunakan untuk mengekstraksi kata-kata yang termasuk ke dalam sentimen positif atau negatif berdasarkan polaritasnya. Ini merupakan jenis klasifikasi kelas bisa binary (positif atau negatif) dan bisa juga multiple (senang, marah, sedih, netral, dll). Sentiment analysis bisa juga disebut sebagai proyek text mining. Text mining mengidentifikasi fakta, hubungan dan pernyataan berupa data tekstual dalam jumlah yang besar. Data tekstual tersebut di ekstrak terlebih dahulu dengan menggunakan sebuah metode, salah satu metode paling penting adalah dengan menggunakan NLP (Natural Language Processing).
Hal ini dilakukan karena mesin tidak dapat "membaca" data tekstual, sehingga kita perlu menggunakan metode NLP untuk membentuk mesin "membaca" data tekstual. Secara umum tahapan dalam text mining sebagai berikut:
Proses diatas ada yang dilakukan ada juga yang tidak perlu dilakukan, itu merupakan gambaran umum dari proses text mining. Semua bisa disesuaikan dengan kondisi data teks yang kamu miliki.
Baca juga : Mengenal Profesi Data Scientist
2. Road Lane Line Detection
Case studies selanjutnya adalah road lane line detection. Pendeteksi jalur jalanan adalah komponen penting dalam sistem kemudi otomatis. Konsep ini digunakan untuk mendeskripsikan jalur untuk mobil tanpa pengemudi agar terhindar dari jalur yang tidak semestinya. Dalam proyek ni, untuk mengidentifikasi jalur jalur di jalan kamu akan menggunakan library OpenCV. Library OpenCV menggunakan gambar input untuk mendeteksi garis putih yang ada di kedua sisi jalur jalanan. Langkah yang perlu dilakukan adalah pertama kamu harus mengkonversi gambar asli ke skala abu-abu, setelah itu ubah lagi ke warna gelap, kamu bisa mengubah gambar asli ke bentuk RGB atau HSV dan HLS. Jika sudah selanjutnya adalah pemilihan warna, disinilah kita akan menggunakan OpenCV. Berikutnya adalah langkah preprocessing yang digunakan untuk mengurangi noise dari gambar dengan menerapkan Gaussian Blur pada OpenCV. Lalu terapkan canny edge detector disini merupakan proses trial and error. Setelah itu, tentukan Region of interest, ambil hough lines, kemudian konsolidasi dan ekstrapolasi hough line dan gambarlah pada gambar asli.
3. Prediction of COVID-19 Diagnosis
Di bidang kesehatan data science juga digunakan untuk meningkatkan layanan kesehatan salah satu case studies yang sayang kamu lewatkan adalah prediksi diagnosa COVID-19 berdasarkan gejalanya. Pandemi virus COVID-19 yang disebabkan oleh SARS-CoV-2 terus menjadi ancaman kritis dan mendesak untuk kesehatan global. Jutaan orang diseluruh dunia telah meninggal akibat COVID-19, kamu bisa mempraktekkan skill data science kamu dengan membuat pemodelan machine learning untuk memprediksi infeksi SARS-CoV-2 berdasarkan data uji PCR pasien yang memiliki gejala positif atau terjangkit virus ini, baik itu yang memiliki gejala klinis tertentu, jenis kelamin, range usia, track record pasien berkontak langsung dengan individu lain yang terinfeksi, dan lima gejala klinis awal.
Baca juga : Yuk Kenal Role Data Scientist, Profesi Menarik Dengan Gaji Besar
4. Yuk, BELAJAR DATA SCIENCE GRATIS DI DQLAB SELAMA 1 BULAN!
Gunakan Kode Voucher "DQTRIAL", dan simak informasi di bawah ini mendapatkan 30 Hari FREE TRIAL:
Buat Akun Gratis dengan Signup di DQLab.id/signup
Buka academy.dqlab.id dan pilih menu redeem voucher
Redeem voucher "DQTRIAL" dan check menu my profile untuk melihat masa subscription yang sudah terakumulasi.
Selamat, akun kamu sudah terupgrade, dan kamu bisa mulai Belajar Data Science GRATIS 1 bulan.
Penulis: Rian Tineges
Editor: Annissa Widya Davita