DICARI! Yang Mau Belajar Data Science Disc. 96%
Belajar Data 6 BULAN Bersertifikat hanya Rp120K!

1 Hari 23 Jam 50 Menit 53 Detik

Top 5 Ide Portfolio Data Scientist & Contoh Metode

Belajar Data Science di Rumah 15-Januari-2023
https://dqlab.id/files/dqlab/cache/e94b1a7eb57a1b5866967cbf831e3799_x_Thumbnail800.jpeg

Ilmu data science merupakan ilmu yang terus berkembang dan memiliki banyak peran dalam menyelesaikan permasalahan di berbagai bidang kehidupan. Inilah alasan mengapa semakin banyak orang yang berminat mendalami ilmu data science. Namun, jika berkaitan dengan keahlian, terutama kebutuhan dalam suatu pekerjaan, seorang data scientist perlu menunjukkan kemampuannya. Sahabat DQ perlu terlihat cakap di bidang tersebut agar mendapatkan kesempatan untuk menyelesaikan permasalahan yang lebih kompleks. Portfolio adalah salah satu cara Sahabat DQ menunjukkan kemampuan di bidang data science.


Kebanyakan data scientist menyadari pentingnya portfolio. Sayangnya, hanya sedikit yang membuat portfolio terlihat berkesan. Jika portfolio yang Sahabat DQ buat terlalu umum dan biasa saja, tidak memuat projek yang menarik, tidak kaya akan informasi, bahkan tidak memberikan solusi atas permasalahan yang ada, tentu sulit bagi pembaca bahkan rekruter untuk terkesan dengan kemampuan kalian. Nah, artikel kali ini bertujuan untuk membantu Sahabat DQ memiliki portfolio yang mampu menunjukkan keahlian kalian semua. 


1. YouTube Comments Analysis

Data Scientist

Projek ini merupakan contoh penggunaan data scientist di bidang marketing dan keuangan. Analisis ini menggunakan teknik sentiment analysis atau pemetaan opini yang berfokus pada sikap, emosi, dan timbal balik pengguna melalui media sosial. Proses ini melibatkan deteksi pola pada bahasa sehingga praktisi data dapat menyimpulkannya ke dalam kelompok tertentu. YouTube merupakan aplikasi kedua yang paling populer di dunia. Pada bagian kolom komentar, data scientist dapat memanfaatkannya sebagai sumber memahami kebutuhan pelanggan. Berikut metode dan langkah-langkah yang bisa diikuti untuk membangun portofolio tersebut.

  • Deskripsikan permasalahan bisnis dengan detail

  • Bangun web scraper untuk mengumpulkan data

  • Bersihkan data yang sudah dikumpulkan

  • Melakukan preprocessing pada data teks untuk mengekstrak poin tambahan

  • Eksploratori data analisis to mendapatkan insight dari data

  • Membuat dashboard untuk mempresentasikan insight atau informasi yang didapat


2. Illegal Fishing Prediction

Data Scientist

Kehidupan laut memberikan dampak yang signifikan terhadap keberlangsungan kehidupan di Bumi. Hal ini karena laut menyediakan oksigen, keragaman hayati, keragaman makanan. Namun sayangnya 90% populasi ikan punah karena aktivitas penangkapan yang besar-besaran. Bahkan proses penangkapan secara ilegal menyebabkan kerusakan ekosistem laut. Kasus ini perlu ditindaklanjuti lebih dalam agar kehidupan laut tetap lestari. Salah satunya dengan mengembangkan deteksi atau model prediksi terhadap adanya aktivitas penangkapan ikan secara ilegal. 


Tanpa adanya bantuan machine learning, upaya monitoring kehidupan tentu memakan waktu dan biaya yang besar. Inilah pentingnya ilmu data science dalam bidang kemaritiman. Data GPS dari beragam transportasi laut, dan informasi lainnya akan membantu dalam membangun model machine learning tersebut. Berikut langkah-langkah yang bisa kalian perhatikan untuk membuat projek prediksi adanya aktivitas penangkapan ikan secara ilegal.

  • Mengumpulkan dataset penangkapan ikan dari berbagai sumber

  • Bersihkan data sehingga siap digunakan

  • Melakukan eksplorasi data sehingga dapat dipahami secara menyeluruh isi datanya

  • Melakukan data engineering untuk mengekstrak features yang dibutuhkan

  • Mengelompokkan data menjadi train data dan test data

  • Mengaplikasikan algoritma classification untuk data penangkapan ikan

  • Menerapkan model yang tepat dan deploy train model

  • Lakukan monitoring data model secara berkala


Baca juga : Mengenal Profesi Data Scientist


3. Bank Customer Segmentation

Data Scientist

Persaingan di dunia perbankan semakin meningkat. Untuk meningkatkan layanan dan mempertahankan serta menarik nasabah, lembaga perbankan dan non-bank perlu memodernisasi strategi pemasaran dan target pelanggan mereka melalui personalisasi. Ada berbagai model data science yang dapat membantu upaya ini. Salah satunya analisis segmentasi pelanggan. 


Segmentasi pelanggan atau pasar membantu mengembangkan strategi investasi dan personalisasi yang lebih efektif dengan informasi yang tersedia tentang nasabah. Hal ini adalah proses pengelompokan pelanggan berdasarkan karakteristik umum, seperti demografi atau perilaku. Upaya ini akan membantu meningkatkan dan mengoptimalkan target pasar menjadi lebih spesifik dan sesuai. Kalian akan mengekstrak informasi penting dari kluster ini dan membangun dashboard berdasarkan insight yang diperoleh. Output dari proses ini dapat digunakan untuk meningkatkan produk dan strategi pemasaran. 


Langkah-langkahnya adalah sebagai berikut.

  • Mengumpulkan dataset customer

  • Bersihkan data sehingga siap digunakan

  • Melakukan eksplorasi data sehingga dapat dipahami secara menyeluruh isi datanya

  • Melakukan data engineering untuk mengekstrak features yang dibutuhkan

  • Mengelompokkan data menjadi train data dan test data

  • Mengaplikasikan algoritma clustering untuk data customer

  • Mencari insight yang tepat untuk kebutuhan bisnis berdasarkan hasil modelling

  • Membangun dashboard dengan informasi yang tepat


4. Gender and Age Detection

Data Scientist

Informasi usia dan jenis kelamin memiliki berbagai aplikasi dunia nyata dalam biometrik, verifikasi identitas, pengawasan video, interaksi manusia-komputer, manajemen hubungan pelanggan elektronik, analisis perilaku kerumunan, iklan online, rekomendasi barang, dan banyak lagi. Memprediksi usia dan jenis kelamin secara otomatis dari gambar wajah adalah tugas yang sulit. Dari sudut pandang teknis, tantangan utama adalah variasi gambar wajah intra-kelas.


Dengan projek ini kalian berfokus pada menunjukkan cara membuat dan melatih model deep learning berbasis CNN untuk mendeteksi usia dan jenis kelamin orang dalam gambar tertentu. Meskipun menantang, mendemonstrasikan kemampuan dengan jenis proyek ilmu data semacam itu akan membuatmu terlihat mengesankan. Langkah-langkahnya adalah sebagai berikut.

  • Mengumpulkan dataset 

  • Bersihkan data sehingga siap digunakan

  • Melakukan eksplorasi data khususnya pengenalan wajah dan penyesuaian

  • Mengelompokkan data menjadi train data dan test data

  • Mengaplikasikan algoritma deep learning untuk mendeteksi usia dan jenis kelamin

  • Menerapkan model yang tepat dan deploy train model

  • Lakukan monitoring data model secara berkala


Baca juga : Yuk Kenal Role Data Scientist, Profesi Menarik Dengan Gaji Besar


5. Speech Emotion Recognition for Customer Satisfaction

Data Scientist

Meskipun kita bisa dengan mudah menyampaikan sikap dan perasaan secara tertulis atau melalui emoji, gif, dan gambar, ucapan tetap menjadi salah satu cara yang paling dapat diandalkan untuk mengenali emosi. Dengan demikian, pengenalan emosi ucapan adalah alat penting untuk mengukur kepuasan pelanggan. Hasil dari proyek ilmu data tersebut memberikan wawasan yang berguna untuk meningkatkan pengalaman pengguna.


Layanan pelanggan adalah titik kontak pertama bagi pengguna dan sarana umum untuk mengungkapkan ketidakpuasan. Ini berisi informasi berharga yang dapat kita gunakan untuk meningkatkan layanan atau produk bisnis. Namun, catatan layanan pelanggan berisi berbagai faktor yang tidak bergantung pada emosi, seperti perbedaan pembicara, kualitas suara, dan sebagainya, yang mengurangi kemampuan pengenalan emosi ucapan. Inilah pentingnya data scientist menerapkan ilmu data yang ia ketahui. 


Langkah-langkah yang bisa diikuti adalah sebagai berikut.

  • Mengumpulkan dataset 

  • Bersihkan data sehingga siap digunakan

  • Melakukan eksplorasi data 

  • Mengelompokkan data menjadi train data dan test data

  • Mengaplikasikan algoritma classification untuk mendeteksi emosi pelanggan

  • Menerapkan model yang tepat dan deploy train model

  • Lakukan monitoring data model secara berkala


Bagaimana Sahabat DQ, apakah sudah mulai ada gambaran mengapa portfolio penting untuk seorang data scientist? Nah, jika kalian masih bingung harus mulai dari mana untuk membangun portfolio, DQLab adalah platform yang tepat untuk kalian terutama para pemula. Jika kalian penasaran dengan data science dan ingin belajar data science secara langsung, caranya mudah, loh. 


Sahabat DQ bisa untuk mulai coba dengan membuat akun gratisnya di sini di DQLab.id dan lakukan signup untuk dapatkan info-info terbaru serta belajar data science. Nikmati pengalaman belajar data science yang menarik dan coba berlangganan bersama DQLab yang seru dan menyenangkan dengan live code editor. Tersedia juga berbagai macam modul-modul yang terupdate mulai dari gratis hingga platinum. Yuk, segera daftarkan diri kalian!


Penulis : Dita Feby 

Editor : Annissa Widya  

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login