Kenali Public Dataset untuk Portofolio Data Scientist

Menjadi seorang calon data scientist membuat kamu harus menyiapkan portofolio lebih dini. Pasalnya, portofolio dapat membantumu dalam proses rekrutmen karena disana mereka bisa lebih tahu dan memahami kira-kira skill apa saja yang bisa menunjang dirimu untuk bisa bekerjasama dengan mereka. Portofolio data scientist merupakan salah satu cara kandidat untuk bisa memukau recruiter di sesi interview.
Pelamar diberikan kesempatan untuk memanfaatkan seluruh sumber dayanya agar portofolio yang dibuat terlihat cantik dan mengesankan di mata mereka. Namun, portofolio data scientist yang baik bukan sekedar enak dilihat dan padat isinya.
Mereka harus bisa bertanggung jawab atas data yang telah dikumpulkan dan bisa menjawab kira-kira sumbernya didapatkan darimana sebagai bahan dari portofolio yang sudah dibuat. Dengan sumber yang jelas dan kredibel, rekruter sangat yakin kepada pelamar bahwa ia merupakan kandidat yang jujur.
Salah satu sumber data yang bisa menjadi pilihan data scientist adalah public dataset. Public dataset merupakan kumpulan data yang tersedia untuk umum dan dapat diakses oleh siapa saja tanpa ada batasan yang signifikan.
Dataset ini seringkali disediakan oleh organisasi pemerintah, lembaga riset, perusahaan, atau komunitas online dengan tujuan untuk mendukung analisis, penelitian, pengembangan aplikasi, dan pemahaman lebih lanjut tentang berbagai topik. Public dataset cocok menjadi bahan dalam membuat portofolio data scientist.
Lalu, apa saja manfaat calon data scientist dalam mengoptimalkan public dataset sebagai salah satu pilihan dalam mempercantik portofolio mereka? Simak yuk sahabat DQLab!
1. Demonstrasi Kemampuan Analisis Data
Public dataset memungkinkan seorang data scientist untuk menunjukkan keterampilan mereka dalam hal analisis data. Melalui pemanfaatan sumber data yang tersedia dalam kumpulan public dataset, seorang data scientist dapat menjabarkan bagaimana tahapan mereka mulai dari mengumpulkan data-data hingga data tersebut diolah menjadi insight yang bermanfaat.
Mulai dari mengumpulkan, membersihkan data, mengklasifikasikan data, menganalisis data hingga menghasilkan wawasan yang berharga bagi pengambil keputusan.
Sumber Gambar: Palantir
Baca juga : Mengenal Profesi Data Scientist
2. Keanekaragaman Proyek
Dengan mengambil topik yang berbeda, tentunya calon data scientist juga memiliki kecenderungan untuk memilih dataset yang berbeda pula. Dengan mengambil dataset yang berbeda, seorang calon data scientist dapat merancang portofolio yang beragam.
Mulai dari portofolio yang mencakup analisis statistik dasar hingga yang kompleks seperti machine learning maupun deep learning. Hal ini dapat memperlihatkan kepada HRD akan segenap kemampuan yang sudah kamu miliki bahwa kamu bisa menangani berbagai macam proyek dalam bidang data science.
3. Proyek Tanggapan terhadap Suatu Permasalahan
Membuat portofolio data scientist sama saja halnya dengan kita memecahkan permasalahan nyata yang ada di lapangan. Ketika kita dihadapkan oleh suatu permasalahan, data scientist harus bisa menanganinya dengan memanfaatkan tools yang ada.
Misalnya, ketika kamu ingin memecahkan permasalahan tentang sebaran COVID-19 di suatu daerah. Jika kamu ingin mencoba untuk memutus rantainya maka kamu perlu mengantongi data pasien terkonfirmasi positif, tingkat bed occupancy rate rumah sakit atau fasilitas kesehatan, berapa jumlah orang yang telah disuntik vaksin untuk kekebalan tubuh, dan lain-lain.
Sumber Gambar: Tableau
Baca juga : Yuk Kenal Role Data Scientist, Profesi Menarik Dengan Gaji Besar
4. Relevansi dengan Industri yang Dilamar
Dataset memegang peranan penting bagi keberlanjutan seorang data scientist dalam proses rekrutmen. Ketika mereka memilih tema yang tepat dan data yang dimiliki ini sesuai dengan industri yang dilamar, besar kemungkinan lamarannya akan diproses lebih lanjut.
Pastikan untuk memilih dataset yang relevan dengan kebutuhan industri dan kecocokan atas bidang yang kamu pilih. Tunjukkan kepada rekruter bahwa kamu memang mampu untuk menangani semua jenis proyek dan siap untuk berkontribusi secara efektif bagi perusahaan.
Ayo mulai perjalanan kamu dalam mengasah keterampilan Data Scientist dan bergabunglah dengan kursus yang tepat untuk membantu mencapai kesuksesan dalam karir ini!
DQLab sebagai platform belajar online yang berfokus pada pengenalan Data Science & Artificial Intelligence (AI) dengan menggunakan bahasa pemrograman populer seperti Python dan SQL, serta platform edukasi pertama yang mengintegrasi fitur ChatGPT siap membantu kamu menggeluti karir di industri data.
Metode HERO (Hands-On, Experiential Learning & Outcome-based) yang ramah pemula juga membantu kamu untuk bisa merasakan pengalaman belajar yang praktis & aplikatif! Tunggu apa lagi? sign up sekarang di DQLab.id!
Penulis: Reyvan Maulid
Postingan Terkait
Pentingnya Machine Learning dalam Industri Bisnis
Menangkan Kompetisi Bisnis dengan Machine Learning
Mulai Karier
sebagai Praktisi Data
Bersama DQLab
Daftar sekarang dan ambil langkah pertamamu untuk mengenal Data Science.