Project Scraping Data untuk Portfolio Data Analyst
Project data analyst adalah salah satu bukti yang bisa menggambarkan skill set yang dimiliki oleh seorang data analyst. Bagi jobseeker yang ingin menjadi data analyst, project ini sangat penting untuk mendapatkan pekerjaan, karena project tersebut menunjukkan kepada perekrutan bahwa kita memiliki keterampilan yang sesuai untuk role pekerjaan tersebut. Paling tidak, project-project ini akan menjadi nilai plus ketika proses sorting kandidat. Data analyst memiliki scope pekerjaan yang sangat luas, tergantung dari industri tempat ia bekerja hingga objective yang ingin dicapai oleh perusahaan.
Luasnya scope kerja data analyst ini juga menjadi salah satu faktor mengapa membangun project data analyst sangat tricky. Salah satu tugas yang terkadang dilakukan oleh data analyst adalah scraping data. Tugas ini cukup bersinggungan dengan data scientist dan data engineer, namun tidak jarang seorang data analyst juga melakukan scraping untuk mendapatkan data yang mereka perlukan.
Pada artikel kali ini DQLab akan memberikan ide-ide yang bisa kamu kembangkan untuk mengerjakan project scraping untuk membangun portfolio data analyst.
1. Pengumpulan Data Film
Project ini adalah project untuk beginner. Tujuan utamanya adalah untuk mengumpulkan dan mengekstrak data untuk analisis lebih lanjut. Untuk itu, kita dapat menggunakan situs web IMDB untuk mengumpulkan informasi tentang film populer, acara TV, aktor, dan lain sebagainya. Format situs web ini relatif konsisten sehingga kita lebih mudah mendapatkan data untuk dianalisis.
Baca juga : Kenali Perbedaan Data Scientist, Data Analyst dan Data Engineer
2. Jobs Website
Sebenarnya, project ini lebih banyak dilakukan oleh data scientist, namun akan menjadi nilai plus apabila dalam portofolio seorang data analyst terdapat project scraping. Tujuan utama kita melakukan scraping portal pencari kerja adalah untuk mengumpulkan data dan informasi tentang jabatan, perusahaan, lokasi, keterampilan, dan sebagainya. Selanjutnya, kita bisa lanjutkan dengan proses visualisasi data untuk membandingkan dan memetakan perbedaan antara bakat dan jumlah perusahaan yang sedang membuka rekrutmen.
3. Situs Belanja Online
Situs belanja online diibaratkan sebagai lumbung emas. Dari sumber ini kita bisa mendapatkan banyak data yang bisa kita kembangkan untuk berbagai analisis. Scraping situs belanja online lebih challenging karena kita perlu mengambil data sampai ke page terakhir. Untuk pemula, kita bisa mulai dengan algoritma sederhana, kemudian meningkat dengan desain data yang lebih rumit.
4. Social Media Platforms
Project yang satu ini adalah project yang sangat DQLab sarankan bagi beginner data analyst. Scraping media sosial adalah project populer di kalangan praktisi data. Ada berbagai sumber data yang bisa kita scrape. Misalnya, kita dapat mengumpulkan data dari Twitter. Ada berbagai analisis yang bisa kita eksplorasi, seperti mencari kata kunci, sentimen positif, data pengguna, dan lain sebagainya. Salah satu analisis lanjutan setelah scraping data twitter adalah membandingkan keyword populer dengan konten yang mendapat sentimen positif. Kita juga bisa menggunakan exploratory analysis untuk memeriksa korelasinya.
Baca juga : Data Analyst vs Data Scientist, Yuk Kenali Perbedaannya
Alat perang bagi data analyst untuk melakukan project scraping adalah bahasa pemrograman. Data analyst perlu membangun script yang akan digunakan sebelum mengerjakan project scraping. Setiap bahasa pemrograman memiliki library masing-masing untuk project scraping.
Yuk perdalam skill bahasa pemrograman R dan Python kamu bersama modul dari DQLab! Klik button di bawah ini atau sign up melalui DQLab.id untuk mengakses FREE MODUL ‘Introduction to Data Science’ menggunakan bahasa pemrograman R dan Python serta dapatkan sertifikat compliance-nya.
Penulis: Galuh Nurvinda K