PROMO PUNCAK LEBARAN DISKON 99%
Belajar Data Science 6 Bulan BERSERTIFIKAT hanya Rp 99K!

0 Hari 3 Jam 44 Menit 53 Detik

Project Scraping Data untuk Portfolio Data Analyst

Belajar Data Science di Rumah 14-Januari-2023
https://dqlab.id/files/dqlab/cache/4610ea3b16c4153b996896f01cc3bc16_x_Thumbnail800.jpeg

Project data analyst adalah salah satu bukti yang bisa menggambarkan skill set yang dimiliki oleh seorang data analyst. Bagi jobseeker yang ingin menjadi data analyst, project ini sangat penting untuk mendapatkan pekerjaan, karena project tersebut menunjukkan kepada perekrutan bahwa kita memiliki keterampilan yang sesuai untuk role pekerjaan tersebut. Paling tidak, project-project ini akan menjadi nilai plus ketika proses sorting kandidat. Data analyst memiliki scope pekerjaan yang sangat luas, tergantung dari industri tempat ia bekerja hingga objective yang ingin dicapai oleh perusahaan.


Luasnya scope kerja data analyst ini juga menjadi salah satu faktor mengapa membangun project data analyst sangat tricky. Salah satu tugas yang terkadang dilakukan oleh data analyst adalah scraping data. Tugas ini cukup bersinggungan dengan data scientist dan data engineer, namun tidak jarang seorang data analyst juga melakukan scraping untuk mendapatkan data yang mereka perlukan. 


Pada artikel kali ini DQLab akan memberikan ide-ide yang bisa kamu kembangkan untuk mengerjakan project scraping untuk membangun portfolio data analyst. 


1. Pengumpulan Data Film

Project ini adalah project untuk beginner. Tujuan utamanya adalah untuk mengumpulkan dan mengekstrak data untuk analisis lebih lanjut. Untuk itu, kita dapat menggunakan situs web IMDB untuk mengumpulkan informasi tentang film populer, acara TV, aktor, dan lain sebagainya. Format situs web ini relatif konsisten sehingga kita lebih mudah mendapatkan data untuk dianalisis. 


Data Analyst


Baca juga : Kenali Perbedaan Data Scientist, Data Analyst dan Data Engineer


2. Jobs Website

Sebenarnya, project ini lebih banyak dilakukan oleh data scientist, namun akan menjadi nilai plus apabila dalam portofolio seorang data analyst terdapat project scraping. Tujuan utama kita melakukan scraping portal pencari kerja adalah untuk mengumpulkan data dan informasi tentang jabatan, perusahaan, lokasi, keterampilan, dan sebagainya. Selanjutnya, kita bisa lanjutkan dengan proses visualisasi data untuk membandingkan dan memetakan perbedaan antara bakat dan jumlah perusahaan yang sedang membuka rekrutmen.


Data Analyst


3. Situs Belanja Online

Situs belanja online diibaratkan sebagai lumbung emas. Dari sumber ini kita bisa mendapatkan banyak data yang bisa kita kembangkan untuk berbagai analisis. Scraping situs belanja online lebih challenging karena kita perlu mengambil data sampai ke page terakhir. Untuk pemula, kita bisa mulai dengan algoritma sederhana, kemudian meningkat dengan desain data yang lebih rumit. 

Data Analyst


4. Social Media Platforms

Project yang satu ini adalah project yang sangat DQLab sarankan bagi beginner data analyst. Scraping media sosial adalah project populer di kalangan praktisi data. Ada berbagai sumber data yang bisa kita scrape. Misalnya, kita dapat mengumpulkan data dari Twitter. Ada berbagai analisis yang bisa kita eksplorasi, seperti mencari kata kunci, sentimen positif, data pengguna, dan lain sebagainya. Salah satu analisis lanjutan setelah scraping data twitter adalah membandingkan keyword populer dengan konten yang mendapat sentimen positif. Kita juga bisa menggunakan exploratory analysis untuk memeriksa korelasinya.

Data Analyst


Baca juga : Data Analyst vs Data Scientist, Yuk Kenali Perbedaannya 


Alat perang bagi data analyst untuk melakukan project scraping adalah bahasa pemrograman. Data analyst perlu membangun script yang akan digunakan sebelum mengerjakan project scraping. Setiap bahasa pemrograman memiliki library masing-masing untuk project scraping.


Yuk perdalam skill bahasa pemrograman R dan Python kamu bersama modul dari DQLab! Klik button di bawah ini atau sign up melalui DQLab.id untuk mengakses FREE MODUL ‘Introduction to Data Science’ menggunakan bahasa pemrograman R dan Python serta dapatkan sertifikat compliance-nya.


Penulis: Galuh Nurvinda K


Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login