Ide Project Data Analyst untuk Kasus Data Scraping
Project data analyst menjadi salah satu cara bagi calon kandidat untuk membangun portofolio data. Portofolio data menjadi salah satu cara menarik rekruter berbekal skill yang sudah kita dapatkan baik di pelatihan maupun kursus data. Berbekal dari kasus-kasus yang sedang booming saat ini menjadi sebuah peluang mereka untuk mengaplikasikan skillnya ke dalam portofolio mereka. Dengan adanya project data analyst maka calon kandidat dapat mendemonstrasikan skill, kemampuan teknis serta gambaran pemecahan masalah atas kasus yang dipilih.
Namun seringkali calon kandidat menemukan kebuntuan dikala menentukan kira-kira topik project apa sih yang ingin kita jadikan dasar dalam pembuatan portofolio data? Sebenarnya kalau kalian riset lebih jauh, banyak loh tema-tema yang berkaitan dengan data science maupun data analytics. Salah satunya adalah data scraping yang bisa dijadikan sebagai inspirasi dalam project data analyst kamu.
Berdasarkan definisinya, data scraping (pengikisan/pengorekan data) adalah teknik otomatisasi yang memungkinkan seseorang untuk mengekstrak data dari sebuah website, database, aplikasi enterprise, atau sistem legacy yang kemudian dapat menyimpannya ke dalam sebuah file dengan format tabular atau spreadsheet. Metode data scraping dianggap cukup mudah untuk dilakukan karena dapat memberikan informasi yang dapat dibaca dan nyata.
Apalagi data scraping membuat pengumpulan semua informasi yang dibutuhkan pada sebuah website akan lebih cepat. Nah, data scraping ini tentunya bisa kamu jadikan sebagai ide project data analyst untuk portofolio data. Kali ini DQLab akan berikan sederetan inspirasi project yang bisa kamu gunakan utamanya pada tema data scraping. Penasaran kan? Yuk simak terus artikelnya dibawah ini dan baca sampai habis ya.
1. The Internet Movie Database
Project data analyst yang pertama adalah The Internet Movie Database. Internet Movie Database adalah database film terbesar dan terlengkap di Web. Sumber data film yang luar biasa rinci menampilkan film-film papan atas, berita film, deskripsi film, ulasan film, cuplikan film, jadwal pemutaran film, ulasan film DVD, profil selebriti, aktor, aktris yang membintangi film tersebut dan masih banyak sekali data-data lainnya.
Awalnya situs ini dioperasikan oleh penggemar lalu basis data ini kemudian dimiliki dan dioperasikan oleh IMDB.com Inc., sebuah anak perusahaan dari Amazon. Hingga Oktober 2018, IMDb memiliki kira-kira 5,3 juta film/acara (termasuk episode masing-masing) dan 9.3 tokoh di basis data tersebut. IMDb juga memiliki 83 juta pengguna terdaftar.
Berdasarkan data-data yang tersedia pada website IMDb ini, kamu bisa untuk mengumpulkan data yang berhubungan dengan program TV, analisis sentimen pada ulasan rating film, analisis terkait film mana yang sering ditonton, dan lain sebagainya. Nah, data-data tersebut tentunya dapat disimpan dalam format yang konsisten di semua halaman sehingga membuat tugas menjadi lebih mudah.
Baca juga : Kenali Perbedaan Data Scientist, Data Analyst dan Data Engineer
2. Job Portals
Project selanjutnya yaitu Job Portals. Job Portals merupakan salah satu project data scraping yang bisa digunakan untuk studi kasus di bidang Human Resources. Adapun proses dari web scraping dalam job portals menghasilkan data berupa format yang terstruktur seperti CSV, JSON yang cocok digunakan dalam spreadsheets, database mauapun aplikasi software yang sesuai dengan tools pengolahan data yang diinginkan. Bot dipakai untuk mengeruk data-data yang ada di dalam halaman job portal dimana satu halaman website memiliki ratusan informasi yang bisa kita dapatkan. Nah, informasi ini bisa banget loh buat ladang kamu mendapatkan inspirasi dalam membuat project data analyst.
Adapun data-data yang bisa kamu dapatkan dalam job portal scraping antara lain:
Nama Pekerjaan atau Posisi yang dibuka pada Lowongan
Perusahaan
Lokasi Perusahaan
Tanggal Posting Lowongan
Deskripsi Pekerjaan
Tipe Pekerjaan (Full-Time, Freelance, Remote, Part-Time)
Range Gaji
Dari sini kamu juga bisa melakukan analisis berupa perkiraan gaji yang diterima dalam posisi yang berbeda walaupun dalam perusahaan yang sama. Selain itu, kamu juga bisa melakukan perkiraan gaji dalam posisi yang sama tetapi pada perusahaan yang berbeda. Hal ini dilakukan sebagai dasar perbandingan calon kandidat untuk take it or leave it ketika ingin mengambil penawaran kerja alias offering letter saat melamar kerja. Sebab, gaji merupakan salah satu pertimbangan yang alot dari kandidat saat melakukan taken kontrak sebelum akhirnya diterima.
3. Market Basket Analysis
Market basket analysis atau MBA adalah metode atau teknik analisis data untuk tujuan ritel dan pemasaran. Ide di balik analisis market basket analysis atau MBA telah muncul dari pelanggan yang membeli dan menambahkan produk yang berbeda ke keranjang belanja mereka atau di market basket analysis atau MBA. market basket analysis atau MBA dilakukan untuk memahami perilaku pembelian pelanggan. MBA (Analisis Bisnis Pasar) digunakan untuk mengungkap item apa yang sering dibawa bersama oleh pelanggan. market basket analysis atau MBA menghasilkan penjualan dan pemasaran yang efektif.
Jika pelanggan membeli produk tertentu, dia cenderung membeli beberapa barang terkait untuk melengkapi produk pertama. Misalnya, jika seorang pelanggan membeli roti maka dia cenderung membeli mentega, selai atau susu untuk melengkapi roti. market basket analysis atau MBA digunakan oleh pengecer sehingga mereka dapat membuat saran pembelian kepada pelanggan mereka. Hal ini juga digunakan untuk memprediksi keputusan pembelian masa depan pelanggan
Baca juga : Data Analyst vs Data Scientist, Yuk Kenali Perbedaannya
4. Reddit
Reddit adalah platform komunitas yang memiliki jangkauan forum terbesar di dunia. Secara garis besar, Reddit adalah website hiburan yang memberikan banyak informasi karena setiap member memiliki kesempatan untuk berkontribusi dalam memberikan teks atau pranala (link).
Situs ini dibagi menjadi beberapa bagian subjek yang disebut subreddits. Menavigasi bagian ini untuk menemukan informasi yang paling penting bagi kamu sering bertanggung jawab atas intimidasi yang paling banyak terjadi. Jumlah informasi sangat besar dan dapat membuat sangat sulit jika kamu tidak terbiasa dengan infrastruktur di dalamnya.
Yuk, bulatkan tekad kamu mulai berkarir atau switch karir di bidang data analyst sekarang juga. Nggak usah overthinking karena tidak memiliki background pendidikan yang linier dengan itu. Kamu bisa mulai bangun portfolio datamu yang outstanding dengan Modul Data Analyst Career Track bersama DQLab dan nikmati modul-modul dari dasar hingga tingkat mahir. Caranya dengan Sign Up sekarang untuk #MulaiBelajarData di DQLab:
Buat Akun Gratis dengan Signup di DQLab.id/signup
Pilih menu Learn
Pilih menu Career Track
Lalu Pilih menu Data Analyst
Yuk sama-sama kita bikin portfolio data bersama DQLab!
Penulis: Reyvan Maulid