PROMO PUNCAK LEBARAN DISKON 99%
Belajar Data Science 6 Bulan BERSERTIFIKAT hanya Rp 99K!

1 Hari 7 Jam 5 Menit 35 Detik

Seperti Apa Tugas Utama Seorang Data Scientist?

Belajar Data Science di Rumah 01-November-2022
https://dqlab.id/files/dqlab/cache/ab2784b82cda2f15738512de2e3a57e8_x_Thumbnail800.jpg

Data Scientist adalah profesi dimana tugas utamanya mengolah data. Organisasi, Pemerintah maupun Perusahaan merekrut Data Scientist untuk mengubah data menjadi informasi yang akurat, lalu diubah menjadi pengetahuan, hingga pada akhirnya pengetahuan tersebut yang digunakan dalam mengambil keputusan, melakukan perencanaan, evaluasi dan seterusnya.


Data Scientist pun masuk dalam daftar 50 pekerjaan terbaik di Amerika tahun 2022 menurut Glassdoor. Tak hanya itu, Data Scientist juga masuk sebagai 25 pekerjaan dengan upah tertinggi menurut sumber yang sama. Bagaimana kondisi di Indonesia?.


Jika menggunakan hasil survei HRDBacot, gaji seorang Data Scientist Menempati posisi ketiga sebagai bidang pekerjaan dengan total gaji tertinggi, dengan rata-rata 9 juta/bulan. Gaji tertinggi ada pada angka 13,1 juta dan terendahnya 6,7 juta.


Mungkin muncul pertanyaan? Apa sih yang sebenarnya Data Scientist kerjakan?


Nah pada artikel ini, kita akan bahas tugas-tugas Data Scientist. Simak hingga selesai ya.


1. Membersihkan Data


Photo by JESHOOTS.COM on Unsplash


Jika sahabat DQ membayangkan seorang Data Scientist menghabiskan waktu untuk mengembangkan model machine learning, maka itu adalah hal yang salah. Menurut salah satu diskusi di Kaggle, Data Scientist menghabiskan kurang lebih 50% dari waktu yang dimiliki untuk membersihkan data. 50% sisanya kemudian dibagi-bagi oleh tugas-tugas yang lain. Seperti mengidentifikasi masalah, visualisasi, hingga modelling.


Membersihkan data juga menjadi tugas yang berat. Mengapa? Karena pada dasarnya tidak ada urutan baku atau standar untuk masalah membersihkan data. Bisa saja hari ini, Data Scientist membersihkan data dengan cara A, namun kesempatan lain cara A ini tidak dapat diterapkan di tugas membersihkan data yang lain.


Membersihkan data disini termasuk:

  • Menghilangkan data duplikat;

  • Memperbaiki format. Misal pada kolom jenis kelamin terdapat nilai “Mahasiswa”.

  • Memperbaiki nilai yang tidak tepat. Misal pada kolom umur, terdapat nilai 1000 tahun. Meskipun secara komputasi umur 1000 tetap bisa diolah, tapi sudah jelas ini adalah kesalahan yang perlu diperbaiki. Apa sahabat DQ kenal manusia yang masih hidup berumur 1000 tahun?


Baca juga : Mengenal Profesi Data Scientist



2. Mengeksplorasi Data

Sumber: The [i] Factory


Data Scientist juga bertugas untuk mengeksplorasi data terlebih dahulu sebelum diolah lebih lanjut. Secara tidak langsung, mengeksplorasi data berhubungan dengan membersihkan data. Melalui eksplorasi data, kita bisa melihat pola maupun kejanggalan data. Eksplorasi data pun membantu kita mengambil keputusan, seperti grafik visualisasi yang sesuai, atau model mana yang cocok berdasarkan data tersebut.


Berikut beberapa hal yang biasa dilakukan dalam mengeksplorasi data:

  • Mengecek jumlah baris dan kolom

  • mengecek nama variabel

  • mengecek tipe data

  • Visualisasi sederhana, seperti boxplot untuk melihat data outlier.


3. Visualisasi Data

Photo by Campaign Creators on Unsplash


Tugas selanjutnya yang dikerjakan oleh Data Scientist adalah visualisasi data. Mulai dari dari memilih tools yang akan digunakan, jenis grafik, pewarnaan, tata letak dan hal-hal terkait lainnya. Hasil dari visualisasi ini yang menjadi “jembatan” untuk menyampaikan apa yang Data Scientist dapatkan dari data ke orang lain. Misal ke pimpinan, atasan langsung, atau masyarakat umum sekalipun.


Banyak grafik yang dibuat, tentunya bergantung dengan kebutuhan dan data yang ada. Kadang-kadang cukup membuat satu grafik. Di Kesempatan lain, perlu membuat beberapa grafik hingga dijadikan infografis atau bahkan dashboard. Seorang data scientist dituntut untuk mampu mengetahui fungsi dari grafik-grafik yang ada. Agar pesan yang ingin disampaikan bisa diterima dengan mudah.








4. Pemodelan Data 

Photo by Markus Spiske on Unsplash


Tugas membuat pemodelan data inilah yang membuat Data Scientist istimewa.  Pemodelan data adalah proses mencari hubungan berbagai elemen data berbeda untuk mengetahui informasi yang dibutuhkan. Melalui model, Data Scientist dapat mengetahui keterkaitan atau hubungan antar variabel data.


Anggap sebuah perusahaan memiliki data pelanggan dan riwayat pembelian. Data ini kemudian dilakukan pemodelan, hingga mendapatkan beberapa informasi. Misal:

  • Segmentasi pelanggan, yakni pengelompokkan pelanggan berdasarkan perilaku belanja. Melalui model segmentasi ini, Data Scientist mampu mendapatkan mana pelanggan yang memiliki riwayat belanja yang sebaik, sehingga harus dipertahankan. Juga mana pelanggan yang ingin berhenti melakukan pembelian sehingga perlu untuk diberikan perlakuan tertentu agar tetap menjadi pelanggan.

  • Hubungan antar variabel, misal mendapatkan jika terdapat hubungan antara jumlah pembelian dengan hari libur tertentu. Sehingga sumber daya perusahaan bisa diarahkan di hari libur tersebut untuk mendapatkan penjualan sebanyak-banyaknya.


Baca juga : Yuk Kenal Role Data Scientist, Profesi Menarik Dengan Gaji Besar


5. Waktunya Sahabat DQ menjadi Data Scientist yang Handal

Photo by Campaign Creators on Unsplash


Walaupun terkesan Data Scientist punya tugas yang berat. Namun sahabat DQ tidak perlu ragu dan berkecil hati jika memiliki impian berkarir sebagai Data Scientist.


Materi-materi yang DQLab didesain agar bisa dipahami oleh pemula, bahkan latar IT sekaligus. Tanpa perlu menginstall aplikasi tambahan, cukup dengan browser kesayangan. Sahabat DQ sudah bisa merasakan bagaimana mengolah data ala Data Scientist.


Tunggu apa lagi? Yuk, Sign Up di DQLab.id sekarang!


Penulis: Ashari Ramadhan


Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login