RAMADHAN BERKAH!
Belajar Data 6 BULAN Bersertifikat hanya Rp120K!

0 Hari 1 Jam 52 Menit 14 Detik

Profesi Data Scientist, Kerjanya Apa Aja Sih?

Belajar Data Science di Rumah 27-Januari-2021
https://dqlab.id/files/dqlab/cache/0bff17e5259bbf1ef9489fda0628579c_x_Thumbnail800.jpg

Sepertinya profesi Data Scientist wajib kamu tambahkan sebagai wishlist kamu di tahun 2021. Mengapa ? Karena profesi data scientist diramalkan masih menjadi incaran di tahun 2021, bahkan dilansir dari World Economic Forum profesi ini menduduki posisi pertama dari 10 profesi paling dicari hingga tahun 2022. Diprediksi pertumbuhan profesi data scientist meningkat dari 16% menjadi 27% berdasarkan perusahaan besar global. Maka tak heran, jika rata-rata perusahaan berani menawarkan salary tinggi bagi mereka yang memiliki skill yang baik sebagai seorang Data Scientist. Oleh sebab itu, mungkin ada diantara kamu yang rela banting setir bahkan untuk memulai karir sebagai Data Scientist. Mengingat profesi ini merupakan profesi yang multidisiplin, sehingga memungkinkan kamu yang tidak memiliki background IT pun bisa berkarir sebagai Data Scientist dengan mengikuti pendidikan non formal semacam bootcamp atau semacamnya.


Seorang data scientist harus memiliki pemahaman konsep dasar data mining, kemampuan bahasa pemrograman, pemahaman algoritma machine learning, teknik memvisualisasikan data yang efektif, dan yang terpenting adalah harus memiliki rasa keingintahuan yang tinggi dan pantang menyerah, karena hal tersebut akan sangat dibutuhkan untuk menjalankan pekerjaan mereka di perusahaan. Oleh karena itu, artikel ini akan menemani kamu untuk memahami apa saja yang tugas yang dikerjakan profesi data scientist di perusahaan, simak terus artikel ini sampai selesai.


1. Menganalisa Data

Hal yang menjadi tugas utama seorang data scientist adalah melakukan analisis data dengan menggali pola tersembunyi dibalik sekumpulan data agar menghasilkan sebuah insight yang dapat bermanfaat bagi kelangsungan bisnis suatu perusahaan. Dalam perusahaan  seorang data scientist akan melakukan riset terhadap permasalahan  yang dihadapi terlebih agar dapat memahami gambaran masalah bisnis yang sedang dihadapi untuk menentukan tujuan dari analisis data ini untuk apa, apakah untuk klasifikasi, prediksi, klasterisasi, atau untuk asosiasi. Setelah itu data scientist akan mulai proses analisa data dengan melakukan query data dengan SQL atau jika perusahaan skala besar menggunakan Hadoop dan Hive untuk mengambil data yang besar. Adapun data yang akan digunakan bermacam-macam jenisnya ada yang numerik, text, gambar, video bahkan audio dan setiap jenis data tersebut proses pengolahannya pun berbeda-beda. Yang membedakan adalah pada tahap data preparation yang meliputi cleaning data, filtering data, transform, dan proses normalize. Selain itu agar terhindar dari missing value ataupun noisy ada pula cara untuk menangani missing value yaitu dengan menghilangkan sample yang memiliki banyak missing value, atau mengganti data yang hilang.


Baca juga : Mengenal Profesi Data Scientist


2. Membangun Pemodelan Machine Learning 

Tugas data scientist selanjutnya adalah membangun pemodelan yang optimal. Secara umum dataset yang siap pakai atau telah melalui proses preparation data akan dibagi menjadi 2 yaitu data training dan data testing. Hal ini dilakukan agar mod yang kita buat dapat menggeneralisasikan dengan baik data baru yang belum dilatih sehingga dapat memprediksi hasil yang akurat dari data baru tersebut. Selanjutnya kita dapat memilih model machine learning yang sesuai dengan tujuan kita, semisal dengan metode naive bayes. Dalam proses training selalu melibatkan inisialisasi beberapa nilai acak untuk setiap training matriks, dan mencoba untuk memprediksi output dari data yang diinput menggunakan nilai acak. Salah satu masalah terpenting dalam mempertimbangkan model training adalah memilih antara pengoptimalan atau generalisasi. Ada 2 cara untuk menghindari overfitting yaitu, menambah lebih banyak data, dan melakukan regulasi. Apabila model hanya dapat menghafal sebagian kecil pola, maka pengoptimalan akan membuatnya fokus pada data paling relevan, ini dapat meningkatkan peluang modul untuk menggeneralisasi dengan baik. Model yang baik adalah model yang dapat menjelaskan  data tanpa terpengaruh oleh data noise. Modell tidak akan fit terhadap tiap data point, namun mampu menjelaskan trend data. Model yang baik akan memiliki low coss dan akurasi yang tinggi.


3. Visualisasi Data

Hal yang akan akan sering dikerjakan seorang data scientist adalah visualisasi data. Ini merupakan goals dari rangkaian tugas dari data scientist, visualisasi data merupakan salah satu bentuk komunikasi. Untuk itu kamu harus paham kepada siapa pesan ini akan disampaikan. Sehingga kamu dapat menyesuaikan tampilan data yang akan kamu sajikan sesuai dengan audience yang membaca visualisasi data tersebut. Untuk itu diperlukan pertimbangan untuk pemilihan warna dan juga font, pastikan label terbaca, dan hindari penggunaan pie chart karena dapat membingungkan pembaca.


Baca juga : Yuk Kenal Role Data Scientist, Profesi Menarik Dengan Gaji Besar


4. Yuk, Belajar Data Science di DQLab Sekarang !!!

Tidak memiliki background IT? Jangan khawatir, kamu tetap bisa menguasai Ilmu Data Science untuk siap berkarir di revolusi industri 4.0. Bangun proyek dan portofolio datamu bersama DQLab untuk mulai berkarir di industri data yang sebenarnya! Sign up sekarang untuk #MulaiBelajarData di DQLab!

 

Penulis: Rian Tineges

Editor: Annissa Widya Davita


Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login