Buat Akun DQLab & Akses Kelas Data Science Python, R, dan Excel GRATIS
 SIGN UP  

Pahami Data Science dan Konsep Dasar Khusus untuk Pemula

Belajar Data Science di Rumah 03-Agustus-2021
https://dqlab.id/files/dqlab/cache/321822094a4c62b3eef3f4a10347fb5f_x_Thumbnail800.jpg

Data Science atau ilmu data merupakan ilmu terapan baru yang perkembangannya dituntut oleh meningkatnya penggunaan teknologi secara signifikan. Data Science digunakan oleh perusahaan maupun instansi tertentu untuk melakukan analisis data yang tidak bisa dilakukan dengan metode sederhana. Contohnya pada marketplace, yang memerlukan suatu pengetahuan yang dapat melakukan analisis data penjual dan pembeli di platform mereka. Dimana data yang mereka punyai setiap detiknya terus berubah atau bertambah. Sehingga diperlukan suatu metode komputasi untuk mengambil data tersebut serta melakukan perhitungan yang dapat menganalisis informasi pada data tersebut. Disinilah peran Data Science dalam pemenuhan kebutuhan suatu perusahaan atau instansi.

Lalu, apakah kamu tahu apa itu Data Science dan bagaimana konsep dasar dari ilmu ini? Nah, jika kamu tertarik mempelajari tentang Data Science, yuk, mulai dari dasar-dasarnya yang sudah DQLab rangkum dalam artikel ini!


1. Definisi Data Science

Menurut Urban Institute, Data Science merupakan keterampilan yang membutuhkan ilmu komputer, bahasa pemrograman, teknologi, dan statistik. Keterampilan ini mencakup teknologi dan teknik seperti memanfaatkan komputasi cloud, analisis Big Data, pemrosesan natural language, algoritma Unsupervised Learning seperti analisis cluster, web scraping, teknik Fuzzy, Machine Learning, dan lain sebagainya. 

Seorang Data Scientist bertanggung jawab dalam menganilisis dan menafsirkan kumpulan data yang kompleks. Mulai dari pengumpulan, mengolah, dan menganalisa data dalam jumlah besar. Data Scientist adalah orang yang bertugas mengolah data dari Data Engineer dan melihat apakah ada peluang bisnis baru dari data yang dikumpulkan.


Baca juga : Belajar Data Science Secara Otodidak? Berikut langkah-langkahnya!


2. Model Data Science

Data Science bekerja dengan menemukan pola yang sebelumnya tidak diketahui dalam data dengan menggunakan pembelajaran mesin (Machine Learning) untuk menghasilkan model representatif. Representative Model (model representatif) akan memberikan gambaran hubungan antar variabel yang ada dalam dalam dataset dengan kata lain hal ini menjelaskan bagaimana satu atau lebih variabel dalam data terkait variabel lain.

Dimana artinya Data Science juga merupakan proses membangun model representatif yang sesuai dengan data pengamatan. Model ini melayani dua tujuan: di satu sisi, ia memprediksi output berdasarkan pada data input baru serta model yang dapat digunakan untuk memahami hubungan antara variabel output dan semua variabel input.


3. Data Science Tasks

Klasifikasi beberapa task dalam Data Science digambarkan seperti diagram berikut ini:



Berikut adalah deskripsi singkat dari beberapa task Data Science pada gambar di atas:

  • Pada task Klasifikasi dan Regresi digunakan untuk memprediksi variabel target berdasarkan pada variabel input. Prediksi yang dibuat ini didasarkan pada model umum yang dibangun dari dataset yang diketahui sebelumnya.

  • Deep learning merupakan Artificial Neural Network yang bersifat sophisticated, penerapan Deep Learning ini telah banyak diterapkan untuk penyelesaian masalah Klasifikasi dan Regresi.

  • Clustering merupakan proses mengidentifikasi pengelompokan data yang dilakukan secara alami berdasarkan pada dataset yang tersedia. Pengelompokan ini didasarkan pada algoritma pembelajaran yang bersifat Unsupervised Learning.

  • Time Series Forecasting merupakan sebuah proses memprediksi sebuah nilai tertentu berdasarkan pada histori data masa lalu yang kemungkinan akan memberikan sebuah trend / pola tertentu yang sifatnya didasarkan pada waktu (tahunan, bulanan, mingguan atau harian).

  • Text Mining dikenal juga sebagai dengan nama analisis teks yang merupakan proses mengubah data teks yang tidak terstruktur menjadi informasi yang bermakna dan dapat ditindaklanjuti.

  • Feature Selection merupakan sebuah proses untuk menyeleksi atribut dalam sebuah dataset, sehingga diperoleh atribut-atribut yang sifatnya penting dan dapat memberikan ciri dari objek tertentu.


4. Tools yang Digunakan Oleh Para Data Scientist

Beberapa tools yang tersedia untuk para Data Scientist :

  • Data storage : MySQL, Oracle, SQL Server, HBase, MongoDB, and Redis

  • Data querying : SQL, Python, Java, and R

  • Data analysis : SAS, R, and Python

  • Data visualization : JavaScript, R, and Python

  • Data mining : Clojure, R, and Python

  • Cloud : Amazon AWS, Microsoft Azure, and Google Cloud

  • Hadoop Big Data : Spark, HDFS MapReduce (Java), Pig, Hive, and Sqoop


Baca juga : Mulai Belajar Data Science GRATIS bersama DQLab selama 1 Bulan Sekarang!

5. Ikuti Kelas Data Science Bersama DQLab!

Seorang Data Scientist sebaiknya memiliki pengetahuan yang cukup pada sebuah bidang ilmu pengetahuan atau industri. Jadi, mereka dapat melakukan identifikasi yang mendalam tentang bagaimana suatu permasalahan dapat diselesaikan menggunakan data. Nah, apakah sekarang pengetahuan kamu seputar data sudah makin bertambah? Atau justru kamu semakin penasaran dan ingin mempelajari lebih banyak lagi seputar Data Science?

Yuk, bangun proyek dan portofolio datamu bersama DQLab untuk mulai berkarir di industri masa kini! Sign up sekarang untuk mulai belajar data di DQLab dengan membuat akun GRATIS dengan di DQLab.id dan mulai dengan mengakses module Introduction to Data Science. Pelajari dan selesaikan modulenya, agar kamu mendapatkan sertifikat & reward menarik dari DQLab!


Penulis : Salsabila Miftah Rezkia

Editor : Annissa Widya

Sign Up & Mulai Belajar Gratis di DQLab!