Data Science Adalah: Yuk Kenali Lebih Jauh Tentang Data Science!

Data Science Adalah: Yuk Kenali Lebih Jauh Tentang Data Science!

Belajar Data Science di Rumah 26-Oktober-2020
https://dqlab.id/files/dqlab/cache/46784dc65e23188309e781ab269cd845_100_persen.jpg

Data science adalah topik diskusi yang sangat luas dan subyektif. Data science bukan sebuah bidang yang berdiri sendiri. Bidang ini merupakan kombinasi dari berbagai bidang termasuk Ilmu Komputer, Matematika, Statistik, dan Strategi Bisnis. Tiga komponen yang terlibat dalam data science adalah organising, packaging, dan delivering data (the OPD of data). Organising data adalah proses penyimpanan data yang digabungkan dengan manajemen data. Packaging data merupakan proses manipulasi dan penggabungan data mentah yang akan direpresentasikan. Delivering data merupakan proses untuk memastikan bahwa pesan data telah diakses oleh mereka yang memerlukannya. Menurut research tahun 2011, pada tahun 2020 dunia akan menghasilkan 50 kali lipat data dibandingkan tahun 2011. Jadi dengan peningkatan aliran data yang drastis tersebut, akan muncul alat-alat baru yang dapat digunakan untuk memanfaatkan data mentah dengan tepat. Data science mencakup semua alat, teknik, dan teknologi yang akan membantu kita menangani peningkatan aliran data tersebut. Data science merupakan perpaduan interdisipliner dari penurunan data, pengembangan algoritma, dan teknologi untuk memecahkan masalah analitik yang kompleks.


Data science telah banyak dibicarakan di berbagai kegiatan baik diskusi kelompok, seminar, pelatihan, dan acara lain. Namun apakah Kamu tahu apa itu data science sebenarnya? apa yang dilakukan oleh data science? dan apa contoh nyatanya? Kali ini DQLab akan menjawab pertanyaan tersebut. Penasaran? baca artikelnya sampai selesai ya!


1. Apa itu Data Science?

Menurut Urban Institute, data science merupakan keterampilan yang membutuhkan ilmu komputer, pemrograman, teknologi, dan statistik yang berada di luar rangkaian pelatihan standar bagi peneliti ilmu sosial. Keterampilan ini mencakup teknologi dan teknik seperti memanfaatkan komputasi cloud, analisis big data, pemrosesan natural language, pembelajaran tanpa pengawasan (unsupervised learning) seperti analisis cluster, Web Scraping, teknik fuzzy, machine learning, dan lain sebagainya. 


Data science dapat membantu peneliti agar dapat bekerja lebih efektif untuk menghasilkan informasi baru yang tepat waktu, menjelajahi kumpulan data yang benar-benar baru dengan cara baru, mengubah pemodelan simulasi, dan lain sebagainya dengan tujuan untuk meningkatkan kuantitas dan kualitas bukti yang diperlukan untuk membuat kebijakan yang lebih baik, memperkuat komunitas, dan meningkatkan kehidupan masyarakat. 


Seseorang yang memahami data science disebut data scientist. Seorang data scientist tidak harus memahami semua kemampuan yang dibutuhkan karena biasanya data scientist bekerja pada tim yang memiliki kemampuan dan keterampilan yang berbeda-beda sehingga dapat saling melengkapi. Secara umum, keterampilan dasar terpenting untuk data scientist adalah kemampuan untuk membuat kode dalam setidaknya dua bahasa pemrograman yaitu Python dan R. Keterampilan umum lain yang diperlukan oleh seorang data scientist adalah keterampilan organisasi yang baik, komunikasi yang jelas, dan kemampuan untuk menguasai konsep dan teknik baru dengan cepat.


Baca Juga : Berkenalan dengan Data Scientist, Salah Satu Pekerjaan yang Sedang Naik Daun di Era Industri 4.0


2. Alat untuk Data Science

Setelah memahami pengertian data science, kita wajib memahami alat yang umum digunakan dalam data science. Alat tersebut antara lain big data, machine learning, data mining, deep learning, dan artificial intelligence. Kali ini kita akan membahasnya satu persatu. Alat pertama yang akan kita bahas adalah big data. Dengan menggunakan big data, data scientist dapat membantu perusahaan untuk memprediksi produk apa yang akan dijual, membantu perusahaan telekomunikasi untuk memprediksi kapan dan mengapa pelanggan mengganti operator, dan membantu perusahaan asuransi mobil untuk memahami seberapa baik pelanggan mereka mengemudi, memprediksi penyebaran dan lain sebagainya. Alat yang kedua adalah machine learning. Machine learning bersifat interdisipliner dan menggunakan teknik dari bidang ilmu komputer, statistik, dan artificial intelligence. Komponen utama machine learning adalah algoritma yang dapat belajar secara otomatis dari pengalaman untuk memperbaiki kinerjanya. Algoritma ini dapat diterapkan di berbagai bidang. Alat selanjutnya adalah data mining. Data mining adalah penerapan algoritma khusus untuk mengekstraksi pola pada sebuah kumpulan data.

Data mining berhubungan erat dengan machine learning. Data mining adalah sebuah proses yang menggunakan algoritma machine learning untuk mengekstrak pola-pola informatif yang disimpan dalam kumpulan data. Alat berikutnya adalah deep learning. Deep learning adalah istilah yang relatif baru yang sedang banyak dibicarakan belakangan ini. Deep learning adalah proses penerapan teknologi deep neural network. Deep neural network adalah arsitektur jaringan saraf dengan beberapa lapisan tersembunyi untuk memecahkan masalah. Alat terakhir untuk data science adalah artificial intelligence. Artificial intelligence atau biasa disebut AI adalah bidang ilmu komputer yang menekankan pada penciptaan mesin cerdas yang bekerja dan bereaksi seperti manusia. Komponen inti dari artificial intelligence adalah pemrograman komputer untuk sifat-sifat tertentu seperti pengetahuan, penalaran, pemecahan masalah, persepsi, pembelajaran, perencanaan, dan lain sebagainya.


3. Contoh Penerapan Data Science

Setelah memahami definisi dan alat yang digunakan dalam data science, saatnya kita pelajari lebih jauh mengenai data science. Data science dapat diterapkan di semua bidang mulai dari bidang jurnalisme, sosial, finansial, dan lain sebagainya. Penerapan data science di dunia nyata yang pertama adalah menggunakan pemrosesan natural language dan machine learning pada artikel berita untuk mengidentifikasi reformasi zonasi. Data scientist di Pusat Kebijakan Perumahan dan Komunitas Metropolitan Urban ingin memperkirakan dampak reformasi zonasi pada pasokan perumahan di sejumlah wilayah metropolitan di Amerika Serikat. Data scientist tidak mungkin mendapatkan data historis dari ribuan kotamadya di area metro ini sehingga mereka menggunakan data dari lebih dari 2.000 sumber berita lokal untuk mengidentifikasi reformasi lokal. Dengan menerapkan pemrosesan natural language dan machine learning, mereka dapat menandai artikel yang menyebutkan reformasi besar dan menambahkan metadata yang relevan seperti apakah artikel tersebut menyebutkan parkir, batas ketinggian, atau karakteristik lainnya. Dengan menggunakan metode ini, data scientist dapat mengumpulkan kumpulan data berdasarkan jenisnya. 


Penerapan lainnya adalah menyalin catatan pengadilan untuk menginformasikan kebijakan pemeriksaan latar belakang kriminal. Para data scientist di Pusat Kebijakan Kehakiman ingin membuat perkiraan jumlah orang di Washington DC yang mungkin memiliki catatan kriminal. Tim data scientist bekerja sama dengan tim researcher untuk mengumpulkan data dari alat penelusuran online Pengadilan Tinggi Washington yang digunakan oleh para data scientist untuk  membuat statistik mengenai latar belakang kriminal masyarakat di Washington DC.


Baca Juga : Data Scientist VS Data Analyst: Intip Apa Saja Perbedaannya Agar Tidak Salah Kaprah!


4. Tertarik? Yuk, Belajar Data Science Gratis sekarang!!

Terapkan ilmunya sekarang dengan bergabung bersama platform belajar online DQLab! Selain bisa meningkatkan ilmu data yang dimiliki, kamu juga bisa membangun portofolio datamu di DQLab guna mempersiapkan dirimu berkarir di industri data. 

Sign Up untuk menikmati module GRATIS “Introduction to Data Science” dengan pengalaman belajar yang seru menyenangkan serta aplikatif pada industri nyata! Untuk kamu yang ingin mulai belajar Data Science atau siap berkarir jadi Data Analyst, Data Scientist, dan Data Engineer, persiapkan diri kamu dengan tepat sekarang. Tidak ada kata terlambat untuk belajar. Yuk #MulaiBelajarData di DQLab.

Dengan belajar di DQLab, kamu bisa:

  • Menerapkan teknik mengolah data kotor, hasilkan visualisasi data dan model prediksi dengan studi kasus Retail dan Finansial

  • Dapatkan sesi konsultasi langsung dengan praktisi data lewat data mentoring

  • Bangun portofolio data langsung dari praktisi data Industri

  • Akses Forum DQLab untuk berdiskusi.

Simak informasi di bawah ini untuk mengakses gratis module ‘Introduction to Data Science’:

  1. Buat Akun Gratis dengan Signup di DQLab.id/signup

  2. Akses module Introduction to Data Science

  3. Selesaikan modulenya, dapatkan sertifikat & reward menarik dari DQLab


Penulis: Galuh Nurvinda Kurniawati

Editor: Annissa Widya Davita


Share

Postingan Terkait

Mulai Bangun Karirmu Bersama DQLab!