Buat Akun DQLab & Akses Kelas Data Science Python, R, dan Excel GRATIS
 SIGN UP  

Tutorial Python Dasar Menggunakan Library untuk Data Science

Belajar Data Science di Rumah 26-Oktober-2021
https://dqlab.id/files/dqlab/cache/1536b5a45ee999e16dfcedb3ef5fec30_x_Thumbnail800.png

Python merupakan bahasa pemrograman yang sering digunakan untuk mengolah data dengan menerapkan data science. Data science banyak diterapkan perusahaan saat ini karena manfaatnya dalam mengolah data yang lebih efektif dan efisien. Data science menggabungkan ilmu matematika, statistik, dan pemrograman dalam proses pengolahan data. Metode yang diterapkan pun didasari oleh jenis data serta tujuan pengolahan data. Adapun keunggulan data science adalah bisa digunakan untuk mengolah Big Data. Big Data merupakan kumpulan data yang memiliki karakteristik jumlah data yang sangat banyak, jenis data yang beragam, serta terkumpul dalam waktu yang relatif singkat. 


Bahasa pemrograman Python digunakan karena fleksibilitasnya dan package atau library yang mendukung proses data science. Library tersebut biasanya sudah terpasang saat menginstall Python, namun ada juga library yang bisa ditambahkan lagi. Penulisan kode pada Python menggunakan bahasa yang mudah dipahami karena struktur bahasanya seperti mengobrol dengan mesin. Sehingga pengguna akan lebih fokus dalam membangun program. Belajar bahasa pemrograman Python tentu harus terus berlatih. Bagi pemula bisa mempelajari library yang sering digunakan terlebih dahulu, bisa dari blog, website, dan lainnya. Nah, artikel kali ini akan membahas tutorial Python dasar menggunakan library untuk data science. Yuk, simak pembahasannya dibawah ini! 


1. Pandas

Pandas adalah library yang sering digunakan untuk memproses data yang meliputi pembersihan data, manipulasi data, hingga melakukan analisis data. Pandas berfungsi mengakses data sumber yang akan digunakan untuk penelitian. Pandas dapat membaca format file csv, tsv, dan txt. Dengan library ini kita juga dapat melakukan proses seperti pada SQL seperti agregasi, join, group by, dan lain-lain. Sintaks ketika akan menggunakan Pandas pada Python yaitu seperti berikut.


import pandas as pd

nama_database = pd.read(data_sumber)


Perintah ini akan dibaca oleh Python untuk memanggil library Pandas. Inisial pd umum dipakai saat menggunakan library Pandas. 


Baca juga : Yuk Cari Tahu Perbedaan Python R dan SQL


2. Numpy

Numpy (Numerical Python) adalah library yang digunakan untuk melakukan komputasi data yang bertipe numerik. Numpy bisa memproses operasi vektor, matriks, dan juga operasi matematika atau statistik. Beberapa tipe data yang ada dalam Numpy yaitu boolean, integer, unsigned integer, dan float. Sintaks untuk menggunakan library Numpy sama dengan library lainnya yaitu import numpy as np. Penggunaan sebutan np umum digunakan ketika menggunakan Numpy. Kita juga bisa menggunakan Numpy untuk melakukan operasi sederhana dengan menggunakan simbol yaitu (+) untuk penjumlahan, (-) untuk pengurangan, (*) untuk perkalian, dan (/) untuk pembagian. Operasi lain seperti pangkat bisa dituliskan dengan dua bintang (**). Numpy juga menyediakan fungsi universal function (unfunc) untuk menjalankan operasi seperti sin dan cos. 


3. Matplotlib

Matplotlib merupakan library pada Python yang digunakan untuk melakukan visualisasi data menjadi menarik, biasanya menggunakan grafik atau plot yang sesuai dengan data yang dimiliki baik dalam bentuk 2D atau 3D. Dengan Matplotlib kita dapat mengatur ukuran, warna grafik, dan lain sebagainya sesuai keinginan agar data tersaji dengan menarik dan memperoleh informasi yang berguna bagi perusahaan maupun instansi. Sintaks untuk menggunakan library Matplotlib di Python yaitu import matplotlib.pyplot as plt. Inisial plt merupakan singkatan umum yang dipakai untuk menyebut matplotlib. Perlu diingat tidak semua bentuk grafik cocok untuk semua bentuk data. Misalnya kita ingin melihat trend pasar dalam kurun waktu tertentu akan lebih cocok jika menggunakan line chart. 



4. Scikit-Learn

Scikit-Learn adalah library yang dikembangkan oleh David Cournapeau pada tahun 2007 dan bersifat open source. Scikit-Learn menyediakan berbagai algoritma pembelajaran untuk regresi, pengelompokkan, dan klasifikasi. Library ini sangat baik dalam mendukung berbagai tipe machine learning seperti unsupervised learning dan supervised learning serta sempurna digunakan untuk analisis data dan data mining. Metode klasifikasi ini banyak digunakan perusahaan untuk mengembangkan bisnisnya berdasarkan data penjualan, preferensi konsumen saat membeli produk, dan lain sebagainya. Scikit-Learn dapat digunakan bersama dengan Numpy dan Scipy.


Baca juga : Mengenal Perbedaan R Python dan SQL


5. Belajar Skill Python untuk Berkarir di Bidang Data

Profesi Data Scientist dan Data Analyst menjadi profesi yang banyak dicari saat ini oleh berbagai perusahaan dengan kualifikasi yang berbeda-beda. Setiap perusahaan punya tools andalannya tersendiri seperti talent data harus menguasai Python, R, Excel, Tableau, dan lain sebagainya. Oleh karena itu jika ingin bekerja di bidang data, setidaknya harus memahami dasar pemrograman. Ini bisa kamu dapatkan salah satunya dengan mengikuti kursus data science. DQLab adalah lembaga kursus data science yang memberikan modul terstruktur dan di mentori oleh praktisi data senior sehingga mudah dipahami dan dipelajari. Kamu juga bisa menggali kemampuanmu dengan mengikuti data challenge dan mendapat feedback langsung dari mentor. Tunggu apa lagi? Yuk, daftarkan dirimu di DQLab.id!



Penulis: Dita Kurniasari

Editor: Annissa Widya



Postingan Terkait

Sign Up & Mulai Belajar Gratis di DQLab!