Library Python yang Digunakan Untuk Keperluan Data Science
Python adalah salah satu Bahasa pemrograman yang sangat populer di kalangan programmer. Python diciptakan oleh Guido van Rossum pada tahun 1991. Berbeda dengan Bahasa pemrograman lain seperti, C++ dan Java, Python dianggap lebih mudah dipelajari khususnya bagi pemula. Sintaks yang sederhana, mudah diingat, dan dibaca karena Python menekankan pada aspek kemudahan dalam membaca kodenya. Selain itu, Python juga dapat digunakan diberbagai sistem operasi seperti Windows, Mac OS, Linux, dan lain sebagainya.
Menariknya lagi, Bahasa pemrograman Python didukung oleh banyak library yang gratis. Apa yang dimaksud dengan library? Library pada Python merupakan sebutan untuk kode program tambahan yang digunakan dalam kebutuhan tertentu. Python mempunyai lebih dari 140.000 library yang dikembangkan melalui open source project sehingga kamu yang sebagai pemula, bisa belajar dengan gratis! Berikut ini tiga library yang wajib diketahui ketika kamu belajar Python!
1. Library NumPy
Library yang pertama ini merupakan singkatan dari Numerical Python. Fungsi dari modul ini untuk membantu para data scientist menangani permasalahan angka-angka. Berfokus pada scientific computing, NumPy memiliki kemampuan dalam membentuk objek N-dimensional array yang mirip dengan MATLAB. NumPy memudahkan penggunanya dalam operasi Aljabar Linear seperti Vektor dan Matriks.
Import numpy as np
#menghasilkan a 3 by 3 identity matrix
matrix_one = np.eye(3)
matrix_one
#menghasilkan 3 by 3 matrix lainya for perkalian
matrix_two = np.arange(1,10).reshape(3,3)
matrix_two
#mengalikan dua array
matrix_multiply = np.dot(matrix_one, matrix_two)
matrix_multiply
Baca juga : Belajar Data Science: Kenali Dasar Bahasa Pemrograman Python yang Cocok bagi Pemula
2. Library Pandas
Pandas adalah library kedua yang wajib dipelajari pemula dalam belajar Python. Dengan berdasarkan sistem dataframe, modul ini dapat memuat sebuah file ke dalam tabel virtual menyerupai spreadsheet. Pandas juga berfungsi mengolah suatu data seperti teknik join, distinct, group by, agregasi, dan teknik lainnya seperti pada SQL. Bedanya, ini dilakukan pada tabel. Kelebihan dari library ini juga dapat membaca file dari berbagai format seperti .txt, .csv, dan .tsv. Contoh penggunaan library Pandas seperti berikut,
import pandas as pd
d={'Name':pd.Series(['Alfrick','Michael','Wendy','Paul','Dusan','George','Andreas','Irene','Sagar','Simon','James','Rose']),'Years of Experience':pd.Series([5,9,1,4,3,4,7,9,6,8,3,1]),'Programming Language':pd.Series(['Python','JavaScript','PHP','C++','Java','Scala','React','Ruby','Angular','PHP','Python','JavaScript'])}
Selanjutnya membuat Dataframe,
df = pd.DataFrame(d)
Sehingga output yang dihasilkan seperti berikut
Name Programming Language Years of Experience
0 Alfrick Python 5
1 Michael JavaScript 9
2 Wendy PHP 1
3 Paul C++ 4
4 Dusan Java 3
5 George Scala 4
6 Andreas React 7
7 Irene Ruby 9
8 Sagar Angular 6
9 Simon PHP 8
10 James Python 3
11 Rose JavaScript 1
3. Library Matplotlib
Data yang telah diolah akan sebaiknya ditampilkan sejelas dan sebagus mungkin. Library Matplotlib ini akan membantu dalam menampilkan hasil analisis berupa grafik berwarna dengan lebih rapi dan menarik. Ada dua jenis plot dalam menampilkan data yaitu secara 2D dan 3D. Sehingga data bisa ditampilkan sesuai dengan kebutuhan. Matplotlib ini merupakan library yang paling sering digunakan oleh data science dalam menyajikan datanya ke dalam visual yang lebih menarik.
import matplotlib.pyplot as plt
plt.plot([1,2,3,4])
plt.ylabel('some numbers')
plt.show()
Baca juga : Python : Kenali 3 Buku yang Akan Mempercepat Kamu Dalam Belajar Python
4. Yuk Mulai Belajar Menjadi Data Scientist Bersama DQLab!
Gunakan Kode Voucher "DQTRIAL", dan simak informasi di bawah ini mendapatkan 30 Hari FREE TRIAL:
Buat Akun Gratis dengan Signup di DQLab.id/signup
Buka academy.dqlab.id dan pilih menu redeem voucher
Redeem voucher "DQTRIAL" dan check menu my profile untuk melihat masa subscription yang sudah terakumulasi.
Selamat, akun kamu sudah terupgrade, dan kamu bisa mulai Belajar Data Science GRATIS 1 bulan.
Penulis : Salsabila Miftah
Editor : Annissa Widya Davita