Kenali Fundamental Query Ini Ketika Belajar Data Analyst SQL
Besarnya peluang praktisi data untuk terjun di industri data membuat profesi data analyst kian diminati. Dikonfirmasi oleh IBM, bahwa akan terjadi perekrutan baru sebanyak 700.000 pada tahun 2020. Dengan adanya peluang tersebut, tentunya sahabat data perlu pemahaman konsep seputar skill yang harus dipelajari. Salah satu skill yang perlu ditekuni oleh data analyst adalah kemampuan belajar data analyst dengan SQL. SQL (Structured Query Language) adalah bahasa pemrograman yang dirancang untuk mengelola data dalam basis data relasional dan merupakan metode yang paling umum untuk mengakses data dalam database saat ini. SQL memiliki beragam fungsi yang memungkinkan penggunanya untuk membaca, memanipulasi, dan mengubah data.
Untuk menjadi seorang Data Analyst, memahami serta memiliki pengalaman dalam belajar data analyst SQL adalah hal yang wajib. Dengan SQL memungkinkan data analyst untuk bisa membaca dan mentransformasi data untuk kemudian diproses menjadi sebuah insight. Tentunya, akan memudahkan pengguna dalam pengambilan keputusan bisnis. Pada penggunaan bahasa pemrograman SQL, terdapat beberapa perintah statement dasar yang harus kalian ketahui yakni SELECT, GROUP BY, HAVING, INNER JOIN dan UNION. Semua perintah ini tentunya dipakai oleh data analyst untuk mempermudah pekerjaannya. Lalu apa perbedaannya? Kali ini, DQLab akan membahas seputar fundamental query ketika sahabat data akan belajar SQL. Pastikan sahabat data disimak baik-baik ya!
1.Using SELECT Statement
Dalam mengakses data pada database, kita dapat menggunakan SELECT statement. Pada SELECT statement kita menyatakan kolom - kolom mana saja yang ingin kita tampilkan dari suatu tabel di database. SELECT statement tidak berdiri sendiri. Setelah menyatakan kolom - kolom yang ingin ditampilkan, kita melanjutkan dengan FROM. Di FROM inilah kita menyatakan dari tabel mana data yang ingin kita tampilkan berada. SELECT¦ FROM¦ adalah statement paling sederhana di SQL, dan merupakan bagian utama dari query. Kita tidak bisa meng-query data tanpa menggunakan statement ini. Berikut adalah query yang bisa digunakan untuk melakukan perintah SELECT untuk menampilkan seluruh kolom:
SELECT * FROM ms_produk;
Keterangan:
Kata awal, yaitu SELECT digunakan untuk menginformasikan kepada sistem bahwa kita ingin mengambil data.
Tanda * (bintang) artinya seluruh kolom perlu diambil dari tabel yang dirujuk. Tanda ini sering juga disebut sebagai wildcard.
FROM [NAMA_TABLE], artinya table yang akan diambil datanya.
Tanda ; (titik koma) adalah tanda yang menyatakan akhir dari perintah SELECT atau SQL lain.
Baca juga : Data Science: Belajar Analisa Data
2.Using Function, Group By and Having
Selanjutnya, perintah statement dasar yang biasanya digunakan adalah function, group by dan having. Penggunaan function pada bahasa pemrograman SQL akan memunculkan fungsi matematika yang umum digunakan seperti sqrt (menampilkan nilai akar kuadrat), exp(nilai eksponensial), round(hasil pembulatan) dan masih banyak lagi lainnya. Sebagai tambahan informasi bagi sahabat data, untuk mengenal fungsi SQL lebih banyak lagi tinggal membuka laman postgresql.org dan mencari functions math yang disediakan. Kemudian fungsi aggregate juga digunakan dalam bahasa pemrograman SQL. Fungsi aggregate ini digunakan untuk melakukan perhitungan pada sekelompok nilai. Misalnya penggunaan SUM untuk menjumlahkan sekelompok nilai dalam satu kolom. Kemudian count untuk menghitung jumlah baris, max untuk nilai maksimum dan min untuk nilai minimum.
Untuk mengelompokkan data di SQL kita menggunakan GROUP BY Statement. GROUP BY statement akan mengelompokkan data yang bernilai sama ke dalam satu group, dan dengan menggunakan fungsi aggregate seperti (COUNT, MAX, MIN, SUM, AVG) kita bisa melakukan agregasi untuk untuk setiap group atau kelompok yang terbentuk. Group by bisa dilakukan dengan single column ataupun multiple column. Group by Single Column, data dikelompokkan menggunakan kriteria dari satu kolom saja, misalnya mengelompokkan data berdasarkan provinsi saja. Group by Multiple Column, data dikelompokkan menggunakan kriteria dari dua kolom atau lebih, misalnya mengelompokkan data berdasarkan province dan brand. Terakhir yaitu HAVING digunakan untuk menggantikan WHERE ketika menggunakan Group BY yang datanya di aggregasi. Secara umum HAVING digunakan setelah melakukan GROUP BY berikut sintaks yang digunakan:
SELECT nama_kolom
FROM nama_table
GROUP BY nama_kolom
HAVING kondisi
Baca juga : Ingin Menjadi Data Analyst? Yuk, Simak 3 Tipsnya dari Senior Praktisi Data Langsung
3.Using Inner Join dan Union
Jika masing-masing tabel tersebut dianalogikan sebagai dua himpunan maka proses Inner Join ekivalen dengan Intersection (Irisan) antara dua himpunan. Proses Inner Join memiliki konsep penggabungan untuk records pada kedua tabel yang bernilai sama. Query yang digunakan yaitu Select* (penanda wildcard) untuk mengambil keseluruhan isi kolom dari sebuah tabel yang digunakan dalam proses Inner Join. Kemudian, From tabel_1 yang merupakan tabel pertama yang akan di-Inner Join-kan. Inner Join tabel_2 yaitu tabel kedua yang akan di-Inner Join-kan dan ON tabel_1.nama_kolom yakni kolom pada tabel pertama yang memiliki relasi dengan kolom pada tabel kedua = tabel_2.nama_kolom; yakni tanda untuk mencocokkan kolom yang akan di-Inner Join-kan.
Pada metode JOIN, penggabungan dilakukan berdasarkan key/kolom tertentu yang terdapat di tabel-tabel yang akan digabungkan dan key/kolom ini memiliki nilai yang saling terkait. Proses JOIN tidak dapat dilakukan jika tidak terdapat key/kolom yang saling terkait di kedua atau lebih tabel yang akan digabungkan. Sedangkan UNION digunakan ketika ingin menggabungkan tabel secara secara vertikal yaitu menggabungkan baris/row dari dua atau lebih tabel. Tidak seperti JOIN, untuk penggabungan dengan UNION, tidak diperlukan key/kolom yang saling terkait tetapi UNION mensyaratkan bahwa jumlah kolom dari tabel ” tabel yang akan digabungkankan adalah sama dan berada diposisi yang sama pula
4.Yuk Mulai Belajar Data Science Sekarang!
Tidak memiliki background IT? Jangan khawatir, kamu tetap bisa menguasai Ilmu Data Science untuk siap berkarir di revolusi industri 4.0. Bangun proyek dan portofolio datamu bersama DQLab untuk mulai berkarir di industri data yang sebenarnya! Sign up sekarang untuk #MulaiBelajarData di DQLab!
Simak informasi di bawah ini untuk mengakses gratis module "Introduction to Data Science":
1.Buat Akun Gratis dengan Signup di DQLab.id/signup
2.Akses module Introduction to Data Science
3.Selesaikan modulenya, dapatkan sertifikat & reward menarik dari DQLab
4.Subscribe DQLab.id untuk Akses Semua Module Premium!
Penulis: Reyvan Maulid Pradistya
Editor : Annissa Widya
Mulai Karier
sebagai Praktisi
Data Bersama
DQLab
Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Daftar Gratis & Mulai Belajar
Mulai perjalanan karier datamu bersama DQLab
Sudah punya akun? Kamu bisa Sign in disini
