PROMO PUNCAK LEBARAN DISKON 99%
Belajar Data Science 6 Bulan BERSERTIFIKAT hanya Rp 99K!

1 Hari 6 Jam 4 Menit 2 Detik

Kenali Jenis Group By SQL Sebelum Mengolah Data

Belajar Data Science di Rumah 19-Januari-2023
https://dqlab.id/files/dqlab/cache/7ed01d5cf64edda035472793c88a0591_x_Thumbnail800.jpeg

GROUP BY adalah salah satu statement SQL yang paling banyak digunakan di berbagai project. Statement GROUP BY digunakan untuk menemukan matriks utama seperti average, nilai max dan min, dan lain sebagainya dalam data yang telah dikelompokkan berdasarkan variabel tertentu. Jika kita menghitung dasar statistik seperti sum, average, max, min, dan lain sebagainya tanpa GROUP BY, hasil yang kita peroleh akan berorientasi pada record sedangkan ketika kita menggunakan statement GROUP BY, maka hasil yang kita peroleh adalah matriks yang kita butuhkan berdasarkan kelompok tertentu. 


Apakah pengelompokan data ini hanya bisa dilakukan berdasarkan satu variabel saja? Jawabannya adalah TIDAK. Kita bisa menggunakan beberapa variabel sekaligus untuk mengelompokkan data dan kemudian menghitung matriks yang kita butuhkan. Pada artikel kali ini kita akan membahas cara menggunakan GROUP BY pada SQL. jadi, pastikan kamu menyimak artikel ini sampai akhir, ya!


1. Pengenalan GROUP BY

Untuk mengelompokkan data di SQL kita menggunakan GROUP BY Statement. GROUP BY statement akan mengelompokkan data yang bernilai sama ke dalam satu group, dan dengan menggunakan fungsi aggregate seperti COUNT, MAX, MIN, SUM, dan AVG kita bisa melakukan agregasi untuk untuk setiap group atau kelompok yang terbentuk. Agar lebih jelas, yuk pelajari penulisan syntax-nya.

SQL

Hal penting yang perlu diperhatikan adalah: 

  • GROUP BY digunakan dengan SELECT, artinya kolom yang digunakan di GROUP BY statement, juga perlu ditempatkan di SELECT.

  • GROUP BY ditempatkan setelah WHERE, tetapi jika tidak menggunakan WHERE maka langsung ditempatkan setelah FROM. 

  • Jika menggunakan ORDER BY, maka GROUP BY ditempatkan sebelum ORDER BY. 


Baca juga : Saatnya Belajar SQL, Kenali Rekomendasi Query SQL Bagi Pemula


2. Pengenalan Data

GROUP BY statement dibagi menjadi dua, yaitu GROUP BY single column dan GROUP BY multiple column. Pada artikel kali ini, kita akan membahas kedua statement tersebut dan cara menggunakannya. Data dummy yang akan kita gunakan adalah tabel penjualan bernama sales_retail_2019 yang berisi kolom province, brand, order_id, dan item_price seperti di bawah ini.


SQL

3. GROUP BY Single Column

Fungsi GROUP BY single column memastikan data dapat dikelompokkan menggunakan kriteria dari satu kolom saja, misalnya mengelompokkan data berdasarkan provinsi saja. Sintaks yang digunakan sebagai berikut.


SQL


4. GROUP BY Multiple Column

Dengan fungsi GROUP BY Multiple Column, data dapat dikelompokkan menggunakan kriteria dari dua kolom atau lebih, misalnya mengelompokkan data berdasarkan province dan brand. Berikut adalah sintaks yang bisa kita gunakan untuk mengelompokkan data pada poin satu.


SQL


Baca juga : Catat! Ini 3 Keuntungan Belajar SQL dalam Mengolah Data


Selain group by, ada statement SQL lain yang perlu dipelajari. SQL adalah salah satu tools yang harus dikuasai oleh praktisi data science. Selain itu, mereka juga memerlukan bahasa pemrograman seperti R dan Python untuk mengolah data berukuran besar. 


Yuk asah kemampuan data science kamu bersama DQLab! Klik button di bawah ini atau sign up melalui DQLab.id untuk mengakses FREE MODUL ‘Introduction to Data Science’ dengan bahasa pemrograman R atau Python. Selesaikan modulnya dan dapatkan sertifikat compliance kamu sebagai modal membangun portfolio data.


Penulis: Galuh Nurvinda K



Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login