Cara-Cara Menggunakan Group By pada SQL

Group By merupakan salah satu statement SQL yang hampir selalu digunakan di berbagai project yang memerlukan penggabungan beberapa tabel. Statement group by digunakan untuk menemukan matriks utama seperti average, nilai max dan min, dan lain sebagainya dalam data yang telah dikelompokkan berdasarkan variabel tertentu.
Jika kita menghitung dasar statistik seperti sum, average, max, min, dan lain sebagainya tanpa group by, hasil yang kita peroleh akan berorientasi pada record sedangkan ketika kita menggunakan statement group by, maka hasil yang kita peroleh adalah matriks yang kita butuhkan berdasarkan kelompok tertentu.
Apakah pengelompokan data ini hanya bisa dilakukan berdasarkan satu variabel saja? Jawabannya adalah TIDAK. Kita bisa menggunakan beberapa variabel sekaligus untuk mengelompokkan data dan kemudian menghitung matriks yang kita butuhkan.
Pada artikel kali ini kita akan membahas cara menggunakan group by pada SQL. jadi, pastikan kamu menyimak artikel ini sampai akhir, ya!
1. Apa Itu Group By?
Untuk mengelompokkan data di SQL kita menggunakan group by Statement. Group by statement akan mengelompokkan data yang bernilai sama ke dalam satu kelompok, dan dengan menggunakan fungsi aggregate seperti COUNT, MAX, MIN, SUM, dan AVG kita bisa melakukan agregasi untuk untuk setiap kelompok yang terbentuk.
Berikut adalah sintaks umum saat menggunakan group by.
Gabungan group by dan statement lain dapat dilakukan sebagai berikut:
GROUP BY digunakan dengan SELECT, artinya kolom yang digunakan di GROUP BY statement, juga perlu ditempatkan di SELECT.
GROUP BY ditempatkan setelah WHERE, tetapi jika tidak menggunakan WHERE maka langsung ditempatkan setelah FROM.
Jika menggunakan ORDER BY, maka GROUP BY ditempatkan sebelum ORDER BY.
Baca juga : Bootcamp Data Analyst with SQL and Python
2. Data yang Digunakan
Group by statement dibagi menjadi dua, yaitu group by single column dan group by multiple column. Pada artikel kali ini, kita akan membahas kedua statement tersebut dan cara menggunakannya.
Data dummy yang akan kita gunakan adalah tabel penjualan bernama sales_retail_2019 yang berisi kolom province, brand, order_id, dan item_price seperti di bawah ini.
3. Group By Single Column
Dengan group by single column, kita dapat mengelompokkan data menggunakan kriteria dari satu kolom saja, misalnya mengelompokkan data berdasarkan provinsi saja. Sintaks yang digunakan sebagai berikut.
4. Group By Multiple Column
Statement group by untuk multiple column digunakan untuk mengelompokkan data menggunakan kriteria dari dua kolom atau lebih, misalnya mengelompokkan data berdasarkan province dan brand. Berikut adalah sintaks yang bisa kita gunakan untuk mengelompokkan data pada poin satu.
Baca juga : Catat! Ini 3 Keuntungan Belajar SQL dalam Mengolah Data
Selain group by, ada statement SQL lain yang perlu dipelajari. SQL adalah salah satu tools yang harus dikuasai oleh praktisi data science. Selain itu, mereka juga memerlukan bahasa pemrograman seperti R dan Python untuk mengolah data berukuran besar.
Yuk asah kemampuan data science kamu bersama DQLab! DQLab adalah platform edukasi pertama yang mengintegrasi fitur ChatGPT yang memudahkan beginner untuk mengakses informasi mengenai data science secara lebih mendalam.
DQLab juga menggunakan metode HERO yaitu Hands-On, Experiential Learning & Outcome-based, yang dirancang ramah untuk pemula. Jadi sangat cocok untuk kamu yang belum mengenal data science sama sekali. Untuk bisa merasakan pengalaman belajar yang praktis dan aplikatif, yuk sign up sekarang di DQLab.id atau ikuti Bootcamp Data Analyst with SQL and Python berikut untuk informasi lebih lengkapnya!
Penulis: Galuh Nurvinda K
Postingan Terkait
Menangkan Kompetisi Bisnis dengan Machine Learning
Pentingnya Machine Learning dalam Industri Bisnis
Mulai Karier
sebagai Praktisi Data
Bersama DQLab
Daftar sekarang dan ambil langkah pertamamu untuk mengenal Data Science.