Kenali Jenis Group By SQL Sebelum Mengolah Data

GROUP BY adalah salah satu statement SQL yang paling banyak digunakan di berbagai project. Statement GROUP BY digunakan untuk menemukan matriks utama seperti average, nilai max dan min, dan lain sebagainya dalam data yang telah dikelompokkan berdasarkan variabel tertentu. Jika kita menghitung dasar statistik seperti sum, average, max, min, dan lain sebagainya tanpa GROUP BY, hasil yang kita peroleh akan berorientasi pada record sedangkan ketika kita menggunakan statement GROUP BY, maka hasil yang kita peroleh adalah matriks yang kita butuhkan berdasarkan kelompok tertentu.
Apakah pengelompokan data ini hanya bisa dilakukan berdasarkan satu variabel saja? Jawabannya adalah TIDAK. Kita bisa menggunakan beberapa variabel sekaligus untuk mengelompokkan data dan kemudian menghitung matriks yang kita butuhkan. Pada artikel kali ini kita akan membahas cara menggunakan GROUP BY pada SQL. jadi, pastikan kamu menyimak artikel ini sampai akhir, ya!
1. Pengenalan GROUP BY
Untuk mengelompokkan data di SQL kita menggunakan GROUP BY Statement. GROUP BY statement akan mengelompokkan data yang bernilai sama ke dalam satu group, dan dengan menggunakan fungsi aggregate seperti COUNT, MAX, MIN, SUM, dan AVG kita bisa melakukan agregasi untuk untuk setiap group atau kelompok yang terbentuk. Agar lebih jelas, yuk pelajari penulisan syntax-nya.
Hal penting yang perlu diperhatikan adalah:
GROUP BY digunakan dengan SELECT, artinya kolom yang digunakan di GROUP BY statement, juga perlu ditempatkan di SELECT.
GROUP BY ditempatkan setelah WHERE, tetapi jika tidak menggunakan WHERE maka langsung ditempatkan setelah FROM.
Jika menggunakan ORDER BY, maka GROUP BY ditempatkan sebelum ORDER BY.
Baca juga : Saatnya Belajar SQL, Kenali Rekomendasi Query SQL Bagi Pemula
2. Pengenalan Data
GROUP BY statement dibagi menjadi dua, yaitu GROUP BY single column dan GROUP BY multiple column. Pada artikel kali ini, kita akan membahas kedua statement tersebut dan cara menggunakannya. Data dummy yang akan kita gunakan adalah tabel penjualan bernama sales_retail_2019 yang berisi kolom province, brand, order_id, dan item_price seperti di bawah ini.
3. GROUP BY Single Column
Fungsi GROUP BY single column memastikan data dapat dikelompokkan menggunakan kriteria dari satu kolom saja, misalnya mengelompokkan data berdasarkan provinsi saja. Sintaks yang digunakan sebagai berikut.
4. GROUP BY Multiple Column
Dengan fungsi GROUP BY Multiple Column, data dapat dikelompokkan menggunakan kriteria dari dua kolom atau lebih, misalnya mengelompokkan data berdasarkan province dan brand. Berikut adalah sintaks yang bisa kita gunakan untuk mengelompokkan data pada poin satu.
Baca juga : Catat! Ini 3 Keuntungan Belajar SQL dalam Mengolah Data
Selain group by, ada statement SQL lain yang perlu dipelajari. SQL adalah salah satu tools yang harus dikuasai oleh praktisi data science. Selain itu, mereka juga memerlukan bahasa pemrograman seperti R dan Python untuk mengolah data berukuran besar.
Yuk asah kemampuan data science kamu bersama DQLab! Klik button di bawah ini atau sign up melalui DQLab.id untuk mengakses FREE MODUL ‘Introduction to Data Science’ dengan bahasa pemrograman R atau Python. Selesaikan modulnya dan dapatkan sertifikat compliance kamu sebagai modal membangun portfolio data.
Penulis: Galuh Nurvinda K
Postingan Terkait
Menangkan Kompetisi Bisnis dengan Machine Learning
Mulai Karier
sebagai Praktisi Data
Bersama DQLab
Daftar sekarang dan ambil langkah pertamamu untuk mengenal Data Science.