Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS

Serba Serbi SQL Group By untuk Pengelompokan Data

Belajar Data Science di Rumah 16-Februari-2023
https://dqlab.id/files/dqlab/cache/9e61e3d6567b3930e84207ed2f299de1_x_Thumbnail800.jpeg

Structured Query Language yang disingkat menjadi SQL merupakan salah satu bahasa pemrograman favorit para praktisi data. Segala sesuatu yang berhubungan dengan database, bisa diakses dengan menggunakan bahasa SQL. Saat ini, banyak perusahaan yang sudah menyimpan datanya di dalam database, baik untuk perusahaan rintisan maupun perusahaan besar. Sehingga kebutuhan akan praktisi data yang benar-benar bisa menguasai bahasa SQL tentu akan semakin tinggi.


Dalam SQL terdapat banyak clause yang bisa dimanfaatkan untuk mempermudah pengolahan data. Salah satunya adalah Group By, dimana kita bisa menggunakannya untuk mengelompokkan data berdasarkan field yang kita inginkan. Secara umum, bentuk dari query GROUP BY adalah sebagai berikut:


SQL

Penggunaan WHERE dan ORDER BY sebenarnya merupakan optional, tergantung kebutuhan kita masing-masing. Nah, dalam artikel ini, kita akan mencoba mengulik beberapa hal menarik dari GROUP BY. Yuk, simak pembahasannya!


1. Statement Aggregate

Pengelompokkan data dengan menggunakan GROUP BY akan mempermudah kita untuk melihat data dari metrik utama, seperti mencari nilai rata-rata, minimal, maksimal, dan seterusnya. Hal ini karena GROUP BY dapat digunakan secara bersamaan dengan fungsi aggregate seperti MIN(), MAX(), SUM(), AVG() dan COUNT(), dll. Berikut penjelasan dari masing-masing fungsi aggregate:

MIN() : untuk mengembalikan nilai minimum di setiap group data

MAX() : mengembalikan nilai maksimum dari setiap group data

SUM() : mengembalikan hasil penjumlahan dari setiap group data

AVG() : mengembalikan nilai rata-rata dari setiap group data

COUNT() : untuk menghitung jumlah data berdasarkan baris nya di masing-masing group 


Baca juga : Saatnya Belajar SQL, Kenali Rekomendasi Query SQL Bagi Pemula


2. Note Penting Sebelum Menggunakan GROUP BY

SQL

Sebelum menggunakan GROUP BY, kita harus memperhatikan beberapa hal penting, diantaranya adalah:

  • Jika GROUP BY digunakan secara bersamaan dengan SELECT, maka kolom yang digunakan pada GROUP BY statement juga harus ditulis juga sebagai kolom yang ada di SELECT.

  • Secara umum, GROUP BY bisa langsung ditulis setelah FROM. Namun jika kita ingin menggunakan statement WHERE, maka GROUP BY harus ditulis setelah WHERE.

  • Saat kita akan menggunakan GROUP BY bersamaan dengan ORDER BY, maka GROUP BY harus ditulis terlebih dahulu saat kita menggunakan statement ORDER BY.

  • Jika kita menggunakan kombinasi GROUP BY dengan HAVING, maka HAVING harus dituliskan setelah GROUP BY.


3. Kombinasi GROUP BY dan WHERE

Di dalam beberapa keadaan, terkadang kita akan membutuhkan filter untuk menampilkan data yang diperlukan saja. Untuk melakukan filtering, kita bisa memanfaatkan klausa WHERE. Misalkan kita memiliki data customer seperti ini, lalu kita ingin memfilter berdasarkan negaranya dan melakukan GROUP BY berdasarkan namanya.


SQL


Berikut adalah syntax yang bisa digunakan:

SELECT first_name, last_name, age, country

FROM Customers

WHERE country='UK'

GROUP BY first_name;

Dan hasilnya adalah:


SQL


Dari output ini, kita bisa melihat bahwa ada dua data yang akan ditampilkan karena kita memfilter hanya untuk UK dan mengelompokkan berdasarkan first name. Jika kita mengelompokkan berdasarkan country, maka yang akan muncul hanya satu data.


4. Kombinasi GROUP BY dan HAVING

Meskipun WHERE terlihat sangat powerful, sayangnya WHERE tidak bisa digunakan untuk memfilter hasil agregate. Sehingga kita harus mencari alternatif lainnya. Dalam hal ini kita bisa memanfaatkan HAVING. Masih dengan menggunakan data customer yang ada di poin 3, kita akan coba untuk menampilkan negara yang jumlah customernya lebih dari 1. Syntax yang bisa digunakan adalah:

SELECT country, MIN(age) AS age_minimum, COUNT(customer_id) AS total_customer

FROM Customers

GROUP BY country

HAVING COUNT(customer_id) > 1;

Dari syntax di atas, kita ingin menampilkan negara dengan total customer yang lebih dari satu, dan hasilnya adalah sebagai berikut:

SQL


Baca juga : Catat! Ini 3 Keuntungan Belajar SQL dalam Mengolah Data


Tertarik untuk belajar SQL lebih lanjut? Kamu gak perlu bingung harus belajar SQL dimana karena DQLab juga menyediakan modul SQL yang sangat cocok bagi pemula karena membahas hal-hal yang bersifat fundamental. Selain itu, kamu juga bisa memanfaatkan live code editor yang telah disediakan sehingga kamu tidak repot mengurus proses instalasi software dan bisa fokus pada materi. Agar bisa mengaksesnya, kamu cukup berlangganan untuk menjadi member premium di DQLab


Yuk, tunggu apa lagi? Sekarang giliran mu!

Penulis: Gifa Delyani Nursyafitri


Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login