Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS!

Pahami Esensi SQL Group By dengan Fungsi Agregat

Belajar Data Science di Rumah 13-September-2023
https://dqlab.id/files/dqlab/cache/2-longtail-rabu-06-1-2023-09-13-165326_x_Thumbnail800.jpg

Structured Query Language (SQL) adalah bahasa yang sangat penting dalam pengelolaan dan analisis data dalam sistem basis data relasional. Salah satu fitur populer yang disediakan adalah "Group By" yang dikombinasi fungsi agregat.


SQL Group By memungkinkan kita untuk mengelompokkan data dalam tabel berdasarkan nilai-nilai tertentu dalam satu atau lebih kolom, sementara fungsi agregat seperti COUNT, SUM, AVG, MAX, dan MIN digunakan untuk melakukan perhitungan atau ringkasan data dalam kelompok yang telah dibuat. 


Dalam pembahasan ini, kita akan belajar lebih dalam tentang SQL Group By dan fungsi agregat, dua elemen yang sangat penting dalam analisis data dalam SQL. Dengan kombinasi yang tepat dari SQL Group By dan fungsi agregat, kita dapat menghasilkan informasi yang berharga dari dataset yang kompleks, mulai dari menghitung jumlah data hingga mengidentifikasi statistik penting.


1. Mengenal SQL Group By

SQL Group By digunakan untuk mengelompokkan data dalam tabel berdasarkan nilai tertentu dalam satu atau lebih kolom. Dengan kata lain, kalian bisa menggunakannya untuk menggabungkan data yang memiliki nilai yang sama dalam kolom tertentu menjadi satu kelompok. Penggunaan SQL Group By sangat penting dalam analisis data karena membantu kalian untuk meringkas data yang besar menjadi informasi yang lebih terkelompok.


SQL Group By sering digunakan bersama dengan perintah agregasi seperti SUM, COUNT, dan AVG. Jadi, kalian bisa melakukan operasi matematika atau statistik pada setiap kelompok data yang dihasilkan oleh Group By. Kalian dapat menghitung jumlah, rata-rata, atau mengidentifikasi nilai maksimum atau minimum dalam setiap kelompok data tersebut.


SQL Group By juga dapat digunakan dengan perintah lain seperti HAVING untuk memberikan kondisi tambahan pada kelompok data yang dihasilkan. Dengan menggunakan Group By dan HAVING bersama-sama, kita dapat melakukan filtering terhadap kelompok data yang telah dibuat, sehingga proses mengambil data yang memenuhi kriteria tertentu lebih mudah. Sintaks dari SQL Group By adalah sebagai berikut.

SQL


Baca juga : Bootcamp Data Analyst with SQL and Python


2. Macam-macam Fungsi Agregat

Ada beberapa macam fungsi agregat yang bisa kalian gunakan di SQL Group By. Beberapa di antaranya yaitu:

  • COUNT: Fungsi COUNT digunakan untuk menghitung jumlah baris atau nilai yang ada dalam sebuah kelompok data. Misalnya untuk menghitung berapa banyak pelanggan yang dimiliki oleh suatu perusahaan.

  • SUM: Fungsi SUM digunakan untuk menghitung jumlah total dari nilai dalam kolom numerik. Misalnya kalian ingin mengetahui total penjualan atau total nilai dalam suatu dataset.

  • AVG (Average): AVG adalah fungsi agregat yang digunakan untuk menghitung rata-rata dari sekelompok nilai dalam kolom numerik. Fungsi ini membantu dalam mengidentifikasi nilai rata-rata dari data seperti rata-rata usia pelanggan.

  • MAX (Maximum): Fungsi MAX digunakan untuk menemukan nilai maksimum dalam suatu kelompok data. Kalian dapat menggunakannya untuk menemukan nilai tertinggi dalam suatu kolom, seperti harga tertinggi dalam daftar produk.

  • MIN (Minimum): Sebaliknya, MIN adalah fungsi agregat yang digunakan untuk menemukan nilai minimum dalam suatu kelompok data. Contohnya, kalian bisa menggunakan MIN untuk menemukan harga terendah dari produk yang dijual.


3. Contoh SQL Group By dengan Fungsi Agregat

Tabel data yang digunakan dalam contoh ini adalah tabel "produk." Tabel ini mencerminkan data produk dari suatu toko atau perusahaan. Setiap baris dalam tabel mewakili satu produk yang tersedia untuk dijual, dan beberapa atribut atau kolom yang terkait dengan setiap produk, seperti nama produk, kategori, harga, dan jumlah terjual, dicatat dalam tabel ini.

SQL


Kita ingin menghitung jumlah produk terjual per kategori. Untuk melakukan ini, kita akan menggunakan SQL Group By dan fungsi agregat SUM.

SQL


Perhatikan penjelasan sintaks tersebut.

  • SELECT kategori: Kita memilih kolom "kategori" untuk diambil dalam hasil akhir.

  • SUM(jumlah_terjual) AS total_terjual: Menggunakan fungsi agregat SUM() untuk menghitung total jumlah terjual untuk setiap kategori. Kita memberikan nama alias "total_terjual" pada hasil agregat ini.

  • FROM produk: Menunjukkan tabel sumber yang digunakan untuk mengambil data.

  • GROUP BY kategori: Mengelompokkan hasil berdasarkan kolom "kategori". Ini akan menggabungkan baris-baris dengan kategori yang sama.


Output yang dihasilkan dari sintaks tersebut adalah sebagai berikut.

SQL


Hasil ini menunjukkan kalau total produk terjual per kategori adalah 37 untuk kategori "Elektronik" dan 45 untuk kategori "Fashion". Group By digunakan untuk mengelompokkan data berdasarkan kolom "kategori," dan SUM digunakan untuk menghitung jumlah terjual dalam setiap kelompok kategori.


Baca juga : Catat! Ini 3 Keuntungan Belajar SQL dalam Mengolah Data


4. Tips Penggunaan SQL Group By

Ada beberapa tips yang bisa kalian perhatikan dalam menggunakan SQL Group By. Beberapa di antaranya adalah:

  • Ketika kalian menggunakan SQL Group By, penting untuk memilih kolom yang tepat untuk digunakan sebagai kriteria pengelompokan. Kolom ini harus sesuai dengan tujuan analisis. Misalnya, jika ingin menghitung statistik penjualan berdasarkan kategori produk, maka kolom "kategori" adalah pilihan yang tepat.

  • Selain SQL Group By, kalian juga akan menggunakan fungsi agregat seperti SUM, COUNT, AVG, MAX, atau MIN. Pastikan memilih fungsi agregat yang sesuai dengan informasi yang ingin diperoleh. Misalnya, gunakan COUNT untuk menghitung jumlah data dalam setiap kelompok, SUM untuk menghitung total, atau AVG untuk menghitung rata-rata.

  • Jika kalian perlu melakukan filter pada hasil kelompok, kalian dapat menggunakan klausa HAVING. Cara ini lebih mudah untuk menerapkan kondisi pada kelompok data setelah pengelompokan dilakukan. Sebagai contoh, kalian dapat menghasilkan kelompok produk yang memiliki total penjualan lebih dari nilai tertentu.

  • Alias kolom adalah praktik yang baik untuk memberikan nama yang lebih deskriptif pada kolom hasil, terutama jika kalian menggunakan fungsi agregat. Ini membuat hasil query lebih mudah dipahami oleh orang lain yang membaca query.

  • Ingat kalau hasil query Group By tidak selalu memiliki urutan tertentu. Jika kalian ingin hasil yang diurutkan, perlu menggunakan klausa ORDER BY setelah Group By.


Selain fungsi Group By, SQL juga memiliki fungsi lain yang lebih kompleks yang bisa digunakan untuk analisis data. Dengan memahami secara mendalam, tentu akan memudahkan kalian dalam mendapatkan informasi yang lebih kaya dan bermanfaat untuk menyimpulkan suatu data yang dimiliki. 


Bingung mulai belajar darimana? DQLab adalah jawabannya. Modul ajarnya lengkap dan bervariasi. Dilengkapi studi kasus yang membantu kalian belajar memecahkan masalah dari berbagai industri. Bahkan diintegrasikan dengan ChatGPT. Manfaatnya apa?

  • Membantu kalian menjelaskan lebih detail code yang sedang dipelajari

  • Membantu menemukan code yang salah atau tidak sesuai

  • Memberikan solusi atas problem yang dihadapi pada code

  • Membantu kalian belajar kapanpun dan dimanapun


Selain itu, DQLab juga menggunakan metode HERO yaitu Hands-On, Experiential Learning & Outcome-based, yang dirancang ramah untuk pemula. Tunggu apa lagi, segera ikuti DQLab LiveClass Bootcamp Data Analyst with SQL & Python dan asah kemampuan kalian dalam menggunakan SQL! 


Penulis : Dita Feby 

Editor : Annissa Widya  



Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login