Simak Contoh Visualisasi dalam Jenis Data Statistik
Kita tahu bahwa ilmu statistik merupakan ilmu yang mempelajari seputar pengolahan data, analisis data maupun interpretasi. Statistik banyak dipakai dalam berbagai bidang mulai dari industri, pemasaran, kesehatan, perbankan dan keuangan, asuransi dan lain-lain.
Penyajian visualisasi data statistik adalah metode“metode yang berkaitan dengan pengumpulan dan penyajian suatu kumpulan data sehingga memberikan informasi yang berguna.
Statistika deskriptif memberikan informasi hanya mengenai data yang dipunyai dan sama sekali tidak menarik inferensi atau kesimpulan apapun tentang data tersebut. Kegiatan pengumpulan data di lapangan, akan menghasilkan angka-angka yang disebut data kasar. Penyebutan dengan istilah data kasar menunjukkan bahwa data itu belum diolah dengan teknik statistik tertentu. Jadi, data-data itu masih berwujud apa adanya atau sebagaimana data itu diperoleh.
Penyajian data merupakan salah satu kegiatan dalam pembuatan laporan hasil penelitian yang telah dilakukan agar dapat dipahami dan dianalisis sesuai dengan tujuan yang diinginkan. Data yang disajikan harus sederhana, jelas agar mudah dibaca. Penyajian data juga dimaksudkan agar para pengamat dapat dengan mudah memahami apa yang kita sajikan untuk selanjutnya dilakukan penilaian atau perbandingan dan lain lain.
Mengapa visualisasi data menjadi penting? Dengan banyaknya informasi yang dapat kita peroleh dari sekumpulan data, kita memerlukan tools yang dapat membantu kita untuk menggambarkan data-data tersebut. Visualisasi data merupakan salah satu tools yang dapat membantu kita dalam memahami data melalui map atau grafik. Visualisasi data membantu proses analisa data menjadi lebih efisien.
Biasanya penyajian data statistik dibagi menjadi dua jenis yaitu penyajian data dalam bentuk tabel maupun penyajian data statistik dalam bentuk grafik. Tabel biasanya menyajikan data dalam bentuk kolom dan baris sedangkan grafik menyajikan data dalam bentuk gambar visual Namun tidak heran jika penggunaan data statistik dengan bentuk grafik selalu menarik perhatian.
Ada beberapa jenis penyajian data dalam bentuk grafik mulai dari poligon, histogram, distribusi frekuensi hingga ogive. Hal ini dikarenakan penyajian data statistik bermaksud untuk menggambarkan karakteristik dan kecenderungan persebaran datanya seperti apa.
Pada artikel DQLab kali ini, DQLab ingin membahas mengenai materi module baru dengan judul œStatistik Dasar untuk Data Science dengan Python & Scikit - Mengenal Visualisasi Data Statistik dimana kita akan membahas mengenai apa saja jenis-jenis penyajian data statistik dalam bentuk tabel dan visualisasi grafis. Dengan harapan bisa menjadi tambahan insight dan rekomendasi bagi kalian calon praktisi data, peneliti maupun Data Enthusiast.
Dengan mengerjakan module terbaru DQLab yang berjudul œStatistik Dasar untuk Data Science dengan Python & Scikit - Mengenal Visualisasi Data Statistik, sahabat data bisa menguasai beberapa kompetensi berikut ini.
Learning Outcome:
Mampu mengetahui kenapa presentasi visual data statistik sangat penting
Mampu memvisualisasikan koleksi data dalam bentuk Tabel Frekuensi
Mampu memvisualisasikan data dalam bentuk Scatter Plot
Mampu memvisualisasikan data dalam bentuk Histogram
Mampu memvisualisasikan data dalam bentuk Polygon (Line Chart)
Ingin tahu apa saja yang akan kamu pelajari? Yuk, simak video ini!
1. Tabel Frekuensi
Tabel frekuensi adalah alat penyajian data statistik yang berbentuk kolom dan baris yang didalamnya terdapat susunan data yang telah dikelompokkan menurut kategori tertentu. Adanya tabel frekuensi tersebut untuk membantu memahami relasi antar variabel.
Contoh implementasi visualisasi tabel frekuensi dapat dilihat pada tabel berikut.
Pada tabel di atas, kita bisa lihat frekuensi jumlah siswa di setiap kelasnya. Dengan begitu kita bisa menyimpulkan kelas mana yang memiliki jumlah siswa terbanyak atau paling sedikit. Kelas 4 memiliki jumlah siswa paling banyak yaitu sebanyak 60 siswa. Dan kelas 3 memiliki jumlah siswa paling sedikit yaitu 40 siswa.
Baca juga: Belajar Statistika, Kenali Lebih Jauh Penerapannya dalam Data Science
2. Scatter Plot
Jenis visualisasi statistik yang kedua adalah scatter plot. Scatter plot adalah jenis visualisasi data untuk menunjukkan hubungan antara dua variabel. Dengan scatter plot, kita dapat melihat distribusi data dan bagaimana trennya. Kita juga dapat menggunakan scatter plot untuk melihat hubungan dari beberapa kelompok data dengan memberikan warna yang berbeda untuk membedakan tiap kelompok data.
Contoh implementasi visualisasi scatter plot dapat dilihat pada gambar berikut.
Sumbu x horizontal menunjukkan nilai dari himpunan x, sedangkan sumbu y vertikal menunjukkan nilai yang sesuai dari himpunan y.
3. Histogram
Jenis visualisasi ketiga adalah histogram. Dalam bidang statistik, histogram sangat diperlukan dalam melaporkan data khususnya bentuk tampilan grafis. Histogram mencirikan bentuk tampilan diagram Tiap tampilan batang menunjukkan proporsi frekuensi pada masing-masing deret kategori yang berdampingan dengan interval yang tidak tumpang tindih.
Histogram dapat dipahami dengan tampilan bentuk grafis untuk menunjukkan distribusi data secara visual atau seberapa sering suatu nilai yang berbeda itu terjadi dalam suatu kumpulan data.
Histogram juga merupakan salah satu alat dari 7 alat pengendalian kualitas (QC 7 Tools yaitu Diagram Pareto (Pareto chart), check sheet, diagram kontrol (control chart), Diagram ishikawa (cause-and-effect diagram), Diagram alir (flowchart), dan scatter diagram).
Histogram juga dapat diartikan sebagai salah satu teknik visualisasi paling dasar untuk memahami frekuensi kemunculan nilai. Histogram menunjukkan distribusi data dengan memplot frekuensi kejadian dalam suatu rentang.
Dalam histogram, atribut inkuiri ditampilkan pada sumbu horizontal dan frekuensi kemunculannya pada sumbu vertikal. Untuk tipe data numerik kontinu, rentang atau nilai binning untuk mengelompokkan rentang nilai perlu ditentukan. Misalnya, dalam kasus tinggi manusia dalam sentimeter, semua kejadian antara 152,00 dan 152,99 dikelompokkan dalam 152. Tidak ada jumlah optimal bin atau lebar bin yang berfungsi untuk semua distribusi.
4. Poligon (Line Chart)
Selanjutnya jenis visualisasi keempat adalah poligon. Poligon frekuensi menjadi salah satu alternatif dalam menyajikan sebuah data karena dapat memudahkan pembacaan data. Tujuan penggunaan poligon frekuensi juga sama dengan histogram yang memberi keuntungan untuk memberikan tampilan yang menarik.
Penggunaan poligon frekuensi hampir sama penerapannya dengan histogram dengan penyajian sebuah diagram. Bedanya, histogram menggunakan diagram batang, sedangkan poligon frekuensi berwujud diagram dengan menggunakan garis atau kurva.
Poligon frekuensi merupakan bagian dari penerapan diagram yang berbentuk grafik. Bentuk poligon dibuat grafik dengan menghubungkan nilai tengah di setiap sisi atas yang berdekatan dengan nilai tengah jarak frekuensinya. Di setiap tengah-tengah sisi atas persegi panjang sebuah poligon diatur berdampingan dan dihubungkan dengan suatu garis yang akan terbentuk menjadi diagram garis.
Perbedaan antara histogram dengan poligon frekuensi adalah kalau histogram menggunakan batas kelas sedangkan poligon menggunakan titik tengah. Grafik histogram berwujud segiempat atau menyerupai diagram batang, sedangkan poligon berwujud garis atau kurva yang saling berhubungan satu sama lain.
5. Ogive
Ogive merupakan bentuk penyajian data dalam grafik berdasarkan data yang sudah disusun dalam bentuk tabel distribusi frekuensi kumulatif. Ogive sering disebut sebagai grafik frekuensi meningkat. Ogive dibagi menjadi dua, yaitu ogive positif dan ogive negatif.
Pada ogive positif menggunakan batas atas kelas dan frekuensi kumulatif kurang dari. Sedangkan pada ogive negatif menggunakan batas bawah kelas dan frekuensi kumulatif lebih dari. Batas atas kelas diperoleh dengan cara menambahkan nilai tertinggi pada kelas tersebut dengan 0,5. Batas bawah kelas diperoleh dengan cara mengurangkan nilai terendah pada kelas tersebut dengan 0,5.
Nilai frekuensi kumulatif kurang dari diperoleh dengan cara menjumlahkan frekuensi setiap kelas dengan semua frekuensi semua kelas di atasnya. Nilai frekuensi kumulatif lebih dari diperoleh dengan cara mengurangkan semua frekuensi dengan frekuensi kelas di atasnya.
5. Diagram Batang Daun
Diagram Batang Daun merupakan salah satu dari metode grafik (histogram, diagram dahan daun, dan boxplot) untuk menampilkan ringkasan sebuah data. Dalam prinsipnya diagram ini akan menyajikan data dalam dua bagian yaitu bagian sebelah kiri sebagai batang dan sebelah kanan adalah sebagai daun.
Diagram batang daun adalah bentuk penyajian data statistika yang memang agak jarang ditemukan dalam kehidupan sehari-hari. Disebut sebagai diagram batang daun, pada diagram ini dibagi menjadi 2 bagian. Bagian Batang sebagai angka puluhan. Bagian Daun sebagai angka satuan. Diagram ini sering digunakan untuk data di bawah 100.
6. Pie Chart
Pie chart atau diagram lingkaran merupakan grafik statistik berbentuk lingkaran yang dibagi menjadi beberapa irisan dan luasnya bergantung kepada proporsi numerik atau kuantitas dari data yang dimiliki. Satu lingkaran menunjukkan bagian utuh atau seratus persen. Setengah lingkaran menunjukkan proporsi setengah dari total atau 50%-nya, dan seterusnya.
Diagram lingkaran banyak digunakan di dunia bisnis. Untuk mempermudah presentasi, orang terkadang menggunakan diagram lingkaran. Oleh karena itu, penting untuk mengetahui bagaimana cara mendeskripsikan diagram lingkaran. Dalam tes tertentu, misalnya pada tes IELTS, biasanya kita juga diminta untuk menjelaskan mengenai diagram lingkaran
Pie chart digunakan digunakan untuk menampilkan total persentase yang harus mencapai 100%, dimana setiap potongan pie akan menampilkan ukuran tertentu. Bentuk lingkaran dengan cepat mengaktifkan intuisi kita sebagai pembaca untuk memahami bahwa kita dapat membagi-bagi pie menjadi beberapa potongan. Sebagai catatan, persentase yang dibulatkan dapat membuat angka total pie tidak menjadi pas 100%.
Keuntungan lain ketika menggunakan pie chart dibandingkan dengan bar chart adalah pada bar chart, pembaca akan sedikit kesulitan untuk menentukan total persentase dari keseluruhan bar, apakah 100%, kurang, atau lebih.
Baca juga: Empat Jenis Data Statistik Hasil Pengukuran
Agar skill statistik kamu semakin terasah, tidak salah lagi jika kamu bisa upgrade skillmu bersama DQLab! Kamu bisa loh untuk coba bikin akun gratisnya di DQLab.id dan lakukan Sign Up untuk dapatkan info-info terbaru serta belajar Data Science. Banyak benefit yang bisa kamu dapatkan jika kamu bergabung untuk belajar bersama DQLab!
Nikmati pengalaman belajar Data Science yang menarik dengan mencoba module baru œStatistik Dasar untuk Data Science dengan Python & Scikit - Mengenal Visualisasi Data Statistik untuk lebih mahir dalam kompetensi statistik! Selamat belajar Sahabat Data