Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS

Statistik Ukuran Variasi, Kupas Tuntas Ukuran Penyebaran Data

Belajar Data Science di Rumah 19-Juli-2022
https://dqlab.id/files/dqlab/cache/56eb6bc036b32bed39bc79c95a166393_x_Thumbnail800.jpg

Ukuran pemusatan data adalah nilai yang digunakan untuk menggambarkan sekumpulan data dengan mengidentifikasi pusat sekumpulan data tersebut. Mean, median dan modus adalah contoh ukuran yang digunakan dalam mengidentifikasi pusat data. Ukuran pemusatan selalu digunakan dimana-mana. Misalnya pada berita yang kita baca atau nonton.


Tidak bisa dipungkiri ukuran pemusatan memang sederhana dan sepopuler itu. Tapi apakah dengan hanya mengandalkan ukuran pemusatan sudah cukup mengidentifikasi ciri-ciri dari data?


Ukuran penyebaran sangat jarang digunakan dalam berita-berita yang tersebar di masyarakat. Varians ataupun standar deviasi merupakan contoh yang umum digunakan untuk ukuran penyebaran. Tapi tentu kita akan sepakat, jika ukuran penyebaran ini sangat jarang digunakan dalam media. Anggaplah pada sebuah desa jika dirata-ratakan pendapatannya didapatkan 10juta rupiah. Perhitungan rata-rata ini bisa saja sudah benar, tapi apakah itu representatif?


Ukuran penyebaran menjadi penting untuk mengetahui apakah ukuran pemusatan seperti mean bisa merepresentasikan sekumpulan data atau tidak. Semakin tinggi varians, semakin jauh sekumpulan data tersebut ke rata-ratanya. Begitu pula sebaliknya. Pada artikel ini akan mendeskripsikan ringkasan mengenai modul baru DQLab, yaitu Statistik Dasar untuk Data Science dengan Python & Scikit - Ukuran Variasi.


Sebelum itu, yuk simak penjelasannya melalui video singkat dibawah ini!

Part I



Part II




1.  Anscombe"s Quartet

Modul ini sangat menarik karena dibuka dengan Anscombe"s quartet. Anscombe"s quartet merupakan kumpulan empat data yang dirilis oleh Francis John Anscombe, seorang Statistikawan Inggris pada tahun 1973 melalui makalahnya yang berjudul Graphs in Statistical Analysis di American Statistician. Dataset ini memiliki nilai statistik deskriptif dan persamaan regresi linier yang sama namun secara kualitatif datanya berbeda untuk keempat pasang data tersebut. Coba perhatikan data berikut:


statistik
statistik


Mari kita visualisasikan data keempat pasang data ini.


Statistik


2. Mengapa Ukuran Variasi Penting

Seperti yang telah disampaikan, bahwa ke empat data diatas memiliki statistik deskriptif dan persamaan regresi linier yang sama. Tapi dengan melihat visualisasi di atas tampak jelas jika ke empat data tersebut berbeda. Ada yg berbentuk linier, ada yang menyebar, ada yang lurus saja dengan 1 outliers, dan ada yang berbentuk parabola. 


Apabila hanya mengandalkan statistik deskriptif saja mungkin kita akan mengira jika ke empat data tersebut adalah data yang sama, atau mungkin data yang berasal dari populasi yang sama. Namun pada kenyataannya, ke empat data tersebut sangat berbeda nilainya. Melalui modul ini kita akan mendapatkan penjelasan yang komperehensif mengenai pentingnya ukuran penyebaran, terutama mengenai varians.


Baca juga : Belajar Statistika, Kenali Lebih Jauh Penerapannya dalam Data Science


3. Ukuran-Ukuran Penyebaran

Selain varians, tentunya terdapat ukuran penyebaran lain yang akan dijelaskan dalam modul. Seperti variasi, range,  dan persentil. Tentunya terdapat pula contoh implementasi dan perhitungan ukuran tersebut, baik dalam perhitungan sampel maupun populasi. Tidak lupa pula bagaimana menggunakan tools seperti python dalam perhitungan ukuran penyebaran.


4. Ragam Kompetensi yang Akan Kamu Dapatkan

Selain lebih memahami bagaimana penerapan statistika dalam data science, Sahabat DQ juga akan lebih memahami bagaimana ukuran variasi dalam analisa data. Berikut adalah kompetensi yang akan kamu dapatkan setelah mengerjakan module Statistik Dasar untuk Data Science dengan Python & Scikit - Ukuran Variasi :

  • Mampu memahami apa dan kenapa diperlukan ukuran variasi (measures of variability)

  • Mampu memahami ukuran dan menghasilkan rentang data (range)

  • Mampu memahami dan menghitung kuartil (quartile), interkuartil (interquartile) dan persentil (percentile)

  • Mampu memahami dan menggunakan rumus perhitungan varian (variance) dan standar deviasi (standard deviation) untuk sampel dan populasi


Baca juga : Empat Jenis Data Statistik Hasil Pengukuran


Ingin mempelajari lebih dalam mengenai ukuran penyebaran? Modul Statistik Dasar untuk Data Science dengan Python & Scikit - Ukuran Variasi sudah tersedia loh di academy DQLab. Pelajari semua hal yang kamu butuhkan tentang ukuran data variasi mulai dari teori hingga prakteknya. Tunggu apalagi? Yuk Sign up sekarang di DQLab.


Penulis: Ashari Ramadhan

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login