AGUSTUS GEMBIRA! DISKON 95%
Belajar Data Science Bersertifikat, 12 Bulan hanya 190K!
0 Hari 1 Jam 37 Menit 8 Detik

Mengenal Konsep Skewness dalam Statistik Data Analyst

Belajar Data Science di Rumah 11-Juli-2024
https://dqlab.id/files/dqlab/cache/2-longtail-rabu-03-2024-07-13-210245_x_Thumbnail800.jpg

Dalam dunia statistik, salah satu konsep penting yang perlu dipahami oleh seorang data analyst adalah skewness. Skewness memberikan gambaran tentang simetri atau asimetri distribusi data dalam suatu dataset. Memahami skewness dapat membantu data analyst dalam menganalisis dan menyimpulkan karakteristik data dengan lebih akurat.


Artikel ini akan membahas konsep skewness secara mendalam untuk data analyst, tipe skewness, kriteria skewness, serta bagaimana cara mengukur dan menginterpretasikannya. Simak penjelasannya yuk sahabat DQLab!


1. Apa itu Skewness?

Kemencengan atau kecondongan (skewness) adalah tingkat ketidaksimetrisan atau kejauhan simetri dari sebuah distribusi. Skewness diartikan sebagai kemiringan distribusi data. Sebuah distribusi yang tidak simetris akan memiliki rata-rata, median, dan modus yang tidak sama besarnya sehingga distribusi akan terkonsentrasi pada salah satu sisi dan kurvanya akan menceng. Ukuran kemiringan kurva adalah derajat atau ukuran dari ketidaksimetrisan suatu distribusi data.


Baca juga : Bootcamp Data Analyst with SQL and Python


2. Tipe Skewness

Secara umum, ada tiga tipe skewness:

  1. Skewness Positif (Right-Skewed)

  • Distribusi data memiliki ekor lebih panjang di sisi kanan

  • Data terdistribusi lebih banyak pada nilai-nilai rendah dan semakin sedikit pada nilai-nilai tinggi

  • Contoh: Distribusi pendapatan di mana sebagian besar orang berpenghasilan rendah dan hanya sedikit yang berpenghasilan sangat tinggi.

Data Analyst

Sumber Gambar: Scribbr


  1. Skewness Negatif (Left-Skewed)

  • Distribusi data memiliki ekor lebih panjang di sisi kiri

  • Data terdistribusi lebih banyak pada nilai-nilai tinggi dan semakin sedikit pada nilai-nilai rendah.

  • Contoh: Distribusi usia pensiun di mana sebagian besar orang pensiun di usia tua, tetapi beberapa pensiun lebih awal.


  1. Tidak Ada Skewness (Symmetrical)

  • Distribusi data simetris dengan jumlah data yang sama di kedua sisi rata-rata.

  • Distribusi data berbentuk lonceng sempurna (normal distribution).

  • Contoh: Tinggi badan manusia yang cenderung terdistribusi normal dengan sebagian besar individu berada di sekitar rata-rata.


3. Kriteria Skewness

Kriteria untuk mengetahui model distribusi dari koefisien kemiringan :

  • Jika koefisien kemiringan <nol, maka bentuk distribusinya negative (ekor bagian kiri lebih Panjang).

  • Jika koefisien kemiringan = nol, maka bentuk distribusinya simetrik.

  • Jika koefisien kemiringan > nol, maka bentuk distribusinya positif (ekor bagian kanan lebih Panjang).


4. Contoh Skewness

Sebagai contoh Nilai skewness pada variabel keamanan sistem menunjukkan data normal ketika nilai-nilai tersebut berada di antara rentang nilai -2 sampai dengan 2. Nilai skewness pada indikator keamanan sistem (K) misal K1 adalah -0.646, K2 adalah -0.373 dan K3 adalah -0.455. Semua nilai skewness pada indikator tersebut berada pada rentang nilai -2 sampai dengan 2, sehingga dapat disimpulkan bahwa data tersebut normal. Untuk mencari nilai maksimum dari data sampel pada penelitian ilmiah bisa menggunakan SPSS atau Ms Excel atau software lainnya.


Baca juga : Data Analyst vs Data Scientist, Yuk Kenali Perbedaannya 


Skewness adalah alat penting bagi data analyst untuk memahami distribusi data dan membuat analisis yang lebih akurat. Dengan mengetahui bagaimana data skewed, seorang data analyst dapat mengidentifikasi outliers, memilih model yang tepat, dan membuat keputusan yang lebih baik berdasarkan data yang ada. Memahami konsep ini membantu meningkatkan kualitas analisis data dan memberikan insight yang lebih mendalam tentang karakteristik data.


DQLab merupakan suatu platform belajar online yang berfokus pada pengenalan Data Science & Artificial Intelligence (AI) dengan menggunakan berbagai bahasa pemrograman populer. Selain itu DQLab merupakan platform edukasi pertama yang mengintegrasi fitur ChatGPT.


DQLab juga menggunakan metode HERO, yaitu Hands-On, Experiental Learning & Outcome-based, yang dirancang ramah untuk pemula. Untuk bisa merasakan pengalaman belajar yang praktis & aplikatif yuk langsung saja sign up di DQLab.id dan ikuti DQLab LiveClass Bootcamp Data Analyst with SQL and Python sekarang! 


Penulis: Reyvan Maulid

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login