Teknik Pengolahan Data Deskriptif dengan Statistik Deskriptif

Belajar Data Science di Rumah 29-Oktober-2021

https://dqlab.id/files/dqlab/cache/a95dd59ad72671b200ca5b647226a7c7_x_Thumbnail800.png

Statistik deskriptif adalah bagian dari analisis statistik yang paling mendasar dalam menyajikan hasil penelitian. Statistik deskriptif menjadi bagian terpenting bagi peneliti yang dekat dengan data untuk melakukan penyajian data dalam hasil penelitiannya Secara definisi, analisis statistik deskriptif adalah analisis statistik yang memberikan gambaran secara umum mengenai karakteristik dari masing-masing variabel penelitian yang dilihat dari nilai rata-rata (mean), maximum, dan minimum. Tidak hanya itu juga, Statistik deskriptif merupakan proses analisis statistik yang fokus kepada manajemen, penyajian, dan klasifikasi data. Dengan proses ini, data yang disajikan akan menjadi lebih menarik lebih mudah dipahami, dan mampu memberikan makna lebih bagi pengguna data. Salah satu penyajian data yang cukup menarik yaitu dengan menggunakan visualisasi data. Visualisasi data merupakan bentuk penyajian statistika deskriptif yang bertujuan untuk menyajikan data dalam bentuk visual atau grafik sehingga lebih menarik dan lebih mudah dipahami. Dalam visualisasi ini, kita bisa menggambarkan data dalam beragam bentuk seperti menggunakan tabel, diagram batang (bar chart), diagram garis (line chart), diagram kue (pie chart), pemetaan wilayah, dll yang tentunya semakin berkembang sesuai dengan kemajuan teknologi.

Berbicara analisis statistik deskriptif, dikenal dengan dua istilah yaitu ukuran pemusatan dan ukuran keragaman. Ukuran pemusatan adalah metode paling lazim digunakan dalam analisis statistik deskriptif. Metode ini berfokus untuk menggambarkan kondisi data di titik pusat. Secara umum, kita bisa melihat bagaimana kondisi data dengan melihat dimana letak pusat data tersebut. Biasanya, pusat data sendiri akan berada pada nilai tengah, meskipun tidak selalu demikian. Ukuran pemusatan biasanya ditunjukkan melalui perhitungan mean, median dan modus. Lain halnya dengan ukuran keragaman dimana ukuran keragaman merupakan ukuran untuk menyajikan bagaimana sebaran dari data tersebut. Ukuran keragaman menunjukkan bagaimana kondisi sebuah data menyebar di kelompok data yang kita miliki. Hal ini memungkinkan kita untuk menganalisis seberapa jauh data-data tersebut tersebar dari ukuran pemusatannya. Ukuran keragaman digambarkan melalui perhitungan range, kuartil, simpangan kuartil, varians dan standar deviasi. Mari kita cari tahu lebih dalam soal teknik pengolahan data dalam analisis statistik deskriptif. Pada artikel DQLab kali ini, kita akan membahas mengenai ukuran pemusatan dan keragaman dalam analisis statistik deskriptif. Dengan harapan bisa menjadi tambahan insight dan rekomendasi bagi kalian calon praktisi data, peneliti maupun data enthusiast. Jangan lewatkan artikel berikut ini, pastikan simak baik-baik, stay tune and keep scrolling on this article guys!

1. Ukuran Frekuensi Data

Ukuran frekuensi data biasanya dilakukan dengan persentase. Persentase adalah suatu perbandingan untuk menyatakan pecahan dari seratus yang ditunjukkan dengan simbol %. Persen berasal dari bahasa latin, per centum yang artinya Per-seratus. Persentase juga bisa dikatakan sebagai suatu cara untuk menunjukkan sebuah angka sebagai bagian dari keseluruhan, dimana keseluruhan tersebut ditulis dengan 100%. Persentase memiliki rumus sebagai berikut:

Persentase = (Jumlah Bagian / Jumlah Keseluruhan) x 100%

Dengan rumus tersebut, sebuah pecahan atau rasio dapat diubah menjadi bentuk persentase.

2. Ukuran Kecenderungan Data

Ukuran kecenderungan data biasanya diwakili oleh Mean, Median, dan Modus.

Mean

Mean adalah nilai tengah pada suatu kelompok data yang diperoleh dari penjumlahan keseluruhan data pada suatu kelompok dibagi dengan banyaknya data. Terdapat dua nilai tengah yang biasanya kita ketahui yaitu nilai tengah untuk populasi dan nilai tengah untuk sampel. Nilai tengah biasanya juga disebut mean atau rata-rata. Mean pada dasarnya adalah model kumpulan data kita. Ini adalah nilai yang paling umum.

Median

Median adalah suatu nilai yang terletak di tengah kelompok data yang telah diurutkan dari nilai terkecil sampai terbesar atau sebaliknya. Karena suatu kelompok terbagi atas dua jenis yaitu kelompok ganjil dan kelompok genap maka terdapat dua solusi menentukan median yang dapat digunakan untuk kasus tersebut. Apabila median adalah nilai tengah dalam daftar tabel angka yang berurutan naik atau turun, dan bisa lebih deskriptif daripada mean atau nilai rata- rata.

Modus

Modus adalah sebuah perhitungan yang sudah diajarkan dari sekolah dasar, untuk belajar mengolah data yang sederhana. Modus adalah nilai yang paling sering muncul dengan frekuensi yang paling besar. Modus juga merupakan bagian dari perhitungan statistika seperti mean dan median. Dengan adanya modus ini, kamu bisa membandingkan dua data yang berbeda dengan mudah.

3. Ukuran Penyebaran Data

Ukuran penyebaran data merupakan ukuran yang menyatakan seberapa besar nilai-nilai data berbeda atau bervariasi dengan nilai ukuran pusatnya atau seberapa besar penyimpangan nilai-nilai data dengan nilai pusatnya. Ada beberapa jenis dalam ukuran penyebaran data yaitu Range, Standar Deviasi dan Varians.

Range

Range merupakan jarak penyebaran data antara skor terendah (lowest score) dengan skor tertinggi (Highest Score).

Rumus: R = H - L

Keterangan:

R = Range yang dicari

H = Skor yang tertinggi (Highest Score)

L = Skor yang terendah (Lowest Score)

Standar Deviasi

Standar Deviasi yaitu selisih atau simpangan dari masing-masing skor atau interval dari nilai rata-rata hitungnya (Mean). Deviasi merupakan salah satu ukuran variabilitas data yang biasa dilambangkan dengan huruf kecil dari huruf yang dilambangkan sebagai lambang skornya. Jadi bila skornya berlambang X, maka deviasinya berlambang x. Karena deviasi merupakan simpangan dari masing-masing skor terhadap Mean groupnya, maka ada dua deviasi: deviasi positif dan deviasi negatif.

Varians

Varian merupakan sebaran antar angka suatu kumpulan data memiliki peran sentral dalam statistik, dimana beberapa ide yang menggunakannya antara lain statistik deskriptif, inferensi statistik, pengujian hipotesis, goodness of fit, dan pengambilan sampel. Varian adalah alat penting dalam sains, di mana analisis statistik data biasa dilakukan. Varian adalah kuadrat dari simpangan baku atau standar deviasi, momen pusat kedua dari sebuah distribusi, dan kovariansi variabel acak dengan dirinya sendiri, dan sering kali diwakili Ïƒ2, s2, Var(X).

4. Ukuran Posisi Data

Ukuran posisi data diwakili oleh persentil, desil dan kuartil. Persentil, kuartil, dan desil adalah cara membagi data menjadi sama banyak. Persentil adalah membagi data menjadi 100 sama banyak. Kuartil adalah membagi data menjadi empat sama banyak. Desil adalah membagi data menjadi sepuluh sama banyak. Data yang terbagi sama banyak dibatasi sebuah nilai. Pada kuartil, empat data yang dibagi menjadi sama banyak dibatasi 3 tiga nilai kuartil yaitu kuartil atas, kuartil tengah, dan kuartil bawah. Rumus kuartil, desil, dan persentil dipakai untuk menentukan nilai yang menjadi batas tersebut. Begitu juga dengan desil dan persentil, data yang terpisahkan sama banyak dibatasi oleh masing-masing nilai desil atau persentil. Kuartil membagi data jadi 4 bagian sama banyak sehingga terdapat 3 nilai kuartil. Pada desil, data dibagi menjadi sepuluh sama banyak sehingga ada 9 nilai desil. Namun pada persentil, data dibagi menjadi 100 sama banyak, hingga terdapat 99 nilai persentil

5. Belajar Teknik Pengolahan Data Paling Mudah Bersama DQLab!

Penelitian merupakan kegiatan yang terpenting dalam sebuah riset untuk menggali sebuah permasalahan yang terjadi di lapang. Tidak terkecuali dengan adanya pemahaman akan pentingnya analisis data tentunya juga membutuhkan keuletan dan kepiawaian dalam melakukannya. Hal ini juga tidak boleh diabaikan karena pada tahap ini peneliti harus menentukan jenis penelitiannya. Apalagi penentuan teknik pengolahan data juga tidak boleh dianggap enteng. Justru itulah yang merupakan kunci dalam sebuah penelitian. Karena pada dasarnya penerapan analisis data berbeda jika jenis penelitiannya berbeda. Salah satu penerapannya adalah data science yang terdiri dari bidang ilmu matematika, statistik, dan komputer. Dengan mempelajari Data Science, kamu akan terlatih dan terbiasa untuk menghasilkan informasi dari olahan data mentah dan insight yang valuable.

Jika kamu penasaran dengan data science dan ingin belajar data science dan pengolahan data secara langsung, caranya mudah banget. Kamu bisa loh untuk coba bikin akun gratisnya kesini di DQLab.id atau bisa klik button di bawah ini yap. Kamu juga bisa loh cobain Modul lain untuk mengasah kemampuan data science kamu biar lebih oke lagi dan bisa diakses tanpa batas. Nikmati pengalaman belajar data science yang menarik dan cobain berlangganan bersama DQLab yang seru dan menyenangkan dengan live code editor. Cobain juga free module Introduction to Data Science with R dan Introduction to Data Science with Python untuk menguji kemampuan data science kamu. Kalian juga bisa mencoba studi kasus penerapan real case industry. Ayo persiapkan dirimu untuk berkarir sebagai praktisi data yang kompeten!

Penulis: Reyvan Maulid

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.