Digital Transformation : Yuk Kenali Macam-Macam Data dan Fungsinya dalam Ilmu Statistika!
Data merupakan salah satu elemen penting dalam proses pengambilan keputusan. Dalam istilah statistical thinking, data merupakan kumpulan informasi yang berisi fakta-fakta yang dapat memperkuat suatu argumen. Saat ini, data adalah "harta karun" yang dapat digunakan di berbagai bidang, mulai dari perbankan, pendidikan, keuangan, perdagangan, iklan, komunikasi, dan lain sebagainya. Tak khayal jika harga sebuah data set sangat mahal. Alasan lain mengapa harga data sangat mahal adalah karena data tidak muncul dengan sendirinya. Kita perlu mencari dengan metode tertentu untuk mendapatkan data yang kredibel dan sesuai tujuan kita. Dalam ilmu data, ada bermacam-macam jenis data dengan ciri-ciri dan fungsi yang berbeda-beda.
Di era digital transformation saat ini, mengolah data bukanlah suatu pekerjaan yang sulit. Bahkan, dengan teknologi dan ilmu pengetahuan yang tepat, data dapat dimanipulasi menjadi bentuk data lain yang dapat digunakan untuk metode dan tujuan tertentu. Data memiliki banyak manfaat antara lain untuk dasar membuat keputusan, sebagai dasar perencanaan, untuk bahan evaluasi dan prediksi, dan lain sebagainya. Menurut sumbernya, data dibagi menjadi dua yaitu data primer dan data sekunder. Data primer adalah data yang didapat dan dikumpulkan langsung dari objek yang diteliti. Metode pengambilan data ini dapat melalui kuesioner, wawancara, atau survei. Data sekunder merupakan data yang diperoleh dari pihak lain. Misalnya data dari Badan Pusat Statistika. Apakah data hanya dibagi menjadi dua jenis saja? Oh tentu tidak, perspektif dan pengertian data sangat luas, tergantung dari sisi mana kita mendefinisikan data tersebut. Dalam ilmu statistika, ada istilah skala pengukuran. Istilah ini merupakan komponen penting saat kita mempelajari analisis data eksplorasi. Lalu apa saja jenis data dan kegunaannya di bidang statistika? Baca artikelnya sampai selesai ya!
1. Data Kategorik
Data kategorik adalah data yang menjelaskan karakteristik dari data tersebut. Misalnya jenis kelamin, Bahasa, Kewarganegaraan, dan lain sebagainya. Data kategorik juga dapat menggunakan nilai numerik. Data kategorik dibagi menjadi dua yaitu data nominal dan data ordinal. Data nominal merupakan data diskrit, digunakan untuk memberi label pada suatu variabel, dan tidak memiliki nilai kuantitatif. Data nominal tidak memiliki tingkatan. Contohnya angka 1 untuk wanita dan angka 0 untuk pria. Angka 0 dan 1 hanya melambangkan jenis kelamin saja, bukan sebuah tingkatan atau urutan jadi kita bisa mengubah labelnya, angka 1 untuk laki-laki dan angka 0 untuk perempuan. Jenis data kategorik yang kedua adalah data ordinal. Data ordinal adalah data diskrit yang mengandung urutan. Data ordinal hampir sama dengan data nominal, namun label yang ada pada data ordinal mengandung tingkatan. Misalnya tingkat pendidikan seseorang. Angka 1 merupakan label untuk lulusan SD, angka 2 merupakan label untuk lulusan SMP, dan angka 3 merupakan label untuk lulusan SMA. Angka 1, 2, dan 3 merupakan sebuah label tingkatan lulusan SD, SMP, dan SMA (dari dasar sampai menengah atas). Data ordinal biasanya digunakan untuk mengukur data non-numerik seperti kebahagiaan, kepuasan pelanggan, dan lain sebagainya.
Baca Juga: Teknik Pengolahan Data: Yuk Pelajari Teknik Pengolahan Data yang Tepat Sesuai Tujuan Penelitianmu!
2. Data Numerik
Jenis data kedua adalah data numerik. Sebelum kita membahas data numerik, yuk kita bahas dulu data diskrit dan data kontinu! Data diskrit merupakan data yang dapat diambil nilai pastinya. Jenis data ini tidak dapat diukur tetapi dapat dihitung. Contohnya adalah jumlah buku di sebuah perpustakaan adalah 10.000 buku. Data kontinu merepresentasikan sebuah pengukuran. Oleh karena itu, data ini hanya dapat diukur, tidak dapat dihitung. Contohnya adalah tinggi seseorang. Kita hanya bisa mengukur tinggi seseorang menggunakan interval angka pada penggaris.
Data numerik dibagi menjadi dua yaitu data interval dan data rasio. Kedua data tersebut merupakan data kontinu. Data interval merupakan data berurutan yang memiliki selisih yang sama. Data ini memiliki variabel yang berisi nilai numerik yang diurutkan dan dapat dihitung selisih data yang satu dengan yang lain. Contohnya adalah suhu musim dingin selama 5 jam berturut turut. Satu jam pertama adalah -10 derajat celcius, satu jam kedua yaitu -5 derajat celcius, satu jam ketiga adalah 0 derajat celcius, satu jam keempat adalah 5 derajat celcius, dan satu jam kelima adalah 10 derajat celcius. Berdasarkan contoh tersebut, kita bisa tahu bahwa selisih suhu per jam adalah 5. Data interval tidak memiliki nilai "nol yang sebenarnya". Salah satu kelemahan data interval adalah kita hanya bisa mengurangi atau menjumlah data, tetapi tidak bisa mengalikan atau membagi data tersebut. Selain itu, karena jenis data ini tidak memiliki "angka nol yang sebenarnya" maka data ini tidak bisa digunakan untuk menghitung statistik deskriptif dan statistik inferensial. Jenis data numerik yang kedua adalah data rasio. Data rasio sama dengan data interval, yang membedakan kedua data tersebut adalah data rasio memiliki nilai nol mutlak. Contohnya adalah tinggi pohon, berat badan, panjang sebuah galah, dan lain sebagainya.
3. Pentingnya Data dalam Ilmu Statistika
Mengenali tipe-tipe data adalah syarat mutlak untuk belajar statistika karena beberapa metode statistik hanya dapat digunakan dengan tipe data tertentu. Dengan mempelajari tipe-tipe data, kita dapat menggunakan metode statistik yang tepat dan mengurangi resiko kesalahan pada hasil analisis.
Data nominal dapat digunakan untuk memperoleh informasi berupa frekuensi, proporsi, dan persentase. Frekuensi adalah jumlah sesuatu yang terjadi pada periode tertentu dalam kumpulan data. Proporsi adalah hasil pembagian dari frekuensi dan jumlah total peristiwa yang terjadi dalam kumpulan data. Persentase adalah proporsi yang dikali 100%. Metode visualisasi yang cocok digunakan untuk data nominal adalah pie chart dan diagram batang. Informasi yang dapat diperoleh dari data ordinal sama dengan data nominal. Namun, dengan menggunakan metode statistika sederhana, kita dapat menghitung nilai persentil, median, modus, dan rentang interkuartil. Dengan kombinasi ilmu coding dan data science, kita bisa mengubah data ordinal menjadi data numerik. Data kontinu merupakan data yang fleksibel, Hampir semua metode statistika dapat menggunakan data kontinu. Informasi yang bisa didapatkan dari data kontinu antara lain nilai persentil, median, rentang interkuartil, rata-rata, modus, deviasi standar, dan varian. Metode yang tepat untuk memvisualkan data kontinu adalah menggunakan histogram dan box plot. Dengan histogram, kita dapat menampilkan nilai tengah, variabilitas, bentuk grafik, dan kurtosis dari suatu distribusi. Sedangkan metode visualisasi box plot dapat kita manfaatkan untuk mendeteksi adanya pencilan pada kumpulan data.
Statistika merupakan salah satu ilmu yang mendasari lahirnya ilmu data science. Salah satu syarat utama belajar data science adalah kita harus menguasai ilmu statistika. Saat ini ilmu data science merupakan salah satu bidang ilmu yang banyak diminati dan memiliki prospek karir yang bagus. Salah satu alasan kenapa data science sangat dibutuhkan di era teknologi modern saat ini adalah karena data science dapat digunakan dan diterapkan di berbagai sektor.
4. Yuk, Mulai Belajar Data Science bersama DQLab secara GRATIS!
Tidak memiliki background IT? Jangan khawatir, kamu tetap bisa menguasai Ilmu Data Science untuk siap berkarir di revolusi industri 4.0. Bangun proyek dan portofolio datamu bersama DQLab untuk mulai berkarir di industi! Sign up sekarang untuk #MulaiBelajarData di DQLab!
Simak informasi di bawah ini untuk mengakses gratis module "Introduction to Data Science":
Buat Akun Gratis dengan Signup di DQLab.id/signup
Akses module Introduction to Data Science
Selesaikan modulenya, dapatkan sertifikat & reward menarik dari DQLab
Subscribe DQLab.id untuk Akses Semua Module Premium!
Penulis: Galuh Nurvinda Kurniawati
Editor: Annissa Widya Davita
Mulai Karier
sebagai Praktisi
Data Bersama
DQLab
Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Daftar Gratis & Mulai Belajar
Mulai perjalanan karier datamu bersama DQLab
Sudah punya akun? Kamu bisa Sign in disini
