Apa Saja Dasar Statistik untuk Data Analyst?
Bidang ilmu matematika adalah suatu ilmu yang berperan penting dalam berbagai bidang. Ilmu matematika memiliki beberapa cabang ilmu seperti statistika, aljabar linear, geometri, dan lainnya. Data science merupakan ilmu yang menerapkan statistik di dalamnya, baik rumus-rumus dasarnya maupun berbagai teknik yang digunakan. Untuk lebih mengetahui tentang statistik untuk data analyst lebih dalam kita bisa sama-sama lihat di artikel berikut ini.
Statistik adalah suatu ilmu yang berhubungan dengan metode pengumpulan data dan pengolahan data sampai penarikan kesimpulan. Ilmu statisik ini telah banyak diterapkan di berbagai bidang. Sebagai contoh mudah penerapan statistik adalah data kepemilikan kendaraan bermotor di suatu wilayah. Statistik ini perlu diolah menggunakan metode statistik sehingga dapat menghasilkan kesimpulan yang sesuai. Ingin tahu lebih tentang statistik untuk data analyst? Yuk, simak bersama-sama!
1. Tipe Data
Statistik adalah suatu ilmu yang berkaitan dengan data. Data secara umum memiliki berbagai jenis dan tipe. Secara wujudnya dapat bisa dikategorikan menjadi dua kategori yaitu data numerik dan data kategorik. Data numerik merupakan data yang berupa angka dan bisa dilakukan perhitungan matematika, contohnya seperti bilangan bulat dan suhu udara. Data kategorik merupakan data yang tidak bisa diterapkan menggunakan operasi matematik, contohnya seperti warna baju dan nama kota.
Baca juga : Bootcamp Data Analyst with SQL and Python
2. Pemusatan Data
Menurut ilmu statistik terdapat dua ukuran, yang pertama adalah ukuran pemusatan data. Beberapa jenis ukuran pemusatan data antara lain:
mean, nilai rata-rata hitung dengan cara menjumlahkan seluruh data dibagi dengan banyaknya data
median, nilai tengah setelah data diurutkan dari nilai terkecil hingga terbesar
geometric mean, digunakan untuk mengukur laju perubahan variabel dari waktu ke waktu
geometric mean rate of return, digunakan untuk mengukur persentase pengembalian rata-rata dari suatu investasi per periode waktu
3. Persebaran Data
Jenis pengukuran dalam statistik lainnya antara lain ukuran persebaran data. Ukuran penyebaran data adalah suatu ukuran yang menyatakan seberapa besar nilai-nilai data berbeda atau bervariasi dengan nilai ukuran pusatnya. Beberapa jenis ukuran persebaran data adalah:
range, selisih antara nilai terbesar dengan nilai terkecil
varians, ukuran seberapa jauh penyebaran dari nilai rata-ratanya
standar deviasi, sebuah metode analisis statistik yang digunakan untuk mengukur persebaran data di sekitar mean
varians, ukuran seberapa jauh penyebaran data dari nilai rata-ratanya
4. Analisis Statistik
Analisis statistik memiliki beberapa tahapan. mulai dari data collection, data organization, data presentation, data analysis, dan data interpretation. Dalam proses analisis data, terdapat berbagai metode analisis statistik yang bisa digunakan sesuai dengan kebutuhan. Beberapa jenis analisis statistik antara lain analisis statistik deskriptif, analisis statistik inferensial, analisis statistik asosiasi, analisis prediktif, analisis preskriptif, exploratory data analysis (EDA), dan causal analysis.
Baca juga : Data Analyst vs Data Scientist, Yuk Kenali Perbedaannya
Terdapat beberapa metode analisis data yang bisa digunakan oleh praktisi data. Dalam DQLab kamu bisa belajar dasar-dasar statistika dengan mudah.
DQLab menyajikan materi secara teori maupun praktek. Selain itu di DQLab pun menyediakan berbagai modul dan ebook dengan materi yang beragam sesuai kebutuhan.
Cara bergabungnya sangat mudah. Langsung saja sign up di DQLab.id/signup dan nikmati belajar data science DQLab dan ikuti Bootcamp Data Analyst with SQL and Python.
Penulis : Latifah Uswatun Khasanah
Editor : Annissa Widya Davita