MAU PUNYA SKILL DATA SCIENCE YANG AMAYZING?
Belajar Data Science 6 Bulan hanya 150K  | Pakai Kode: AMAYZING
BURUAN SERBU!
Pendaftaran ditutup dalam 0 Hari 2 Jam 39 Menit 7 Detik 

Statistik Deskriptif dengan Numpy Array Python

Belajar Data Science di Rumah 26-April-2021
https://dqlab.id/files/dqlab/cache/201b79954c7e1bebce2e6dadef9ada63_x_Thumbnail800.jpg

Siapa yang tidak kenal dengan statistik deskriptif? Salah satu cabang ilmu statistik yang berguna untuk merangkum dan mendeskripsikan data. Penggunaan statistik deskriptif digunakan pada hampir semua kegunaan termasuk dalam penelitian. Statistik deskriptif adalah metode dari pengorganisasian, penjumlahan, dan penyajian data dalam sebuah cara yang nyaman dan informatif, termasuk teknik grafik, dan teknik penghitungan. Statistik deskriptif dapat mendeskripsikan data yang sedang dianalisis, tetapi tidak boleh menarik kesimpulan apapun dari data. Statistik deskriptif dibagi menjadi dua bagian, ukuran nilai tengah dan ukuran dispersi. Seperti yang sahabat data ketahui, bahwa ukuran nilai tengah terdiri dari mean, median dan modus. Statistik dasar seperti ini selalu disinggung ketika kita masih sekolah bahkan saat mendeskripsikan data seperti karakteristik responden dalam suatu penelitian atau riset. Dengan demikian, penggunaan statistik deskriptif tentunya sangat mudah khususnya bagi kalian para pemula di bidang data.


Selain menggunakan cara manual, sahabat data juga bisa melakukan perhitungan dengan menggunakan library pada Python yaitu Numpy. Cara melakukan analisis statistik dasar melalui numpy array adalah dengan menuliskan array yang membantu kita menuliskan sejumlah nilai yang akan digunakan dalam satu variabel. Penggunaan library numpy array pada python banyak dijumpai khususnya dalam operasi matematika, perhitungan aljabar maupun perhitungan multi-dimensi (multi-dimensional arrays) dan perhitungan matrik. Lebih hebatnya, NumPy terintegrasi dengan bahasa pemrograman lain seperti C / C ++ dan Fortran. Fleksibilitas perpustakaan NumPy memungkinkannya untuk dengan mudah dan cepat bergabung dengan berbagai database dan tools. Lalu, kira-kira bagaimana penerapan numpy array python untuk melakukan perhitungan terkait statistik dasar. Jangan khawatir sahabat data DQLab.


Pada artikel DQLab kali ini, kita akan membahas penerapan numpy array python untuk melakukan statistik dasar dengan menghitung mean, median dan modus. Tentunya sangat mudah dan dapat dipraktikkan oleh sahabat data semua. Pastikan simak baik-baik dan keep scrolling on this article guys!


1.Mean (Rata-rata)

Mean sering disebut juga dengan simple average (atau rata-rata), simbol mean pada populasi dan untuk mean pada sampel x. Perhitungan mean sangat mudah, dengan menjumlahkan semua item dan dibagi jumlah item. Mean merupakan cara pengukuran paling umum untuk central tendency, namun ada kelemahannya. Mean sangat mudah terpengaruh jika ada nilai jauh diluar range dari set data. Dalam python, perhitungan mean atau rata-rata dapat diselesaikan dengan cukup menuliskan array pada library python (numpy) yaitu mean(numpy_array). Berikut adalah contoh perhitungan rata-rata atau mean dengan menggunakan numpy array Python. 


Perhitungan mean berdasarkan contoh diatas menghasilkan nilai 35201,8. Kalian bisa mengikuti syntax diatas untuk menghitung nilai rata-rata dari suatu data pendapatan. 


Baca juga : Belajar Data Science: Kenali Dasar Bahasa Pemrograman Python yang Cocok bagi Pemula


2.Median (Nilai Tengah)

Median biasanya disebut juga dengan angka tengah dari ordered dataset. Nilai median adalah angka pada posisi (n+1)/2. Jika nilai posisi median berupa angka floating, maka gunakan average dari posisi tersebut dan posisi sesudahnya. Contoh: Posisi median adalah 5.5, menggunakan average dari posisi 5 dan 6. Dalam python, perhitungan median atau nilai tengah dapat diselesaikan dengan cukup menuliskan array pada library python (numpy) yaitu median(numpy_array). Berikut adalah contoh perhitungan nilai tengah atau median dengan menggunakan numpy array Python.


Perhitungan median hanya cukup memasukkan syntax sesuai dengan contoh diatas, sehingga hasilnya adalah 34996,8. Kalian bisa mengikuti syntax diatas untuk menghitung nilai tengah dari suatu data pendapatan. 


Baca juga : Python : Kenali 3 Buku yang Akan Mempercepat Kamu Dalam Belajar Python


3.Mode atau Modus

Modus digunakan untuk menghitung data yang sering muncul, dapat digunakan untuk numerical atau categorical data. Modus juga mencerminkan nilai mayoritas atau nilai dengan frekuensi paling tinggi. Dengan demikian, biasanya penggunaan modus digunakan untuk menentukan sampel dari suatu populasi dalam statistika. Menghitung mode, kita perlu import library scipy. Kemudian generate dulu random data dengan menggunakan perintah random.randint() Berikut adalah contoh perhitungan mode atau modus dengan menggunakan numpy array Python.


Catatan: semua angka diatas tidak akan sama persis karena menggunakan random generator, jadi saat program dijalankan angka menghasilkan angka yang berbeda, dan hasil perhitungan akan menjadi beda


4. Yuk Mulai Belajar Menjadi Data Scientist Bersama DQLab!       


Gunakan Kode Voucher "DQTRIAL", dan simak informasi di bawah ini mendapatkan 30 Hari FREE TRIAL:

  1. Buat Akun Gratis dengan Signup di DQLab.id/signup

  2. Buka academy.dqlab.id dan pilih menu redeem voucher 

  3. Redeem voucher "DQTRIAL" dan check menu my profile untuk melihat masa subscription yang sudah terakumulasi. 

  4. Selamat, akun kamu sudah terupgrade, dan kamu bisa mulai Belajar Data Science GRATIS 1 bulan.


    Penulis : Reyvan Maulid

    Editor : Annissa Widya Davita


      Postingan Terkait

      Sign Up & Mulai Belajar Gratis di DQLab!