PROMO PUNCAK LEBARAN DISKON 99%
Belajar Data Science 6 Bulan BERSERTIFIKAT hanya Rp 99K!

1 Hari 8 Jam 9 Menit 25 Detik

Analisa Data Menggunakan Python untuk Menghindari Repetitif Task

Belajar Data Science di Rumah 01-September-2020
https://dqlab.id/files/dqlab/cache/ea39d49ade72ecc44b12b20f5cfb75df_x_Thumbnail800.jpg

Dalam menyelesaikan pekerjaan sehari-hari, kita akan sering menggunakan microsoft excel khususnya ketika mengerjakan pekerjaan yang berkaitan dengan data. Microsoft Excel merupakan software mendasar yang digunakan oleh banyak pekerja ketika ingin memulai bekerja dengan data nya, baik itu untuk merapikan, memvisualisasikan, maupun menganalisis data nya tersebut. Namun, seringkali terdapat pekerjaan yang sifatnya repetitif, berulang-ulang, membosankan, dan menghabiskan waktu. Dalam mengerjakannya bahkan kita sempat berpikir, "adakah cara yang lebih efektif dan efisien untuk menyelesaikan pekerjaan semacam ini?". Jika kamu pernah bertanya hal serupa, maka jawabannya adalah ADA!

Dengan menggunakan Python Programming, kita dapat mengotomatisasi beberapa pekerjaan repetitif dalam Ms. Excel dengan mudah loh! Beberapa pekerjaan seperti membuat formula yang sama terhadap puluhan file Excel yang berbeda, mendapatkan atau mencari nilai tertentu dalam file-file Excel yang serupa, dan berbagai pekerjaan repetitif lainnya. Pada kesempatan kali ini, DQLab akan berbagi 3 contoh pekerjaan repetitif yang dapat diotomatisasi menggunakan Python Programming dan bagaimana melakukannya. Yuk simak penjelasannya!

1.Menggabungkan Beberapa File Excel

Pada banyak kasus seringkali kita diharuskan untuk menggabungkan dua atau lebih file excel menjadi satu. Secara manual kita dapat membuka setiap file satu per satu, kemudian meng-copy setiap file dan digabungkan ke dalam file yang baru. Bayangkan jika terdapat puluhan file yang harus digabungkan, maka pekerjaan seperti ini akan menghabiskan banyak waktu dan tenaga, yang jika dimanfaatkan dapat mengerjakan banyak pekerjaan lainnya. Oleh karena itu, kita menggunakan Python Programming untuk mengotomatisasi pekerjaan ini. Bagaimana caranya? Perhatikan Codingan berikut!


Gambar 1 : Menggabungkan File Excel Menggunakan Python

Pada contoh di atas semisal kita telah memiliki 3 file excel yang semuanya tersimpan di dalam akun github kita. Kemudian link dari ke-3 file tersebut hanya perlu kita copy, kemudian kita masukkan ke dalam satu list. List tersebut kemudian di-assign ke dalam satu variabel, dalam hal ini dinamakan variabel "files". Masih dalam section yang sama, kita membuat suatu data frame kosong bernama "combined" yang nantinya akan diisi dengan data gabungan dari ke-3 file ini.

Kemudian, pada section 2, kita membuat suatu pengulangan (for loop) untuk mengakses setiap file excel di dalam variabel files tadi. Menggunakan Library Pandas, kita membaca setiap file dalam variabel files, melewati 3 row pertama (bisa berbeda pada setiap kasus), kemudian kita namakan file yang sudah dibaca tersebut sebagai df. Setelah dinamakan sebagai df, df akan di-append atau ditambahkan atau dimasukkan ke dalam data frame kosong yang sudah kita sediakan sebelumnya yang bernama combined. Terakhir, pada section 3 kita membuat file excel baru bernama "combined.xlsx" yang berisi data frame "combined" yang telah berisi gabungan ke 3 file excel sebelumnya.

Baca Juga : Belajar Data Science Secara Otodidak? Berikut langkah-langkahnya!

2. Mendapatkan Nilai Tertentu Dari Berbagai File Excel

Semisal kita butuh mendapatkan suatu nilai tertentu dari berbagai excel file, dan harus membuka file nya satu persatu, scrolling down dan mencari posisi nilai tersebut kemudian baru kita menyalin nya. Tentu proses ini sangat memakan waktu dan sangat mungkin untuk diotomatisasi. Bagaimana caranya? Simak penjelasan berikut!


Gambar 2 : Mengambil nilai tertentu dari berbagai file Excel

Pertama, kita membutuhkan suatu library khusus bernama "openpyxl". Library ini tidak built-in di dalam python, sehingga apabila ini kali pertama kamu menggunakannya kamu harus menginstall nya terlebih dahulu. Kamu bisa menggunakan "pip install openpyxl" atau "conda install openpyxl". Setelah kamu install, kamu bisa langsung mulai mengimport nya seperti pada codingan di atas.

Kemudian, hal pertama yang harus kita lakukan adalah menyalin path dari ke-3 data yang ingin kita ambil nilai nya ke dalam list files. Sehingga, sebelum itu kita sudah harus memastikan bahwa file tersebut tersimpan di laptop atau PC yang kita gunakan. Lalu, pada section dua, kita melakukan iterasi kembali terhadap seluruh file, kemudian menggunakan openpyxl kita akan menamai file dengan nama wb (workbook). Dengan demikian, kita dapat mengakses sheet tertentu dan nilai tertentu di dalam file tersebut. Kemudian kita hanya perlu mendefinisikan sheet yang mana yang kita ingin ambil nilai darinya, kemudian dalam sheet tersebut, value yang mana yg ingin kita ambil. Kemudian setiap value itu dimasukkan ke dalam list kosong yang bernama values. Sehingga kita sudah mendapatkan suatu variabel bernama "values" yang berisi list nilai-nilai tertentu yang kita butuhkan dari berbagai file excel tanpa perlu membuka file nya sama sekali.

3. Membuat Formula dan Mengaplikasikannya Pada Berbagai File Excel

Terkadang dalam beberapa file Excel yang berbeda, kita harus memasukkan formula yang sama. Semisal, kita memiliki data penjualan bulanan tiap bulan selama satu tahun. Kemudian kita ingin menambah nilai total penjualan di setiap bulannya. Kita bisa saja membuka satu persatu file Excel yang berisi data penjualan tiap bulan dan baru kemudian kita masukkan formula yang kita inginkan satu per satu. Tapi untuk apa melakukannya jika kita bisa "menyuruh" Python mengerjakan tugas itu? Pertanyaannya, bagaimana cara "menyuruh" python untuk melakukannya? Perhatikan penjelasan berikut!


Gambar 3 : Mengaplikasikan Formula Pada Berbagai File Excel

Pada code di atas, pertama, lagi-lagi kita harus memasukkan path setiap file Excel yang kita inginkan ke dalam list yang bernama files. Kemudian kita menggunakan for loop untuk mengiterasi dan mengakses setiap file tersebut. Lalu, kembali menggunakan openpyxl, kita membaca data dalam file excel, kemudian mengakses nilai pada sheet tertentu. Setelah mendapatkan sheet yg kita butuhkan dan lokasi yg kita ingin formula kita diaplikasikan di dalamnya, kita kemudian memasukkan formula tersebut.

Sebagai tambahan, karena dalam konteks ini formula yang kita buat adalah total penjualan, karenanya style dari value itu dispesifikasikan menjadi "Currency". Terakhir, kita save data tersebut. Itu 3 cara mengotomatisasi pekerjaan-pekerjaan repetitif dalam excel menggunakan python. Jika kamu ingin mengetahui lebih lanjut mengenai openpyxl, kamu bisa mempelajari dan membaca dokumentasi dari library nya di sini.

Baca Juga : Ingin menjadi Data Engineer? Berikut 3 Hal Esensial Yang Harus Kamu Kuasai


4. Yuk Pelajari Python Programming Bersama DQLab dan Otomatisasi Pekerjaan Lainnya!

Bagaimana teman-teman? Tertarik untuk mengotomatisasi pekerjaan-pekerjaan kalian menggunakan python? Contoh di atas baru 3 contoh sederhana, masih banyak contoh penggunaan python untuk mengotomatisasi pekerjaan repetitif lainnya loh! Karenanya, python sangat bermanfaat dan banyak digunakan oleh professionals. Kabar baiknya, kamu bisa mulai belajar python dari nol bersama DQLab!


Sign Up untuk nikmati module GRATIS "Introduction to Data Science" dengan pengalaman belajar yang seru menyenangkan serta aplikatif pada industri nyata! Untuk kamu yang ingin mulai belajar Data Science atau siap berkarir jadi Data Analyst, Data Scientist, dan Data Engineer, persiapkan diri kamu dengan tepat sekarang. Tidak ada kata terlambat untuk belajar. Yuk #MulaiBelajarData di DQLab.

Dengan belajar di DQLab, kamu bisa:

  • Menerapkan teknik mengolah data kotor, hasilkan visualisasi data dan model prediksi dengan studi kasus Retail dan Finansial

  • Dapatkan sesi konsultasi langsung dengan praktisi data lewat data mentoring

  • Bangun portofolio data langsung dari praktisi data Industri

  • Akses Forum DQLab untuk berdiskusi.

Simak informasi di bawah ini untuk mengakses gratis module "Introduction to Data Science":

  1. Buat Akun Gratis dengan Signup di DQLab.id/signup

  2. Akses module Introduction to Data Science

  3. Selesaikan modulenya, dapatkan sertifikat & reward menarik dari DQLab

Penulis : Jihar Gifari

Editor : Annissa Widya Davita

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login