Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS!

Coding Python Sederhana dengan Regex

Belajar Data Science di Rumah 27-September-2023
https://dqlab.id/files/dqlab/cache/longtail-senin-01-2023-09-27-180627_x_Thumbnail800.jpg

Python punya banyak fungsi untuk melakukan manipulasi data. Salah satu fungsi yang disediakan Python dan banyak digunakan oleh kebanyakan praktisi data adalah string split Python. Memang dalam kesehariannya, seorang praktisi data perlu melakukan operasi ini untuk menyeragamkan format data yang bermacam-macam.


Mulai dari format csv, xls, tsv,  dan lain sebagainya. Maka dari itu, fungsi string split Python ini paling tidak bisa sedikit membantu dalam hal formating dan manipulasi data mereka.


Selain itu, fungsi dari string split pada bahasa pemrograman Python yaitu Sebelum melakukan analisis data, seringkali diperlukan pembersihan dan transformasi data.


String split membantu membagi string menjadi elemen-elemen terpisah berdasarkan pola tertentu, seperti spasi atau karakter pemisah khusus, sehingga memudahkan penghapusan, penggantian, atau manipulasi elemen-elemen tersebut sesuai kebutuhan.


Nah, pada artikel kali ini, kita akan membahas variasi code yang digunakan untuk melakukan operasi string split Python. Kita memakai operasi regex dalam penjelasan kali ini. Simak yuk sahabat DQLab!


1. Operasi String Split dengan Regex

Dalam konteks Python, fungsi split() digunakan untuk membagi sebuah string menjadi bagian-bagian yang lebih kecil berdasarkan pola tertentu yang diberikan. Pola ini ditentukan menggunakan ekspresi reguler (regex) yang digunakan sebagai pemisah.


Dengan menggunakan string split dengan regex, Anda dapat membagi string menjadi beberapa bagian berdasarkan pola tertentu, bukan hanya spasi atau karakter pemisah standar. Ini memberikan fleksibilitas yang lebih besar dalam pemisahan string, terutama ketika pola pemisahnya kompleks.


Berikut adalah contoh penggunaan string split dengan regex dalam Python:

Python


Baca juga : Bootcamp Data Analyst with SQL and Python


2. Membagi String dengan Menggunakan Spasi

Untuk membagi string dengan menggunakan spasi sebagai pemisah, Anda dapat menggunakan metode split() yang sudah tersedia dalam objek string di Python. Berikut adalah contoh penggunaannya:

Python


Dalam contoh ini, kami menggunakan metode split() pada objek string string tanpa memberikan argumen apapun. Ini akan secara default membagi string berdasarkan spasi. Hasilnya adalah daftar elemen-elemen yang dihasilkan setelah membagi string.


Perhatikan bahwa metode split() juga dapat menerima argumen opsional, seperti karakter pemisah khusus jika Anda ingin menggunakan pemisah selain spasi. Misalnya, jika Anda ingin membagi string berdasarkan tanda koma, Anda dapat menggunakan split(",").


3. Membagi String dengan Menggunakan Tanda Baca

Untuk membagi string dengan menggunakan tanda baca sebagai pemisah, Anda dapat menggunakan modul re (modul ekspresi reguler) dalam Python. Berikut adalah contoh penggunaannya:

Python


Dalam contoh ini, kami menggunakan fungsi re.split() untuk membagi string string berdasarkan tanda baca [,.!?]. Pola [,.!?] akan mencocokkan setiap karakter koma, titik, tanda seru, atau tanda tanya sebagai pemisah. Hasilnya adalah daftar elemen-elemen yang dihasilkan setelah membagi string.


Anda dapat menyesuaikan pola regex sesuai dengan kebutuhan Anda. Misalnya, jika Anda ingin memasukkan karakter tanda hubung sebagai pemisah juga, Anda dapat menggunakan pola [,.!?-]. Anda dapat menambahkan karakter tanda baca tambahan ke dalam kurung kotak sesuai kebutuhan Anda.


Baca juga : Mengenal Perbedaan R Python dan SQL


4. Membagi String dengan Pola yang Lebih Kompleks

Jika Anda ingin membagi string dengan menggunakan pola yang lebih kompleks, Anda dapat menggunakan modul re (modul ekspresi reguler) dalam Python. Berikut adalah contoh penggunaannya:

Python


Dalam contoh ini, kami menggunakan fungsi re.split() untuk membagi string string berdasarkan pola [,s!]. Pola ini akan mencocokkan tanda koma, spasi, dan tanda seru sebagai pemisah. Hasilnya adalah daftar elemen-elemen yang dihasilkan setelah membagi string.


Anda dapat menyesuaikan pola regex sesuai dengan kebutuhan Anda. Misalnya, jika Anda ingin memasukkan karakter tanda baca tambahan atau karakter khusus lainnya sebagai pemisah, Anda dapat menambahkannya ke dalam kurung kotak []. Anda juga dapat menggunakan karakter escape untuk mencocokkan karakter spesial, seperti . atau ?.


Hai sahabat DQ, ingin jago dalam bahasa pemrograman Python? Atau bingung buat pilih bootcamp yang cocok dengan kebutuhan, kesibukan, dan ingin belajar lebih lanjut?.


Kalian bisa belajar melalui program Bootcamp Live Class yang disediakan oleh DQLab. Live Class adalah salah satu metode pembelajaran paling tepat yang ditawarkan DQLab agar Sahabat DQ bisa mulai belajar Python.


Tidak hanya Python, bahkan di sini kalian juga bisa belajar SQL yang juga menunjang pemahaman kalian di bidang Data Science. Apa saja manfaat mengikuti Live Class ini?

  • Variatif dan komplit. Variatif karena terdiri dari kelas pemula sampai advance. Komplit karena tidak hanya belajar teori tapi juga praktik. 

  • Materi dan rekaman dapat diakses selamanya.

  • Mendapatkan dukungan dari awal. Live Class memberikan kelas persiapan untuk memastikan kalian siap mengikuti kelas

  • Dibimbing dengan mentor berpengalaman.

  • Mendapatkan komunitas baru yang saling mendukung.


Tunggu apalagi? Yuk segera daftarkan diri kalian atau Sign Up dan nikmati semua manfaat di atas dan ikuti Bootcamp Data Analyst with SQL and Python!


Penulis: Reyvan Maulid




Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login