5 Jenis String Split untuk Jago Python!

String split adalah salah satu operasi penting dalam pemrograman Python yang digunakan untuk membagi sebuah string menjadi potongan-potongan yang lebih kecil berdasarkan pemisah tertentu. Pemahaman yang baik tentang berbagai jenis string split sangat penting bagi para pemula dalam pemrograman Python.
Dengan pemahaman yang baik tentang jenis-jenis string split Python, SahabatDQ akan dapat memanfaatkannya dalam pengolahan teks, analisis data, dan berbagai tugas pemrograman lainnya. Mari kita mulai belajar setiap jenis string split dan melihat contoh-contoh praktisnya. Jangan lupa untuk ikut praktik juga, ya!
1. Split Berdasarkan Spasi
Split berdasarkan spasi menggunakan fungsi split() tanpa argumen yang akan membagi sebuah string menjadi potongan-potongan berdasarkan spasi yang ditemukan. Cara ini adalah pemisah default yang digunakan jika tidak ada pemisah yang ditentukan. Misalkan kita memiliki string berikut:
Outputnya akan seperti ini.
Di contoh di atas, string "Selamat belajar di DQLb" dibagi menjadi empat potongan berdasarkan spasi yang ada di antara kata-kata. Setiap potongan tersebut kemudian disimpan dalam sebuah daftar. Ketika menggunakan split() tanpa argumen, karakter spasi, tab, dan karakter newline (baris baru) dianggap sebagai pemisah.
Jadi, jika ada spasi di antara kata-kata dalam string, maka string tersebut akan dibagi menjadi potongan-potongan sesuai dengan setiap spasi yang ada. Dengan menggunakan split() berdasarkan spasi, kita dapat memecah string menjadi kata-kata individu, yang kemudian dapat digunakan untuk pemrosesan lebih lanjut, seperti analisis teks atau penghitungan frekuensi kata.
Baca juga : Tips Coding Python Sederhana untuk Pemula
2. Split Berdasarkan Karakter Khusus
Split berdasarkan karakter khusus menggunakan fungsi split() dengan argumen separator yang akan membagi sebuah string menjadi potongan-potongan berdasarkan karakter khusus yang ditentukan sebagai pemisah. Misalkan kita memiliki string berikut:
Jika kita ingin membagi string tersebut berdasarkan karakter "|" sebagai pemisah, kita dapat menggunakan split() dengan karakter "|" sebagai argumen separator, seperti ini:
Fungsi split('|') akan membagi string menjadi potongan-potongan berdasarkan karakter "|" yang ditemukan. Hasilnya adalah sebuah daftar yang berisi potongan-potongan string tersebut.
Dengan menggunakan split() berdasarkan karakter khusus, kita dapat memisahkan bagian-bagian dalam string berdasarkan karakter tertentu, seperti pemisah yang telah ditentukan di atas. Hal ini dapat digunakan untuk memproses data yang memiliki format terstruktur, seperti parsing data CSV atau TSV, mengambil bagian-bagian tertentu dari string, dan lain sebagainya.
3. Split Berdasarkan Newline
Split berdasarkan newline (baris baru) menggunakan fungsi split() dengan argumen ' ' akan membagi sebuah string menjadi potongan-potongan berdasarkan karakter newline yang ditemukan. Contohnya string berikut.
Pada contoh di atas, string "Belajar Python bagi Pemula" dibagi menjadi dua potongan berdasarkan karakter newline ( ) yang ada di antara kata-kata. Setiap potongan tersebut kemudian disimpan dalam sebuah daftar. Hasilnya adalah daftar yang berisi dua bagian yang dipisahkan berdasarkan baris baru.
Dengan menggunakan split() berdasarkan newline, kita dapat memisahkan string menjadi bagian-bagian yang terpisah berdasarkan baris-barisnya. Ini berguna ketika kita ingin memproses teks yang memiliki baris-baris terpisah, seperti membaca isi dari file teks yang dibagi menjadi beberapa baris, pemrosesan data dari output per baris, dan sejenisnya.
Baca juga : Array Python : Array VS List Serupa Namun Tak Sama, Yuk, Kenali Perbedaannya
4. Split dengan Pembatasan Jumlah Pembagian
Split dengan pembatasan jumlah pembagian menggunakan fungsi split() dengan argumen maxsplit memungkinkan kalian untuk membatasi jumlah pembagian yang dilakukan. Setelah mencapai batas tersebut, string sisanya akan tetap utuh. Misalnya string berikut.
Jika kita ingin membagi string tersebut dengan membatasi pembagian hanya dua kali, kita dapat menggunakan split() dengan argumen maxsplit=2, seperti ini:
Fungsi split('-', 2) akan membagi string string menjadi potongan-potongan menggunakan karakter - sebagai pemisah, namun dengan batasan maksimal pembagian sebanyak 2 kali. Hasilnya adalah sebuah daftar yang berisi potongan-potongan string tersebut.
Di contoh di atas, string "a-b-c-d-e" dibagi menjadi tiga potongan berdasarkan karakter -. Namun, karena kita membatasi pembagian hanya dua kali (maxsplit=2), maka string yang tersisa setelah dua pembagian pertama ("a" dan "b") tetap utuh dan tidak dibagi lebih lanjut. Hasilnya adalah daftar yang berisi tiga bagian: "a", "b", dan "c-d-e".
5. Split Mengikuti Pola Regex
Split mengikuti pola regular expression (regex) menggunakan fungsi split() dari modul re di Python. Dengan menggunakan pola regex sebagai pemisah, kita dapat melakukan pemisahan string berdasarkan pola yang lebih kompleks. Untuk menggunakan split dengan pola regex, pertama-tama kita perlu mengimpor modul re. Kemudian, kita dapat menggunakan fungsi re.split() dengan pola regex yang ditentukan sebagai argumen pertama, dan string yang akan dibagi sebagai argumen kedua.
Jika kita ingin membagi string tersebut berdasarkan karakter non-alphanumerik (,, -, ., ;) menggunakan pola regex, kita dapat menggunakan re.split() dengan pola regex [^w] sebagai pemisah, seperti ini:
Pola regex [^w] menggambarkan karakter non-alphanumerik. Fungsi re.split() akan membagi string string berdasarkan pola regex tersebut. Hasilnya adalah sebuah daftar yang berisi potongan-potongan string.
Di contoh di atas, string "1,2-3.4;5" dibagi menjadi lima potongan berdasarkan karakter non-alphanumerik (,, -, ., ;). Setiap potongan tersebut kemudian disimpan dalam sebuah daftar.
Masih banyak lagi bentuk-bentuk manipulasi string yang bisa kalian lakukan selain split string. Karena string salah satu data yang sering digunakan dalam bidang apapun. Sehingga penting bagi Sahabat DQ untuk mengenal lebih dalam proses manipulasi lainnya. Nah, website DQLab sangat membantu kalian untuk belajar proses manipulasi data, loh. DQLab menggunakan metode HERO yaitu Hands-On, Experiential Learning & Outcome-based, yang dirancang ramah untuk pemula.
Taukah kalian kalau DQLab juga merupakan program belajar online pertama yang mengintegrasikan modulnya dengan ChatGPT? Dengan ini, proses belajar menjadi lebih menyenangkan karena:
Membantu kalian menjelaskan lebih detail code yang sedang dipelajari
Membantu menemukan code yang salah atau tidak sesuai
Memberikan solusi atas problem yang dihadapi pada code
Membantu kalian belajar kapanpun dan dimanapun
Yuk, segera Sign Up dan kembangkan kemampuan kalian menggunakan Python!
Penulis : Dita Feby
Editor : Annissa Widya
Postingan Terkait
Menangkan Kompetisi Bisnis dengan Machine Learning
Pentingnya Machine Learning dalam Industri Bisnis
Mulai Karier
sebagai Praktisi Data
Bersama DQLab
Daftar sekarang dan ambil langkah pertamamu untuk mengenal Data Science.