SAVETEMBER HEMAT MAKSIMAL! DISC. 95%
Belajar Data 6 Bulan HANYA Rp. 149K!
0 Hari 1 Jam 59 Menit 27 Detik

5 Jenis String Split untuk Jago Python!

Belajar Data Science di Rumah 16-Juni-2023
https://dqlab.id/files/dqlab/cache/b1033aa0-79ee-4f1f-8fa3-c1336eb9c881-2023-06-16-124638_x_Thumbnail800.jpeg

String split adalah salah satu operasi penting dalam pemrograman Python yang digunakan untuk membagi sebuah string menjadi potongan-potongan yang lebih kecil berdasarkan pemisah tertentu. Pemahaman yang baik tentang berbagai jenis string split sangat penting bagi para pemula dalam pemrograman Python.


Dengan pemahaman yang baik tentang jenis-jenis string split Python, SahabatDQ akan dapat memanfaatkannya dalam pengolahan teks, analisis data, dan berbagai tugas pemrograman lainnya. Mari kita mulai belajar setiap jenis string split dan melihat contoh-contoh praktisnya. Jangan lupa untuk ikut praktik juga, ya!


1. Split Berdasarkan Spasi

Split berdasarkan spasi menggunakan fungsi split() tanpa argumen yang akan membagi sebuah string menjadi potongan-potongan berdasarkan spasi yang ditemukan. Cara ini adalah pemisah default yang digunakan jika tidak ada pemisah yang ditentukan. Misalkan kita memiliki string berikut:

Data Engineer

Outputnya akan seperti ini.

Data Engineer

Di contoh di atas, string "Selamat belajar di DQLb" dibagi menjadi empat potongan berdasarkan spasi yang ada di antara kata-kata. Setiap potongan tersebut kemudian disimpan dalam sebuah daftar. Ketika menggunakan split() tanpa argumen, karakter spasi, tab, dan karakter newline (baris baru) dianggap sebagai pemisah. 


Jadi, jika ada spasi di antara kata-kata dalam string, maka string tersebut akan dibagi menjadi potongan-potongan sesuai dengan setiap spasi yang ada. Dengan menggunakan split() berdasarkan spasi, kita dapat memecah string menjadi kata-kata individu, yang kemudian dapat digunakan untuk pemrosesan lebih lanjut, seperti analisis teks atau penghitungan frekuensi kata.


Baca juga : Tips Coding Python Sederhana untuk Pemula


2. Split Berdasarkan Karakter Khusus

Split berdasarkan karakter khusus menggunakan fungsi split() dengan argumen separator yang akan membagi sebuah string menjadi potongan-potongan berdasarkan karakter khusus yang ditentukan sebagai pemisah. Misalkan kita memiliki string berikut:

Data Engineer

Jika kita ingin membagi string tersebut berdasarkan karakter "|" sebagai pemisah, kita dapat menggunakan split() dengan karakter "|" sebagai argumen separator, seperti ini:

Data Engineer

Fungsi split('|') akan membagi string menjadi potongan-potongan berdasarkan karakter "|" yang ditemukan. Hasilnya adalah sebuah daftar yang berisi potongan-potongan string tersebut.

Data Engineer

Dengan menggunakan split() berdasarkan karakter khusus, kita dapat memisahkan bagian-bagian dalam string berdasarkan karakter tertentu, seperti pemisah yang telah ditentukan di atas. Hal ini dapat digunakan untuk memproses data yang memiliki format terstruktur, seperti parsing data CSV atau TSV, mengambil bagian-bagian tertentu dari string, dan lain sebagainya.


3. Split Berdasarkan Newline

Split berdasarkan newline (baris baru) menggunakan fungsi split() dengan argumen ' ' akan membagi sebuah string menjadi potongan-potongan berdasarkan karakter newline yang ditemukan. Contohnya string berikut.

Data Engineer

Pada contoh di atas, string "Belajar Python bagi Pemula" dibagi menjadi dua potongan berdasarkan karakter newline ( ) yang ada di antara kata-kata. Setiap potongan tersebut kemudian disimpan dalam sebuah daftar. Hasilnya adalah daftar yang berisi dua bagian yang dipisahkan berdasarkan baris baru.

Data Engineer

Dengan menggunakan split() berdasarkan newline, kita dapat memisahkan string menjadi bagian-bagian yang terpisah berdasarkan baris-barisnya. Ini berguna ketika kita ingin memproses teks yang memiliki baris-baris terpisah, seperti membaca isi dari file teks yang dibagi menjadi beberapa baris, pemrosesan data dari output per baris, dan sejenisnya.


Baca juga : Array Python : Array VS List Serupa Namun Tak Sama, Yuk, Kenali Perbedaannya


4. Split dengan Pembatasan Jumlah Pembagian

Split dengan pembatasan jumlah pembagian menggunakan fungsi split() dengan argumen maxsplit memungkinkan kalian untuk membatasi jumlah pembagian yang dilakukan. Setelah mencapai batas tersebut, string sisanya akan tetap utuh. Misalnya string berikut.

Data Engineer

Jika kita ingin membagi string tersebut dengan membatasi pembagian hanya dua kali, kita dapat menggunakan split() dengan argumen maxsplit=2, seperti ini:

Data Engineer

Fungsi split('-', 2) akan membagi string string menjadi potongan-potongan menggunakan karakter - sebagai pemisah, namun dengan batasan maksimal pembagian sebanyak 2 kali. Hasilnya adalah sebuah daftar yang berisi potongan-potongan string tersebut.

Data Engineer

Di contoh di atas, string "a-b-c-d-e" dibagi menjadi tiga potongan berdasarkan karakter -. Namun, karena kita membatasi pembagian hanya dua kali (maxsplit=2), maka string yang tersisa setelah dua pembagian pertama ("a" dan "b") tetap utuh dan tidak dibagi lebih lanjut. Hasilnya adalah daftar yang berisi tiga bagian: "a", "b", dan "c-d-e".


5. Split Mengikuti Pola Regex

Split mengikuti pola regular expression (regex) menggunakan fungsi split() dari modul re di Python. Dengan menggunakan pola regex sebagai pemisah, kita dapat melakukan pemisahan string berdasarkan pola yang lebih kompleks. Untuk menggunakan split dengan pola regex, pertama-tama kita perlu mengimpor modul re. Kemudian, kita dapat menggunakan fungsi re.split() dengan pola regex yang ditentukan sebagai argumen pertama, dan string yang akan dibagi sebagai argumen kedua.

Data Engineer

Jika kita ingin membagi string tersebut berdasarkan karakter non-alphanumerik (,, -, ., ;) menggunakan pola regex, kita dapat menggunakan re.split() dengan pola regex [^w] sebagai pemisah, seperti ini:

Data Engineer

Pola regex [^w] menggambarkan karakter non-alphanumerik. Fungsi re.split() akan membagi string string berdasarkan pola regex tersebut. Hasilnya adalah sebuah daftar yang berisi potongan-potongan string.

Data Engineer

Di contoh di atas, string "1,2-3.4;5" dibagi menjadi lima potongan berdasarkan karakter non-alphanumerik (,, -, ., ;). Setiap potongan tersebut kemudian disimpan dalam sebuah daftar.


Masih banyak lagi bentuk-bentuk manipulasi string yang bisa kalian lakukan selain split string. Karena string salah satu data yang sering digunakan dalam bidang apapun. Sehingga penting bagi Sahabat DQ untuk mengenal lebih dalam proses manipulasi lainnya. Nah, website DQLab sangat membantu kalian untuk belajar proses manipulasi data, loh. DQLab menggunakan metode HERO yaitu Hands-On, Experiential Learning & Outcome-based, yang dirancang ramah untuk pemula. 


Taukah kalian kalau DQLab juga merupakan program belajar online pertama yang mengintegrasikan modulnya dengan ChatGPT? Dengan ini, proses belajar menjadi lebih menyenangkan karena:

  • Membantu kalian menjelaskan lebih detail code yang sedang dipelajari

  • Membantu menemukan code yang salah atau tidak sesuai

  • Memberikan solusi atas problem yang dihadapi pada code

  • Membantu kalian belajar kapanpun dan dimanapun

Yuk, segera Sign Up dan kembangkan kemampuan kalian menggunakan Python! 


Penulis : Dita Feby 

Editor : Annissa Widya 


Mulai Karier
sebagai Praktisi Data
Bersama DQLab

Daftar sekarang dan ambil langkah pertamamu untuk mengenal Data Science.

Buat Akun Gratis Dengan :

https://dqlab.id/files/dqlab/file/data-web-1/data-user-2/50040333a3a5d46bf130664e5870ebc6/8be7fae4b69abead22aa9296bcab7b4b.jpg Sign-Up dengan Google

https://dqlab.id/files/dqlab/file/data-web-1/data-user-2/50040333a3a5d46bf130664e5870ebc6/d0aa879292fb427c0978d2a12b416e98.jpg Sign-Up dengan Facebook

Atau Buat Dengan :