Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS

Cara Mudah Split String N Karakter di Python

Belajar Data Science di Rumah 08-Desember-2022
https://dqlab.id/files/dqlab/cache/fe28b24cf3a7a3bfb56781b2350cd440_x_Thumbnail800.jpeg

Seorang data scientist tentunya melakukan banyak proses pengolahan data agar diperoleh informasi yang bermakna. Salah satu proses yang sering dilakukan adalah manipulasi data. Dikarenakan data scientist mendapatkan data dari beragam sumber, sangat mungkin data tersebut memiliki bentuk format yang beragam pula. Proses ini tentunya membutuhkan waktu yang cukup lama untuk merapikan. Python dapat digunakan untuk membantu data scientist melakukan proses tersebut agar lebih efektif dan efisien.


Teknik pengolahan data yang sering dilakukan oleh praktisi data adalah split string. String merupakan salah satu data yang hampir selalu memiliki format yang beragam. Ini karena input string tidak memiliki standar tertentu seperti halnya angka. Misal string memiliki karakter huruf besar dan kecil. 


Memiliki jenis karakter atau lambang sepertinya ‘dan’ atau ‘&’. Bahkan terkadang human error juga dapat terjadi. Seperti halnya kasus tidak memasukkan spasi pada suatu string juga membuat data berantakan. Kali ini, kalian akan mempelajari bagaimana cara split string sesuai kebutuhan dengan mudah. Kode yang dibutuhkan pun tidak terlalu panjang. Perhatikan penjelasan lengkap berikut ini!


1. Apa Itu String?

String adalah salah satu tipe data yang ada di Python yang memuat satu karakter atau lebih dengan ciri khas yaitu diapit oleh tanda petik. String pada Python dapat dideklarasikan dengan tanda petik tunggal (‘) atau tanda petik ganda (“). Berikut contoh sederhana penulisan string pada Python.


Python


Cara menampilkan string sebagai output adalah dengan menggunakan sintaks print(). Kalian bisa secara langsung menuliskan print(‘Hello World’) seperti berikut.


Python


Kalian juga bisa menampilkan string dengan menampungnya ke dalam variabel terlebih dahulu. Perhatikan contoh berikut.


Python


Jika ditampung dalam suatu variabel, maka print memanggil string dengan menyebutkan variabel tersebut. Contoh di atas, karena string ditampung dalam variabel x, maka langsung saja ketik print(x).


Baca juga : Yuk Cari Tahu Perbedaan Python R dan SQL


2. Operasi Pada String

String juga bisa dioperasikan secara komputasi seperti halnya data numerik. Namun, tentu hasilnya akan berbeda. Misalnya, pada operasi penjumlahan (+). Operator ini jika digunakan pada string tidak digunakan untuk menjumlahkan nilai suatu karakter, namun untuk menggabungkan. Perhatikan contoh berikut.


Python


Diketahui variabel a dan variabel b yang menampung masing-masing spesifik string. Kemudian c adalah variabel yang melakukan operasi a + b. Jika kalian print() variabel c maka akan diperoleh penggabungan dari masing-masing string.


Kita coba untuk jenis operator lainnya, misalkan perkalian.


Python


Dari gambar di atas, diketahui variabel i yang menampung suatu string. Kemudian terdapat variabel k yang menampung operasi perkalian i dengan angka 3. Outputnya berupa string yang tertulis berulang sebanyak 3 kali. Namun, operasi perkalian tentunya tidak bisa digunakan pada perkalian antar string seperti berikut.


Python


Hal ini jelas karena string tidak mungkin menghasilkan nilai tertentu jika dilakukan perkalian. Hal yang sama untuk operator pengurangan, dan operator lainnya yang secara logika tidak mungkin bisa diterapkan pada string.


Python


3. Index dan Range Slice Pada String

Seperti penjelasan di atas, suatu string dapat ditampung dalam variabel. Variabel ini menyimpan suatu input dalam bentuk barisan karakter. Artinya, kalian bisa mengakses karakter tertentu yang diinginkan dengan melakukan index string. Index string menggunakan bilangan bulat dari 0. Cara mengakses karakter dengan index string adalah:


Python


Perhatikan contoh berikut supaya lebih jelas.


Python


Index string pada Python dimulai dengan bilangan bulat 0. Dari contoh di atas, jika kalian ingin mengakses karakter pertama pada suatu string yang tertampung pada variabel x, maka gunakan print(x[0]). Sehingga bisa disebutkan bahwa pada contoh di atas, variabel x memuat string ‘Python’ dengan x[1] = y, x[2] = t, dan seterusnya.


Baca juga : Mengenal Perbedaan R Python dan SQL


4. Split String N Karakter

Terkadang dalam proses manipulasi data, kalian juga memerlukan untuk split string menjadi N karakter setiap substringnya. Seperti contoh berikut ini.


Python


Dari contoh tersebut, dimisalkan terdapat input suatu string. Kemudian diharapkan suatu output substring dengan masing-masing berisi 4 karakter. Sahabat DQ bisa melakukan ini dengan memadukan konsep list dan iterasi. Perhatikan langkah-langkah berikut ini.


Python


Pertama, tentukan string yang ingin diubah menjadi beberapa substring. Selanjutnya definisikan jumlah karakter yang diinginkan. Kemudian padukan konsep list dan for loop. Akan lebih dijelaskan dengan detail maksud coding berikut ini.


Python


Sintaks untuk melakukan split string pada contoh di atas adalah string[i:i+n] dimana secara umum, sintaksnya adalah name[start : stop : step].

  • Nilai pada start bersifat inclusive artinya angka yang dituliskan merupakan angka yang mendefinisikan dimulainya split string.

  • Nilai pada stop bersifat exclusive (mendekati, atau tidak memuat). Artinya angka yang dituliskan tidak merupakan angka yang mendefinisikan berhentinya split string. Tapi justru berhenti sebelum angka tersebut. 

  • Perhatikan pada contoh di atas digunakan i + n, atau stop dilakukan dengan nilai yang sama dari penjumlahan index start dengan jumlah karakter yang diinginkan. Pada kasus di atas, split akan berhenti setiap 3 karakter.


Bagaimana jika suatu string yang diinputkan tidak tepat habis dibagi sesuai jumlah karakter yang diinginkan? Contoh di atas kebetulan memiliki 12 karakter yang akan dipecah dengan kondisi setiap substring berisi 3 karakter. Berikut contoh jika panjang karakter tidak habis dibagi jumlah karakter yang diinginkan.


Python


Dapat dilihat bahwa substring terakhir berisi sisa karakter yang ada. Sehingga jumlahnya akan berbeda dari substring sebelumnya. 


Masih banyak lagi bentuk-bentuk manipulasi string yang bisa kalian lakukan selain split string. Karena string salah satu data yang sering digunakan dalam bidang apapun. Sehingga penting bagi Sahabat DQ untuk mengenal lebih dalam proses manipulasi lainnya. Nah, website DQLab sangat membantu kalian untuk belajar proses manipulasi data, loh. Modul pembelajaran yang lengkap, mudah dipahami karena dilengkapi contoh, Live Code Editor yang bisa langsung digunakan tanpa harus install aplikasi lagi menjadikan proses belajar kalian lebih menyenangkan. Kalian bisa coba modul gratisnya juga, nih. 


Python


Yuk, segera Sign Up dan kembangkan kemampuan kalian menggunakan Python! 


Penulis : Dita Feby 

Editor : Annissa Widya  

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login