SUPER 6.6 SALE! DISKON 96%
Belajar Data Science 6 Bulan hanya 120K!

0 Hari 5 Jam 18 Menit 9 Detik

Suka Main TikTok? Ini Algoritma yang Digunakan

Belajar Data Science di Rumah 21-Agustus-2023
https://dqlab.id/files/dqlab/cache/longtail-senin-05-2-2023-08-21-203723_x_Thumbnail800.jpg

Di balik kepopulerannya, TikTok mengandalkan berbagai algoritma data science yang mendukung pengalaman pengguna agar sesuai preferensi mereka. Penasaran bagaimana sosial media satu ini bisa memanjakan kalian semua? Dalam artikel ini, kita akan pelajari berbagai algoritma yang digunakan oleh TikTok, yang memungkinkan platform ini menyajikan konten yang relevan, mengenali wajah dan objek, melakukan penyaringan konten, dan bahkan memetakan lokasi. 


Untuk mempermudah pemahaman kalian, akan dijelaskan empat algoritma data science dasarnya. Mulai dari content-based filtering sampai geocoding. Semua algoritma ini punya peran tertentu. Apa ya fungsi masing-masing tersebut? Daripada penasaran, yuk langsung simak pembahasannya!


1. Content-Based Filtering

Sumber gambar: https://www.lavivienpost.com/


Kalian pasti sering mendapatkan rekomendasi video yang sesuai dengan histori like, tontonan, atau komentar yang pernah kalian lakukan ketika main TikTok, kan? Nah algoritma yang digunakan untuk melakukannya disebut dengan Content-Based Filtering. Algoritma ini merupakan salah satu teknik dalam sistem rekomendasi yang menggunakan informasi dari aktivitas yang dilakukan oleh pengguna. Cara kerjanya dengan menganalisis fitur atau atribut dari item yang disukai, lalu dicocokkan dengan item lain untuk menentukan seberapa mirip satu sama lain.

Di konteks TikTok, Content-Based Filtering dapat diterapkan dengan cara berikut:

  • Ekstraksi Fitur: Pertama, fitur-fitur yang relevan dari video atau konten yang sudah disukai akan diekstrak dulu. Misalnya dari judul, deskripsi, tag, atau kategori video, serta fitur visualisasinya seperti warna, atau objek yang muncul dalam video.

  • Profil Pengguna: Bisa juga dilakukan dari profil pengguna. Setiap pengguna memiliki profil preferensi berdasarkan video yang mereka tonton dan sukai. Profil ini terbentuk dari fitur-fitur yang diekstraksi dari video yang sudah mereka nikmati.

  • Pencocokan Fitur: Ketika pengguna mencari rekomendasi, algoritma Content-Based Filtering akan mencocokkan profil pengguna dengan fitur-fitur dari video lain yang tersedia di platform. Semakin banyak fitur yang cocok, semakin besar kemungkinan video akan direkomendasikan kepada pengguna.

  • Pemberian Bobot: Beberapa fitur mungkin memiliki bobot yang lebih tinggi daripada yang lain dalam menentukan kesamaan antara video. Misalnya, warna mungkin lebih rendah dalam bobot dibandingkan dengan objek atau tema utama video.

  • Rekomendasi: Video yang memiliki kesamaan fitur yang tinggi dengan profil pengguna akan diberikan sebagai rekomendasi. Semakin tinggi kesamaannya, semakin tinggi prioritasnya dalam rekomendasi.


Baca juga: Data Science Adalah: Yuk Kenali Lebih Jauh Tentang Data Science


2. Natural Language Processing

Data Science

Sumber gambar: https://ventjeengel.com/


Natural Language Processing (NLP) adalah cabang dari kecerdasan buatan yang berkaitan dengan pemahaman, interpretasi, dan generasi bahasa manusia oleh komputer. NLP melibatkan berbagai teknik dan metode untuk memproses dan menganalisis teks dalam bahasa manusia agar komputer dapat memahaminya dan mengambil informasi yang relevan. Di TikTok, NLP dapat digunakan untuk berbagai tujuan, seperti analisis komentar, klasifikasi konten, dan rekomendasi konten. Bahkan juga bisa loh digunakan untuk mendeteksi konten atau komentar yang melanggar aturan atau kode etik.

Cara kerja NLP di TikTok kurang lebih seperti berikut.

  • Pemrosesan Teks: NLP di TikTok dimulai dengan pemrosesan teks yang ada dalam video, deskripsi, komentar, atau tag. Teks ini kemudian dipecah menjadi token (unit unit dasar seperti kata-kata) untuk analisis lebih lanjut.

  • Pembersihan dan Pemrosesan Lanjutan: Teks kemudian dibersihkan dari karakter khusus, tanda baca, dan kata-kata yang tidak relevan. Proses ini disebut pembersihan teks. Selanjutnya, kata-kata dapat dinormalisasi (misalnya, mengubah kata menjadi bentuk dasarnya) dan lematized (mengubah kata menjadi bentuk kata dasar).

  • Analisis Sentimen: NLP dapat digunakan untuk menganalisis sentimen dalam teks, seperti apakah teks memiliki makna positif, negatif, atau netral. Cara ini dapat membantu dalam memahami tanggapan pengguna terhadap konten.

  • Klasifikasi Konten: NLP juga dapat digunakan untuk mengklasifikasikan teks ke dalam kategori tertentu. Misalnya, untuk memastikan konten sesuai dengan pedoman komunitas, NLP dapat digunakan untuk mengidentifikasi teks yang mengandung kata-kata kasar atau melanggar aturan.

  • Rekomendasi Konten: NLP juga dapat berperan dalam rekomendasi konten. Dalam kasus ini, algoritma NLP dapat menganalisis preferensi pengguna berdasarkan teks yang mereka berikan dalam deskripsi atau komentar, dan menggunakan informasi ini untuk memberikan rekomendasi yang lebih sesuai.


3. Convolutional Neural Networks

Data Science

Sumber gambar: https://www.analyticsvidhya.com/


Convolutional Neural Networks (CNN) adalah jaringan saraf tiruan yang dirancang khusus untuk mengelola pengolahan citra dan pengenalan pola dalam data visual. CNN memiliki kemampuan secara otomatis mengekstrak fitur-fitur penting dari gambar atau data visual lainnya melalui lapisan konvolusi dan pooling. Di TikTok, CNN dapat digunakan untuk berbagai tujuan, seperti deteksi objek dalam video, pengenalan wajah, efek visual, dan lainnya.

Bagaimana cara kerjanya? Yuk simak pembahasan berikut.

  • Ekstraksi Fitur: CNN mengambil gambar atau data visual sebagai input. Lapisan konvolusi pertama akan menerapkan sejumlah filter (kernel) ke seluruh gambar. Setiap filter ini akan merespons terhadap pola tertentu dalam gambar, seperti tepi, sudut, atau tekstur.

  • Konvolusi: Proses konvolusi melibatkan pergerakan filter ke seluruh gambar dengan langkah tertentu (stride). Saat filter bergerak, ia melakukan operasi perkalian titik-titik yang tumpang tindih dengan wilayah di bawah filter. Hasil perkalian ini dijumlahkan untuk menghasilkan satu nilai, yang menjadi nilai di lokasi tertentu dalam lapisan konvolusi berikutnya (feature map).

  • Pooling: Setelah lapisan konvolusi, seringkali lapisan pooling (misalnya, lapisan MaxPooling) diterapkan. Lapisan pooling berfungsi untuk mengurangi dimensi data dengan memilih nilai terbesar dalam suatu wilayah (biasanya ukuran 2x2) di feature map. Ini membantu mengurangi jumlah parameter dan menghasilkan fitur yang lebih dominan.

  • Pelatihan: CNN dipelajari dengan memberi tahu model bagaimana memetakan fitur-fitur dari input ke output yang diinginkan. Hal ini melibatkan menyajikan model dengan data pelatihan yang memiliki label atau target yang diketahui, dan mengoptimasi parameter model untuk meminimalkan kesalahan antara prediksi model dan label yang sebenarnya.


Baca juga: 3 Contoh Penerapan Data Science yang Sangat Berguna di Dunia Perindustrian


4. Geocoding

Data Science

Sumber gambar: https://www.geospatialworld.net/


Geocoding adalah proses mengubah alamat atau nama tempat menjadi koordinat geografis (seperti latitude dan longitude) yang dapat diidentifikasi secara geospasial. Dalam konteks TikTok, geocoding dapat digunakan untuk mengaitkan konten dengan lokasi fisik tertentu, seperti tempat pengambilan gambar atau lokasi acara. Layanan Geocoding akan menganalisis data alamat yang diberikan, mencocokkannya dengan data yang ada dalam basis data geografis mereka, dan menghasilkan koordinat geografis yang sesuai. Koordinat ini dapat berupa latitude dan longitude.


Setelah geocoding selesai, koordinat geografis ini dapat disimpan bersama dengan data video di TikTok. Ini memungkinkan platform untuk mengetahui lokasi fisik video tersebut. TikTok juga dapat menggunakan informasi geocoding ini untuk menampilkan video di peta interaktif, sehingga pengguna dapat melihat di mana video tersebut diambil atau terkait dengan lokasi tertentu.


Wah ternyata kompleks juga ya algoritma data science yang digunakan di TikTok. Sebagai perusahaan idaman banyak orang, tentu SahabatDQ ingin kan bisa bekerja di sana? Nah kalian perlu mempersiapkan diri nih! Algoritma tersebut bisa kalian pelajari di DQLab. Modul ajarnya lengkap dan bervariasi. Bahkan diintegrasikan dengan ChatGPT. Manfaatnya apa?

  • Membantu kalian menjelaskan lebih detail code yang sedang dipelajari

  • Membantu menemukan code yang salah atau tidak sesuai

  • Memberikan solusi atas problem yang dihadapi pada code

  • Membantu kalian belajar kapanpun dan dimanapun

Selain itu, DQLab juga menggunakan metode HERO yaitu Hands-On, Experiential Learning & Outcome-based, yang dirancang ramah untuk pemula. Tunggu apa lagi, segera Sign Up dan siapkan diri untuk berkarir di industri impian kalian! 


Penulis : Dita Feby 

Editor : Annissa Widya 


Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login