Buat Akun DQLab & Akses Kelas Data Science Python, R, dan Excel GRATIS
 SIGN UP  

Market Basket Analysis Menggunakan Machine Learning Python

Belajar Data Science di Rumah 10-Juli-2021
https://dqlab.id/files/dqlab/cache/50d106ad52b0e06e602809a2352d1344_x_Thumbnail800.jpeg

Jika kamu tertarik dan sedang belajar bahasa pemrograman Python, hal dasar yang perlu kamu ketahui yaitu berbagai jenis algoritma yang memanfaatkan bahasa Python sebagai tools. DQLab menyediakan banyak sekali contoh-contoh kasus analisis data dalam sektor industri yang dapat kamu coba dan terapkan library Pythonnya. Salah satunya Market Basket Analysis menggunakan Machine Learning. Pada kasus ini kita akan menggunakan beberapa library Python dan yang pastinya library ini pada umumnya digunakan juga pada kasus-kasus industri lainnya. 

Dalam dunia bisnis, hal yang perlu kamu ketahui adalah kita tidak bisa memungkiri bahwa akan selalu ada kompetitor yang memiliki produk yang sama persis dengan produk yang telah ada sebelumnya. Tiru, amati, dan modifikasi merupakan sesuatu hal yang sedang berkembang saat ini. Sehingga tidak heran ketika ada sesuatu hal yang sedang viral, maka akan diikuti oleh banyak orang. Nah, dengan belajar Machine Learning, kita dapat mengatasi bagaimana caranya agar pelanggan tidak lari ke kompetitor. 

Market Basket Analysis adalah suatu metodologi untuk melakukan analisis buying habit konsumen dengan menemukan asosiasi antar beberapa item yang berbeda, yang diletakkan konsumen dalam shopping basket (keranjang belanja) yang dibeli pada suatu transaksi tertentu. Tujuan dari Market Basket Analysis adalah untuk mengetahui produk-produk mana yang mungkin akan dibeli secara bersamaan. Meskipun sebuah perusahaan telah memperhatikan tingkat kepuasan customer, namun analisis ini tetap diperlukan untuk membantu perusahaan berkembang dengan lebih cepat.

Namun sebelum memulai membuat modelnya, kira-kira seperti apa ya cara kerja Market Basket Analysis ini? Tanpa lama-lama lagi, yuk simak pembahasan berikut!


1. Market Basket Analysis

Market Basket Analysis adalah suatu analisis atas perilaku konsumen secara spesifik dari suatu golongan/kelompok tertentu. Sumber data dari analisis ini antara lain dapat bersumber dari transaksi kartu kredit, kartu lotere, kupon diskon, ataupun panggilan keluhan pelanggan. Market basket analysis umumnya dimanfaatkan sebagai titik awal pencarian pengetahuan dari suatu transaksi data ketika kita tidak mengetahui pola spesifik apa yang kita cari. 

Proses market basket analysis dimulai dengan transaksi yang terdiri dari satu/lebih penawaran produk/jasa dan beberapa informasi dasar suatu transaksi. Output dari market basket analysis adalah berbentuk aturan assosiasi (Association Rules). Yang dimaksud dengan Association Rules sendiri adalah pola-pola keterkaitan data dalam basis data.


Baca juga : Belajar Data Science: Kenali Dasar Bahasa Pemrograman Python yang Cocok bagi Pemula


2. Kelebihan dan Kekurangan Market Basket Analysis

Kelebihan dari proses Market Basket Analysis:

  • Hasilnya jelas dan mudah dimengerti sebab hanya merupakan suatu pola jika-maka. Contohnya: Jika produk A dan B dibeli secara bersamaan, maka kemungkinan produk C turut dibeli.

  • Market Basket Analysis sangat berguna untuk undirected data mining, yaitu pencarian awal pola.

  • Market Basket Analysis dapat memproses transaksi tanpa harus kehilangan informasi sebab dapat memproses banyak variabel tanpa perlu dirangkum (summarization) terlebih dahulu.

  • Proses komputasi yang lebih mudah dibandingkan dengan teknik yang kompleks seperti algoritma genetik & sistem saraf, meskipun jumlah perhitungan akan meningkat pesat bersamaan dengan peningkatan jumlah transaksi dan jumlah items yang berbeda dalam analisis.


Kekurangan dari proses Market Basket Analysis:

  • Tingkat pertumbuhan proses secara eksponensial sebagai akibat pertumbuhan ukuran data.

  • Memiliki keterbatasan untuk atribut data, misalnya hanya berdasarkan tipe produk.

  • Sulit untuk menentukan items yang akan diolah secara tepat, sebab frekuensi dari items tersebut harus diusahakan seimbang.


3. Analisis Asosiasi dan Algoritma Apriori

Analisis asosiasi atau Association Rule Mining adalah teknik data mining untuk menemukan aturan asosiasi antara suatu kombinasi item. Secara sederhana beberapa istilah yang akan sering digunakan pada Association Rule ini adalah:

  • Support, adalah suatu ukuran yang menunjukkan seberapa besar tingkat dominasi suatu item atau item set dari keseluruhan transaksi.

  • Confidence, adalah suatu ukuran yang menunjukkan seberapa sering aturan itu terbukti benar. 

  • Lift Ratio, adalah rasio dari nilai pengamatan Support, diharapkan jika dua aturan itu independen


Algoritma apriori merupakan salah satu algoritma klasik di dalam data mining. Algoritma apriori digunakan agar komputer dapat mempelajari aturan asosiasi, mencari pola hubungan antar satu atau lebih item didalam suatu dataset.


4. Hasil MBA: Association Rules

Nilai support dari sebuah item diperoleh dengan menggunakan rumus berikut:



Nilai support dari dua item diperoleh dengan menggunakan rumus:


Persaman 1 menjelaskan bahwa nilai support itemset (group variasi produk) A terhadap itemset B sebesar probabilitas dari gabungan itemset A dan B.

Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan asosiasi yang memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan asosiatif A => B.

Nilai confidence dari aturan A => B diperoleh dengan rumus berikut:



Sedangkan persamaan 2 menjelaskan bahwa persentase keyakinan (confidence) itemset A terhadap itemset B sebesar probabilitas dari gabungan itemset A dan B dibagi probabilitas itemset A.


Baca juga :  Python : Kenali 3 Buku yang Akan Mempercepat Kamu Dalam Belajar Python


5. Yuk, Belajar Machine Learning GRATIS Bersama DQLab Selama 1 Bulan!

Di dalam bisnis ritel, salah satu inovasi teknologi adalah analisa otomatis terhadap ribuan sampai jutaan data transaksi untuk mendapatkan kombinasi produk yang sering dibeli bersamaan. Proses analisa ini dikenal sebagai Market Basket Analysis (MBA). Dalam di dunia Data Science, algoritma yang populer untuk mendukung proses ini adalah Apriori. Dari berbagai studi kasus, informasi kombinasi ini dapat digunakan untuk meningkatkan penjualan 18% sampai dengan 60%. DQLab menyediakan course yang akan mempelajari bagaimana menerapkan MBA melalui algoritma Apriori. Jadi tunggu apalagi? Buat Akun Gratis dengan Signup di DQLab.id/signup dan ikuti kelas GRATIS "Introduction to Data Science with Python" hanya di DQLab!


Penulis : Salsabila Miftah Rezkia

Editor : Annissa Widya Davita

Sign Up & Mulai Belajar Gratis di DQLab!