Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS

4 Ragam Project Data Analyst dengan R Programming

Belajar Data Science di Rumah 18-Desember-2022
https://dqlab.id/files/dqlab/cache/24ebf82673c4235483b414d41aa5a29b_x_Thumbnail800.jpeg

Data analyst membutuhkan beragam tools untuk membantunya mengamati data dan mencari insight dari data yang dimiliki. Salah satunya adalah R programming. Bahasa pemrograman R adalah  bahasa pemrograman dalam big data untuk pengolahan data yang bersifat open source. Dengan kata lain, bahasa pemrograman ini gratis untuk digunakan dan bisa dimodifikasi oleh siapa pun. Sifatnya yang open source membuat R programming mempunyai jumlah pengguna aktif di seluruh dunia yang besar dan berkontribusi dalam perkembangannya.


Seorang data analyst terutama para pemula yang baru terjun ke bidang data, tentu perlu mengasah kemampuannya dalam menganalisis data. Salah satu cara yang bisa dilakukan adalah terus berlatih mengerjakan project data analyst. Nah, pada artikel kali ini akan diberikan beberapa ide yang bisa Sahabat DQ gunakan sebagai project data analyst. Apa saja project mudah tersebut? Yuk, simak penjelasannya di bawah ini!


1. Sentiment Analysis

Sentiment analysis mengekstrak berbagai macam jenis penilaian seperti negatif, positif, atau netral. Kalian dapat menggunakan sentiment analysis untuk menentukan sifat atau kategorisasi dari sebuah teks. Artinya, teks yang panjang akan diterjemahkan menjadi satu sifat atau penilaian yang kemudian dikelompokkan ke masing-masing sesuai hasil analisis. Salah satu penerapan dari sentiment analysis adalah hasil survei kepuasan pelanggan. 


Data Analyst


Sebuah perusahaan sering menggunakan pertanyaan esai atau terbuka untuk mengetahui kepuasan pelanggan. Ini merupakan cara terbaik untuk menciptakan loyalitas dan hubungan yang baik antara pelanggan dan perusahaan. Dengan survei tersebut, perusahaan dapat melakukan pengembangan atau menciptakan produk baru sesuai kebutuhan pelanggan. Hal ini tidak bisa dianalisis dengan metode statistika sebelum diubah ke bentuk yang bisa dihitung. Sentiment analysis berfungsi untuk kasus seperti contoh tersebut. 


Untuk menganalisis suatu data, bahasa pemrograman R memiliki packages khusus berdasarkan jenis data atau proses analisisnya. Berikut packages yang sering digunakan pada sentiment analysis.

  • tm: digunakan untuk mengolah teks dan karakter khusus.

  • word cloud: digunakan untuk membuat plot dengan data berbentuk teks

  • syuzhet: digunakan untuk mengklasifikasikan teks ke dalam klasifikasi emosi atau penilaian sentimen.

  • ggplot2: digunakan untuk membuat plot dari data numerik.


Baca juga : Kenali Perbedaan Data Scientist, Data Analyst dan Data Engineer


2. Uber Data Analysis 

Uber merupakan salah satu perusahaan besar yang menggunakan data sebagai dasar pengambilan keputusan untuk melayani pelanggan. Data tersebut digunakan untuk menghasilkan analisis prediksi, strategi marketing, penawaran pelayanan, dan kebijakan penentuan harga. Project yang bisa kalian bangun dari uber data analysis adalah menganalisis data user berkaitan dengan pemesanan dan menjadikan informasi tersebut sebagai landasan keputusan perusahaan. Project ini akan berfokus pada visualisasi data.


Data Analyst


Beberapa hal yang bisa dianalisis pada project ini yaitu jumlah pesanan setiap harinya, adanya pola jam tertentu yang menunjukkan padatnya pesanan, jumlah pesanan selama periode tertentu misal per bulan atau per tahun, karakteristik pelanggan yang sering melakukan pesanan, jenis kendaraan yang banyak diminati pelanggan, dan lain-lain.


Berikut sejumlah packages yang digunakan untuk melakukan uber data analysis.

  • ggplot2: digunakan untuk membuat plot dari data numerik.

  • ggthemes: menyediakan tema, geom, dan scales yang tidak disediakan secara default

  • lubridate: digunakan untuk olah data waktu dan tanggal

  • tidyr: digunakan untuk manipulasi data


3. Credit Card Fraud Detection

Meningkatnya volume dan potensi kerugian akibat tindak pidana penipuan kartu kredit memerlukan solusi yang memungkinkan pihak penyelenggara layanan kartu kredit dapat melakukan analisis pada setiap transaksi secara cepat dan akurat. Hal ini hampir mustahil dilakukan secara manual oleh manusia. Permasalahan ini dapat diselesaikan dengan menggunakan algoritma machine learning seperti Decision Trees, Logistic Regression, Artificial Neural Networks, dan Gradient Boosting Classifier. Dengan mengaplikasikan algoritma tersebut, sistem akan memberitahukan jika terjadi kecurangan secara otomatis.


Data Analyst


Beberapa tantangan yang akan kalian hadapi dalam membuat project ini yaitu:

  • Data yang dibutuhkan sangat besar dan terkadang tidak sepenuhnya rapi.

  • Data yang tidak seimbang (imbalanced data) akan menghasilkan prediksi yang tidak sesuai.

  • Kebanyakan data tentang kartu kredit bersifat privat sehingga untuk mencari data ini cukup sulit.

  • Ada beberapa data transaksi yang biasanya belum diidentifikasi sebagai kecurangan atau tidak sehingga akan mempengaruhi hasil prediksi.


Baca juga : Data Analyst vs Data Scientist, Yuk Kenali Perbedaannya 


4. Customer Segmentation 

Customer segmentation digunakan untuk mengetahui target pasar yang sesuai. Dengan mengkategorikan target pasar menjadi beberapa level atau tipe pembeli, perusahaan akan dengan mudah menyesuaikan produk sesuai dengan karakteristik pelanggan. Biasaya pertimbangan dari customer segmentation adalah usia, jenis kelamin, pekerjaan, histori pembelian, kebutuhan sehari-hari, penilaian terhadap produk sebelumnya, dan lain-lain. Customer segmentation juga bisa digunakan untuk menentukan strategi marketing apa yang sesuai, jenis iklan yang seperti apa yang lebih tepat sasaran, dan program promo yang paling diminati. 


Data Analyst


Kalian bisa menggunakan algoritma unsupervised learning yaitu algoritma K-Means. Algoritma ini memang dikhususkan untuk melakukan clustering berdasarkan variabel-variabel yang sudah disediakan. K-Means juga dengan efektif akan menunjukkan visualisasi data dalam kategori tertentu. Misalnya distribusi usia dan gender pelanggan. Selain itu juga bisa untuk melihat pola perilaku pembelian pelanggan, status ekonomi, dan sebagainya. 


Wah ternyata sangat beragam ya project data analyst. Bahkan contoh yang disebutkan di atas hanya bagian kecil dari project lain yang masih bisa kalian eksplor lebih lanjut. Masih bingung mencari ide project data analyst lainnya? DQLab adalah solusi tepat bagi kalian yang ingin eksplorasi berbagai project menggunakan R programming. 


Data Analyst


Tidak hanya menyediakan ide project saja, di DQLab kalian akan dipandu untuk menyelesaikan secara bertahap, loh. Bagi pemula yang belum percaya diri mengerjakan project, kalian juga bisa memperkuat teori kalian terlebih dahulu karena DQLab juga menyediakan modul pembelajaran pengantar sebelum menyelesaikan project. Lengkap, kan? Keunggulan lainnya adalah adanya Live Code Editor dimana fitur ini membantu kalian belajar coding tanpa harus menginstall aplikasi bantuan lagi. Yuk, segera nikmati kemudahan-kemudahan belajar tersebut dengan daftar atau Sign Up terlebih dahulu di DQLab. Perkaya pengalaman mengerjakan project di sini dan asah kemampuan data analyst kalian untuk menjadi praktisi data yang handal!


Penulis : Dita Feby 

Editor : Annissa Widya 



Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login