Data Engineer Course

Data Engineer Course

Module Description

Pelajari metode pengolahan data dan penerapan Extract Transform Load (ETL) yang dapat di implementasikan dengan studi kasus retail.

  • Materi mudah dipahami karena disampaikan dalam Bahasa Indonesia, tanpa instalasi software tambahan,  menggunakan fitur Live Code Editor. 
  • Modul yang ada di DQLab.id dipersiapkan oleh praktisi data di industri sehingga mencerminkan studi kasus yang sering dihadapi dalam dunia kerja.

Learning Outcomes

Dengan mempelajari Data Engineering Course, peserta mampu untuk:

  • Mengolah dataset complex dengan Python, R, dan SQL
  • Memahami dan menerapkan teknik ETL, untuk mempersiapkan data
  • Menerapkan teknik data wrangling
  • Melatih critical thinking dan problem solving apabila dihadapkan dengan suatu masalah

Chapters

Fundamental R for Data Science

Pelajari langkah dasar untuk memulai R - bahasa yang sangat populer di data science - mulai dari operasi matematika sampai visualisasi data.

  • Mengerti hal-hal dasar di R seperti menggunakan dan menampilkan angka, teks, dan perhitungan matematika dasar
  • Mampu menggunakan variable untuk menyimpan nilai
  • Mengerti penggunaan komentar (comment) untuk menghasilkan human readable code
  • Mengerti sifat R yang case sensitive - huruf besar dan huruf kecil merupakan hal yang berbeda
  • Mengerti penggunaan tipe data logika TRUE/FALSE
  • Memahami contoh error
  • Memahami apadan bagaimana menggunakan package
  • Mengerti bagaimana membaca file Excel
  • Mampu menghasilkan grafik bar chart dan pie chart dengan data yang dibaca dari file Excel

Statistics using R for Data Science

Pelajari dasar-dasar ilmu statistik untuk memulai perjalanan data science dengan menggunakan R.

  • Fungsi statistik
  • Perbedaan statistik dan parameter
  • Perbedaan data kuantitatif dan kualitatif
  • Membaca dataset dalam format CSV
  • Mengubah kolom menjadi factor
  • Estimasi Karakteristik (modus, median, mean)
  • Skala pengukuran data
  • Ukuran sebaran data (range, varian, simpangan baku)
  • Perbedaan Statistik Deskriptif dan Statistik Inferensia
  • Hubungan antar variabel

Data Exploration in Data Science using R

Kuasai keterampilan data preparation atau data wrangling ini langkah demi langkah - dengan fokus pada transformasi struktur dari file dataset kependudukan DKI Jakarta.

  • Mempraktekkan missing Value
  • Mempraktekkan struktur data kategori bernama Factor
  • Membaca file-file teks dan Excel – yang paling banyak ditemui sehari-hari
  • Melakukan perubahan struktur data sehingga cocok digunakan lebih lanjut

Data Wrangling in Data Science using R

Pelajari bagaimana melakukan data profiling, data cleansing, data enrichment dengan dataset pelanggan dari file Excel dan database MySQL.

  • Memahami cara membaca dataset dari database
  • Memahami profiling yaitu cara mengidentifikasi pola dataset untuk mengetahui karakteristik data yang akan diproses
  • Memahami cara membersihkan data (data cleansing) yang umumnya terdiri dari 3 fitur yaitu
    - Standardisasi: Merapikan format data dengan acuan yang telah ditentukan dengan fungsi R
    - Missing values: Memahami cara mengisi missing value
    - Deduplication: Menemukan data ganda dan melakukan pengelompokan terhadap data tersebut.
  • Memahami cara pengayaan data (data enrichment)

Data Wrangling in Data Science using Python

Bagaimana cara melakukan data wrangling dengan menggunakan bahasa pemograman Python. Data Wrangling merupakan langkah penting untuk sebagai Data Science.

  • Pengenalan pustaka Pandas
  • Membaca dan mengakses file teks
  • Menampilkan informasi statistik untuk profiling data dengan pustaka NumPy
  • Menangani missing values
  • Normalisasi data
https://dqlab.id/files/dqlab/cache/2787763546cdf13f1f6c7c7574d76a70_100_persen.png

Premium

Share

Praktikkan Ilmu Data Science dengan Studi Kasus

Belajar Data Science Mulai Dari IDR 199,000