BEDUG MERIAH Diskon 95%
Belajar Data 6 BULAN Bersertifikat hanya Rp150K!

0 Hari 2 Jam 1 Menit 21 Detik

Big Data Hadoop : Mengulas Lengkap Tentang Teknologi di Balik Hadoop

Belajar Data Science di Rumah 01-Oktober-2020
https://dqlab.id/files/dqlab/cache/f83bc0195cfec0409b5b2b6affca21ea_x_Thumbnail800.jpg

Lahirnya Big Data ternyata berbanding lurus dengan lahirnya berbagai teknologi baru. Salah satunya adalah Hadoop. Implementasi dari Big Data ini memiliki nama resmi Apache Hadoop. Ternyata Big Data Hadoop ini terinspirasi dari Big Data Google, loh. Namun perbedaannya adalah Big Data Hadoop bersifat open source, sedangkan Big Data Google tidak bersifat open source.

Hadoop ini tidak hanya merupakan software, melainkan kumpulan dari beberapa software yang saling bekerja sama dalam proses pengolahan data. Kita bisa menyebut Hadoop sebagai sebuah ekosistem dari software-software yang saling bekerja sama. Nah, untuk mengetahui bagaimana Hadoop bekerja, maka kita harus mengetahui software apa saja yang ada di balik Hadoop. Penasaran? Yuk simak ulasan berikut ini!

1. Core Hadoop

Teknologi Core Hadoop menjadi software utama yang menjadi dasar dari penggunaan Hadoop. Core Hadoop ini terbagi menjadi HDFS (Hadoop Distributed File System) dan Map Reduce. Keduanya bisa di-download melalui website Apache Hadoop. HDFS digunakan sebagai pendukung dalam proses pengolahan data dalam jumlah besar. Data-data yang memiliki volume besar tersebut akan diolah secara paralel, namun sebelumnya harus dibagi ke dala bagian-bagian yang lebih kecil.

Selanjutnya proses dari HDFS akan dilanjutkan oleh tahapan Map dengan mengubahnya menjadi tuple. Dari data tersebut akan didapatkan key yang kemudian akan dipasangkan dengan value nya. Kemudian data dari tahapan Map ini akan dilakukan shuffle dan reduce dan dikembalikan ke HDFS lagi. Tahapan ini dinamakan Reduce.

Baca Juga : Terapkan 3 Manfaat Big Data Berikut untuk Mengembangkan Bisnismu!

2. Data Mining dan Database NoSQL

Data mining merupakan proses API (Application Programming Interface) yang berfungsi untuk menjalankan proses Map Reduce. Contoh dari Data Mining yang biasa digunakan dalam Hadoop adalah Apache Hive dan Apache Pig. Dengan adanya proses API maka akan lebih mudah dalam menjalankan Map Reduce dan juga mempermudah proses query.

Database NoSQL (Not Only SQL) biasanya digunakan untuk mempermudah proses Map Reduce yang terkadang memakan waktu yang sangat lama serta dilakukan secara periodik, karena data yang diproses dalam jumlah yang sangat besar. Database NoSQL ini dapat memberikan akses data yang lebih cepat dan sewaktu-waktu. Contoh dari Database NoSQL di dalam Hadoop adalah Apache Hbase dan Apache Cassandra.

3. Software Pendukung Lainnya

Software pendukung lain ini merupakan software yang digunakan untuk membantu proses operasional dari Hadoop. Misalnya untuk mengatur proses distribusi data dan pemrosesan data, ataupun mengatur input ke dalam Hadoop dari sumber data yang bersifat streaming. Misalnya, Apache Flume yang berfungsi untuk mengatur input ke dalam Hadoop dari sumber data yang bersifat streaming, seperti Twitter.

Selain yang telah disebutkan sebelumnya, ternyata masih banyak software pendukung Hadoop yang memiliki fungsinya masing-masing, seperti Apache Zookeeper, Apache Ambari, Apache Oozie, dll. Namun dalam proses penggunaannya, tentunya kita tidak perlu menggunakan semuanya. Kita cukup memilih untuk menggunakan software mana yang lebih menunjang pekerjaan kita.

Baca Juga: Big Data Hadoop : Yuk, Ketahui 3 Kit untuk Instalasi Hadoop

4. Tertarik? Yuk, Belajar Data Science Gratis sekarang!!

Terapkan ilmunya sekarang dengan bergabung bersama platform belajar online DQLab! Selain bisa meningkatkan ilmu data yang dimiliki, kamu juga bisa membangun portofolio datamu di DQLab guna mempersiapkan dirimu berkarir di industri data. 

Sign Up untuk nikmati module GRATIS "Introduction to Data Science" dengan pengalaman belajar yang seru menyenangkan serta aplikatif pada industri nyata! Untuk kamu yang ingin mulai belajar Data Science atau siap berkarir jadi Data Analyst, Data Scientist, dan Data Engineer, persiapkan diri kamu dengan tepat sekarang. Tidak ada kata terlambat untuk belajar. Yuk #MulaiBelajarData di DQLab.

Dengan belajar di DQLab, kamu bisa:

  • Menerapkan teknik mengolah data kotor, hasilkan visualisasi data dan model prediksi dengan studi kasus Retail dan Finansial

  • Dapatkan sesi konsultasi langsung dengan praktisi data lewat data mentoring

  • Bangun portofolio data langsung dari praktisi data Industri

  • Akses Forum DQLab untuk berdiskusi.

Simak informasi di bawah ini untuk mengakses gratis module "Introduction to Data Science":

  1. Buat Akun Gratis dengan Signup di DQLab.id/signup

  2. Akses module Introduction to Data Science

  3. Selesaikan modulenya, dapatkan sertifikat & reward menarik dari DQLab.

Penulis : Gifa Delyani Nursyafitri

Editor : Annissa Widya Davita

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login