Belajar Big Data : Kenali Perbedaan 3 Jenis Data yang Perlu Kamu Pahami!
Data yang terkumpul dengan jumlah yang besar atau banyak merupakan istilah dari Big Data. Data yang diperoleh didapat secara eksponensial berdasarkan jangka waktu tertentu. Singkatnya, dengan data berskala besar dan kompleks yang diperoleh tersebut, tentu membutuhkan teknologi pendukung untuk memunculkan sifat keekonomian data.
Seperti yang sudah diulas sebelumnya, Big Data memiliki 3 karakteristik yang populer dengan istilah 3V. Karakteristik tersebut diantaranya adalah Volume (ukuran), Velocity (Kecepatan), dan Variety (Keragaman). Selain memiliki karakteristik tersendiri, Big Data juga memiliki 3 jenis data yakni terstruktur, tidak terstruktur, dan semi terstruktur. Yuk, kita simak bersama apa saja perbedaan dari ketiga jenis data tersebut!
1. Data Terstruktur, Data yang Dapat Disimpan
Data terstruktur merupakan data yang dapat disimpan, diakses, serta diproses dalam bentuk format yang tetap. Secara umum, data yang termasuk ke dalam jenis ini ialah data pada excel atau spreadsheet. Data tersebut sangat tersusun dan mudah dalam mengaksesnya dari berbagai database dengan algoritma mesin pencari yang sederhana.
Contoh data yang termasuk ke dalam jenis di data ini diantaranya, data penjualan pada suatu perusahaan, data diri karyawan (nama, posisi atau jabatan, gaji) yang terlampir secara terstruktur dan terorganisir kategorinya.
Baca juga: Belajar Big Data: Teknologi Canggih untuk Terus Melek Data di Era Industri 4.0
2. Data Tidak Terstruktur, Data dengan Bentuk yang Tidak Diketahui
Data dengan bentuk yang tidak terstruktur diklasifikasikan sebagai data yang memiliki bentuk struktur yang tidak diketahui. Adapun tantangan tersendiri pada jenis data ini, selain memiliki data dengan ukuran yang besar, kamu juga ditantang untuk mampu menurunkan nilai dari data tersebut dalam hal pengolahan.
Contoh pada jenis data tidak terstruktur merupakan data yang mengandung kombinasi sederhana, seperti file teks, gambar, video, dan lain-lain. Contoh-contoh tersebut dapat ditemukan dalam media sosial, seperti jumlah likes, followers, komentar, dan data yang mengklik pada setiap aktivitas akun media sosial masing-masing pengguna.
3. Data Semi Terstruktur, Berisi Kedua Data : Terstruktur dan Tidak Terstruktur
Jenis data semi-terstruktur dalam Big Data, dapat berisikan kedua jenis di atas (data terstruktur dan tidak terstruktur). Jenis data ini merujuk pada data yang belum diklasifikasikan di bawah repository tertentu tetapi mengandung informasi penting yang memisahkan elemen individu dalam data. Contoh yang termasuk ke dalam jenis data ini ialah, data dalam bentuk file xml, file json, dan file csv.
Baca juga: Perkembangan Teknologi Masa Kini untuk Menghadapi Big Data pada Industri 4.0
4. Yuk, Pelajari Lebih dalam Peranan Big Data dalam ilmu Data Science bersama DQLab Sekarang!
Terapkan ilmunya sekarang dengan bergabung bersama platform belajar online DQLab! Selain bisa meningkatkan ilmu data yang dimiliki, kamu juga bisa membangun portofolio datamu di DQLab guna mempersiapkan dirimu berkarir di indutri data.
Sign up sekarang di DQLab.id dan nikmati module GRATIS "Introduction to Data Science" untuk menikmati pengalaman belajar yang seru menyenangkan serta aplikatif pada industri nyata! Untuk kamu yang ingin mulai belajar Data Science atau siap berkarir jadi Data Analyst, Data Scientist, dan Data Engineer, persiapkan diri kamu dengan tepat sekarang. Tidak ada kata terlambat untuk belajar. Yuk #MulaiBelajarData di DQLab.
Dengan belajar di DQLab, kamu bisa:
Menerapkan teknik mengolah data kotor, hasilkan visualisasi data dan model prediksi dengan studi kasus Retail dan Finansial
Dapatkan sesi konsultasi langsung dengan praktisi data lewat data mentoring
Bangun portofolio data langsung dari praktisi data Industri
Akses Forum DQLab untuk berdiskusi.
Simak informasi di bawah ini untuk mengakses gratis module "Introduction to Data Science":
Buat Akun Gratis dengan Signup di DQLab.id/signup
Akses module Introduction to Data Science
Selesaikan modulenya, dapatkan sertifikat & reward menarik dari DQLab
Penulis : Frindy Johana
Editor : Annissa Widya Davita