Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS

Tutorial Install Spark SQL yang Harus Diketahui Pemula

Belajar Data Science di Rumah 28-Agustus-2022
https://dqlab.id/files/dqlab/cache/b7b382c66e276e7690406be2016ec675_x_Thumbnail800.jpg

Spark SQL adalah salah satu modul yang tersedia di dalam Apache Spark. Nantinya, Spark SQL ini akan digunakan untuk memahami bagaimana cara pemrosesan data yang dilakukan secara struktural. Spark SQL akan mengintegrasi pemrosesan relasional dengan pemrograman fungsional Spark.


Ini memberikan dukungan untuk beberapa sumber data dan memungkinkan untuk menenun kueri SQL dengan transformasi kode yang menghasilkan alat yang sangat kuat. 


Spark SQL ini memang terbilang cukup advanced sehingga akan terasa asing bagi mereka yang baru pertama kali belajar tentang data. Selain SQL, Apache Spark juga memiliki modul bawaan lain, seperti untuk streaming, Machine Learning (ML) serta pemrosesan grafik.


Penggunaan Apache Spark di tengah perkembangan teknologi digital yang menghasilkan banyak data memang sangat membantu, karena dapat mengimbangi data yang sangat banyak tersebut karena Apache Spark dapat digunakan untuk mempercepat komputasi.


Dalam artikel ini, kita akan mempelajari beberapa tahapan yang harus dilalui untuk melakukan instalasi Spark. Penasaran kan? Yuk, simak pembahasannya!


1. Memverifikasi Instalasi Java dan Skala

Instalasi JAVA dalam proses penginstalan Spark merupakan hal yang bersifat wajib (mandatory). Sebelum meng-install JAVA, ada baiknya kita memastikan apakah sudah ada JAVA yang terinstall atau belum. Kita bisa menuliskan ini di bagian command prompt:

sql

Jika JAVA sudah terinstall, maka respon yang akan muncul adalah:

sql

Namun jika tidak menampilkan seperti gambar di atas, maka kita perlu melakukan instalasi JAVA.


Tahapan selanjutnya adalah memastikan Scala sudah terinstall atau belum, karena bahasa Scala merupakan bahasa yang akan digunakan untuk mengimplementasikan Spark.


Sama seperti ketika kita mengecek JAVA tadi, untuk memastikan Scala sudah terinstall atau belum, kita bisa menuliskan seperti gambar di bawah pada bagian command prompt:

sql

Jika sudah terinstall, maka akan muncul tampilan seperti ini:

sql

Jika Scala belum terinstall, maka kamu bisa mengikuti tahapan yang ada di point 2.


Baca juga : Saatnya Belajar SQL, Kenali Rekomendasi Query SQL Bagi Pemula


2. Download dan Install Scala

Jika Scala belum terinstall, tahapan paling awal adalah men-download Scala versi terupdate disini. Setelah berhasil di download, kamu akan menemukan Scala tar file di folder Download yang ada di komputermu. Setelah itu, kamu bisa melakukan extract terhadap file tar tersebut dengan menuliskan command berikut:

sql

Langkah selanjutnya adalah memindahkan Scala software file ke direktori khusus (local/usr/scala) dengan menuliskan:

sql

Tentukan path untuk skala:

sql

Selanjutnya verifikasi kembali apakah Scala sudah terinstall seperti cara yang ada di poin pertama.


3. Download & Installing Spark

Tahapan selanjutnya adalah menginstal Spark. Namun sebelum melakukan penginstalan, tentunya kita harus mendownload Spark terlebih dahulu. Kamu bisa mendownload Spark di sini. Setelah berhasil di download, maka kamu akan menemukan Spark tar file di folder Download yang ada di komputer mu.


Langkah selanjutnya adalah kita akan melakukan extract untuk tar file yang ada dengan menggunakan command berikut:

sql

Kemudian kita akan Spark software file ke direktori khusus (local/usr/scala) dengan menuliskan:

sql

Selanjutnya kita akan menentukan environment untuk menempatkan ~/.bashrc file atau dengan kata lain mencari path untuk menempatkan Spark file. Caranya adalah dengan menuliskan command berikut:

sql

Lalu tuliskan perintah di bawah untuk menjadi sumber dari ~/.bashrc file:

sql


4. Memverifikasi Instalasi Spark

Setelah selesai dengan penginstalan, tentunya kita harus memastikan apakah sudah benar-benar terinstal atau belum. Kita dapat mulai dengan menuliskan command untuk membuka Spark, yaitu:

sql

Jika sudah berhasil terinstall, maka output yang dihasilkan akan seperti gambar di bawah ini:

sql

Jika tampilannya berbeda, maka bisa jadi proses penginstalan belum benar-benar berhasil. Sehingga kamu bisa mencoba untuk menginstall Spark kembali.


Baca juga : Catat! Ini 3 Keuntungan Belajar SQL dalam Mengolah Data


Spark SQL merupakan salah satu teknologi yang dapat digunakan untuk memproses data yang berukuran besar atau dikenal dengan istilah big data. Sebelum masuk ke tingkat advance tersebut, ada baiknya hal-hal yang bersifat fundamental dari SQL loh.


Sahabat DQ gak perlu bingung harus belajar SQL dimana karena DQLab juga menyediakan modul SQL yang sangat cocok bagi pemula karena membahas hal-hal yang bersifat fundamental. Agar bisa mengaksesnya, kamu cukup berlangganan untuk menjadi member premium di DQLab


Yuk, tunggu apa lagi? Sekarang giliran mu!


Penulis: Gifa Delyani Nursyafitri



Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login