Pentaho Data Integration (PDI) adalah software business intelligence yang digunakan untuk proses Extraction, Transformation dan Loading (ETL). Pentaho juga dapat digunakan untuk migrasi data, membersihkan data, loading dari file ke database atau sebaliknya dalam volume yang sangat besar. Berdasarkan fungsi yang sudah dipaparkan sebelumnya, Pentaho memiliki sebuah keunggulan yaitu memiliki sebuah Graphical User Interface (GUI) yang friendly serta drag and drop komponen yang sangat memudahkan para penggunanya. Pentaho Data Integration sendiri memiliki tiga komponen utama yaitu Spoon, Pan dan Kitchen. Ketiga fitur tersebut memiliki fungsi masing-masing, yaitu sebagai berikut:
- Spoon adalah user interface yang berfungsi untuk membuat job dan transformation.
- Pan adalah program yang berfungsi untuk mengeksekusi transform.
- Kitchen adalah program yang berfungsi untuk mengeksekusi job.
Untuk lebih memahami penggunaannya, berikut ini merupakan panduan dalam memasang tools data science Pentaho, yaitu sebagai berikut:
1. Pertama, install terlebih dahulu bahasa pemrograman Java. Kemudian, install juga tools pendukungnya seperti Java Development Kit (JDK) dan Java Runtime Environment (JRE). Untuk mendapatkan aplikasi dan tools pendukungnya tersebut, kalian bisa mengunduhnya pada link berikut ini:
JDK dan JRE: https://www.oracle.com/java/technologies/downloads/
2. Kedua, kita perlu menambahkan environment variable agar nantinya Pentaho dapat berjalan dengan baik. Caranya yaitu sebagai berikut:
2.1) Cari Edit the system environment variables pada fitur pencarian di pojok kiri bawah.
2.2) Selanjutnya, klik Environment Variables.