Tidak lengkap rasanya, jika kita tidak mengetahui apa itu Big Data. Big data merupakan istilah yang digunakan untuk mendefinisikan tumpukan sebuah data yang ada. Karena setiap harinya terdapat jutaan petabytes yang beredar di sekeliling kita. Konsep big data mencakup tiga dimensi utama yang dikenal sebagai 3V: Volume, Velocity, dan Variety.
Volume
Merujuk kepada jumlah data yang sangat besar yang terkumpul dari berbagai sumber. Data ini bisa berasal dari transaksi bisnis, media sosial, web, dan banyak lagi. Volume data ini sering kali terlalu besar untuk dikelola dan dianalisis dengan menggunakan perangkat lunak database tradisional.Velocity
Merujuk kepada kecepatan dengan mana data dihasilkan, masuk, dan diproses. Data dalam skala besar seringkali dihasilkan dalam waktu nyata atau mendekati waktu nyata, sehingga memerlukan kemampuan untuk diproses dengan cepat agar dapat diambil tindakan secara tepat waktu.Variety
Merujuk kepada ragam jenis data yang termasuk dalam kumpulan data besar ini. Data dapat berupa teks, gambar, audio, video, dan format lainnya. Kadang-kadang data dalam skala besar ini juga bersifat tidak terstruktur, artinya tidak memiliki format yang teratur atau terstruktur.VariabilityMerujuk kepada fluktuasi dalam pola data dari waktu ke waktu.|
- Veracity
Merujuk kepada keandalan dan keakuratan data. Big data sering kali memasukkan data dari berbagai sumber yang mungkin memiliki tingkat keandalan yang berbeda.
Pengelolaan dan pemanfaatan big data memerlukan metode khusus untuk dapat menangani kompleksitas dan skala data yang besar. Agar data tersebut dapat dimanfaatkan dengan baik.
Â
VDM (Visual Data Mining)
VDM atau Visual Data Mining merupakan sebuah pendekatan yang digunakan oleh seorang data analyst dalam menyampaikan hasiol temuannya. Dengan VDM ini, seorang data analyst akan mengubah sebuah tumpukan data menjadi sebuah visualisasi yang mudah untuk di baca dan dipahami oleh masing-masing divisi. Terdapat 3 tahapan penerapan VDM, diantaranya:
- Project Planning
Perumusan terkait tujuan proyek, batasan proyek dan menentukan waktu pengerjaan. Mengidentifikasi pertanyaan bisnis yang ingin dicapai. - Data Preparation
Pada tahapan ini adalah proses pengumpulan data, pembersihan data, transformasi dan melakukan pemilihan data. - Data Analysis
Setelah tujuan dan data dianggap relevan, maka Langkah selanjutnya yaitu melakukan proses analisis. Terdapat berbagai macam teknik analisis yang dapat digunakan, namun  pada umumnya analisis ini menggunakan pendekatan statistik. Fokus utama dalam tahapan ini adalah menghasilkan wawasan yang bermanfaat.
Alat - alat pengolahan data
 Terdapat berbagai macam alat yang umum digunakan untuk melakukan analisis dan pengolahan data, berikut tools yang umum digunakan:
- Microsoft Excel
Microsoft excel merupakan alat pengolahan data yang dikembangkan oleh microsoft. Dengan excel kita dapat mengelola data dengan mudah, seperti perhitungan, membersihkan data dan sampai dengan visualisasi data. Namun microsoft excel terdapat limitasi, yaitu hanya mampu menampung 1juta lebih data. - SQL
SQL atau Structured Query Language merupakan salah satu sistem manajemen yang dapat menyimpan sebuah data dalam jumlah yang sangat besar, umumnya data ini bersifat relational atau saling terhubung antara data satu dengan data yang lain dan terstruktur dengan rapi. - Power BI
Power BI merupakan tools yang dikembangkan oleh Microsoft yang berfungsi untuk melakukan analisis data secara kompleks. Power BI memberikan pengguna untuk dapat mengeksplor data yang dimiliki dan mengubahnya kedalam bentuk visualisasi yang menarik, interaktif dan mudah untuk dibaca.
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H