Apa Itu Big Data?

Big data adalah kombinasi data terstruktur, semi terstruktur, dan tidak terstruktur yang dikumpulkan oleh organisasi yang dapat ditambang untuk mendapatkan informasi dan digunakan dalam proyek pembelajaran mesin, pemodelan prediktif, dan aplikasi analitik tingkat lanjut lainnya.

Apa Itu Big Data, Karakteristik Dan Contohnya!
Apa Itu Big Data, Karakteristik Dan Contohnya!


Sistem yang memproses dan menyimpan data besar telah menjadi komponen umum arsitektur manajemen data dalam organisasi, dikombinasikan dengan alat yang mendukung penggunaan analisis data besar. Big data sering kali dicirikan oleh tiga V:

  1. banyaknya data dalam jumlah besar di banyak lingkungan;
  2. beragamnya tipe data yang sering disimpan dalam sistem data besar; Dan
  3. kecepatan sebagian besar data dihasilkan, dikumpulkan, dan diproses.

Karakteristik ini pertama kali diidentifikasi pada tahun 2001 oleh Doug Laney, yang saat itu menjabat sebagai analis di perusahaan konsultan Meta Group Inc.; Gartner mempopulerkannya lebih lanjut setelah mengakuisisi Meta Group pada tahun 2005. Baru-baru ini, beberapa V lainnya telah ditambahkan ke deskripsi berbeda tentang data besar, termasuk kebenaran, nilai, dan variabilitas.

Meskipun big data tidak sama dengan volume data tertentu, penerapan big data sering kali melibatkan data berukuran terabyte, petabyte, dan bahkan exabyte yang dibuat dan dikumpulkan dari waktu ke waktu.


Karakteristik data besar

Melihat lebih jauh dari tiga V yang asli, berikut rincian beberapa V lainnya yang kini sering dikaitkan dengan big data:

Kebenaran mengacu pada tingkat keakuratan kumpulan data dan seberapa dapat dipercaya kumpulan data tersebut. Data mentah yang dikumpulkan dari berbagai sumber dapat menyebabkan masalah kualitas data yang mungkin sulit ditentukan. Jika masalah ini tidak diperbaiki melalui proses pembersihan data, data yang buruk akan menyebabkan kesalahan analisis yang dapat melemahkan nilai inisiatif analisis bisnis. Tim manajemen data dan analitik juga perlu memastikan bahwa mereka memiliki cukup data akurat untuk menghasilkan hasil yang valid.

Beberapa data scientist dan konsultan juga menambah nilai pada daftar karakteristik big data. Tidak semua data yang dikumpulkan memiliki nilai atau manfaat bisnis yang nyata. Akibatnya, organisasi perlu memastikan bahwa data berkaitan dengan masalah bisnis yang relevan sebelum digunakan dalam proyek analisis data besar.

Variabilitas juga sering diterapkan pada kumpulan data besar, yang mungkin memiliki banyak arti atau diformat berbeda dalam sumber data terpisah -- faktor yang semakin memperumit pengelolaan dan analisis data besar.


Contoh Big Data

Big data berasal dari berbagai sumber -- beberapa contohnya adalah sistem pemrosesan transaksi, database pelanggan, dokumen, email, rekam medis, log clickstream internet, aplikasi seluler, dan jejaring sosial. Ini juga mencakup data yang dihasilkan mesin, seperti file log jaringan dan server serta data dari sensor pada mesin manufaktur, peralatan industri, dan perangkat internet of things.
Apa Itu Big Data, Karakteristik Dan Contohnya!
Apa Itu Big Data, Karakteristik Dan Contohnya!



Selain data dari sistem internal, lingkungan big data sering kali menggabungkan data eksternal tentang konsumen, pasar keuangan, kondisi cuaca dan lalu lintas, informasi geografis, penelitian ilmiah, dan banyak lagi. File gambar, video, dan audio juga merupakan bentuk data besar, dan banyak aplikasi data besar melibatkan data streaming yang diproses dan dikumpulkan secara terus-menerus.

Sosial Media Analytics:
  • Volume Tinggi: Data dari platform media sosial seperti Twitter, Facebook, dan Instagram mencakup jutaan tweet, kiriman, dan foto setiap harinya.
  • Kecepatan Tinggi: Informasi ini diperbarui dalam waktu nyata, membutuhkan analisis cepat untuk mendapatkan wawasan yang relevan.
  • Keragaman: Data sosial mencakup teks, gambar, dan video, menambah kompleksitas dalam pemrosesan dan analisis.

Data Sensor IoT (Internet of Things):
  • Volume Tinggi: Sensor pada perangkat IoT seperti kendaraan, perangkat rumah pintar, dan peralatan industri menghasilkan jumlah data yang besar.
  • Kecepatan Tinggi: Sensor dapat menghasilkan data dalam frekuensi tinggi, terutama dalam lingkungan industri yang memantau proses secara real-time.
  • Variabilitas dan Kediversitan: Data dapat berupa suhu, tekanan, lokasi, dan berbagai parameter lainnya.

Data Transaksi Keuangan:
  • Volume Tinggi: Transaksi perbankan, pembelian online, dan perdagangan saham menghasilkan volume data yang signifikan setiap hari.
  • Kecepatan Tinggi: Dalam perdagangan saham dan keuangan, waktu eksekusi transaksi menjadi kritis, membutuhkan pemrosesan data yang cepat.
  • Variabilitas: Data dapat mencakup informasi dari berbagai jenis transaksi, termasuk pembayaran, transfer, dan investasi.

Data Genomik:
  • Volume Besar: Data genomik menggambarkan informasi genetik individu dan dapat mencapai ukuran yang sangat besar.
  • Keragaman dan Kedalaman: Informasi kompleks dalam data genomik mencakup variasi genetik, sekuensi DNA, dan informasi biologis lainnya.

Data Medis dan Kesehatan:
  • Volume Besar: Rekam medis elektronik, hasil tes, dan data kesehatan lainnya menghasilkan volume data yang besar.
  • Kecepatan Tinggi: Dalam konteks perawatan medis, waktu pemrosesan data dapat kritis untuk diagnosis dan perawatan cepat.
  • Variabilitas: Data medis mencakup berbagai informasi, termasuk gambar medis, catatan pasien, dan hasil uji laboratorium.

Data Pencarian dan Navigasi Online:
  • Volume Besar: Mesin pencari seperti Google memproses miliaran permintaan pencarian setiap hari.
  • Kecepatan Tinggi: Pencarian dan navigasi online membutuhkan respons cepat untuk memberikan hasil yang relevan dan tepat waktu.

Sekian artikel Big Data dari KonsepKoding semoga artikel mengenai pengertian Big Data, karakteristik Big Data dan Contoh dari Big Data bisa bermanfaat dan membantu kamu yang sedang mempelajari Big Data.