Kang Nur


Suka main, njajan, dan data
Share: 

Diperbarui Jumat, 17 Mei 2024

Ditulis oleh Kang Nur

Memahami Konsep Utama Pada Data Analytics

Data analytics atau analisis data menjadi salah satu kunci dalam keputusan bisnis di era digital. Pemahaman tentang konsep utama dalam analisis data wajib dimatangkan dengan baik oleh praktisi data. Pada tulisan ini, kita akan membahas mengenai beberapa konsep utama ketika melakukan analisis data dari tahap pengumpulan hingga data siap dihidangkan. Tak lupa, kita juga akan menyinggung peran statistik dan machine learning untuk menghadapi data yang semakin kompleks.

  1. Collection

    Data collection atau yang juga disebut data gathering atau istilah kita pengumpulan data adalah langkah awal dalam analisis data. Data dikumpulkan dari berbagai sumber, baik itu database internal perusahaan, data sensor, data dari API, atau sumber data publik. Penting suatu organisasi untuk memastikan bahwa data yang dikumpulkan berkualitas dan relevan dengan tujuan bisnis.

  2. Cleanup

    Data cleaning disebut juga data cleansing atau istilah kita pembersihan data adalah proses di mana data yang telah dikumpulkan dibersihkan untuk memastikan kualitas data yang bagus agar mendapatkan insight yang akurat yang pada akhirnya menghasilkan keputusan bisnis yang baik dan tepat. Ini mencakup beberapa hal seperti: Menghapus data yang duplikat dan tidak relevan dengan bisnis, menangani data yang hilang (missing value), dan merubah tipe data yang kurang tepat.

  3. Exploration

    Exploratory Data Analysis (EDA) atau eksplorasi data digunakan untuk memahami struktur dan karakteristik data. Ini mencakup statistika deskriptif, pengelompokan data, dan pemodelan sederhana untuk mendapatkan insight awal tentang data. Tahap ini membantu data analyst dalam memahami pola, tren, dan hubungan antar variabel dalam data.

  4. Visualization

    Data visualization atau visualisasi data adalah teknik yang digunakan untuk merepresentasikan data secara visual melalui grafik, diagram, plot atau sejenisnya. Tujuannya adalah untuk membuat data lebih mudah dipahami dan diinterpretasikan oleh orang-orang yang tidak memiliki latar belakang teknis yang kuat. Visualisasi yang tepat dapat membantu dalam mengidentifikasi pola yang menarik, membuat komunikasi hasil analisis menjadi lebih interaktif, dan mendukung pengambilan keputusan.

Selain itu, ada dua konsep utama yang penting dalam analisis data:

  1. Statistical Analysis

    Analisis statistik melibatkan penggunakan metode statistik untuk merumuskan dan menguji hipotesis, mengekstraksi insight dari data dan membuat inferensi. Ini mencakup penggunaan distribusi, uji hipotesis, analisis regresi, dan analisis multivariate untuk menggali lebih dalam pola dan korelasi variabel dalam data.

  2. Machine Learning

    Machine learning adalah cabang dari Artificial Intelligence yaitu sebuah bidang studi yang memberikan kemampuan mesin dalam hal ini komputer untuk belajar tanpa diprogram secara eksplisit. Ini mencakup berbagai algoritma seperti regresi, klasifikasi, pengelompokan (clustering), dan jaringan syaraf (neural network). Ada empat jenis machine learning yang akan sering kita temui pada saat berkutat dengan dunia data, yaitu: Supervised Learning, Unsupervised Learning, Semi-supervised Learning, dan Reinforcement Learning.

Referensi :

  1. Igual, L., SeguĂ­, S. (2017). Introduction to Data Science. Springer Cham.
  2. Rahm, E., & Do, H.H. (2000). Data Cleaning: Problems and Current Approaches. IEEE Data(base) Engineering Bulletin, 23, 3-13.
  3. Velleman, P. F., & Hoaglin, D. C. (1981). Applications, Basics, and Computing of Exploratory Data Analysis. Duxbury Press.