VISUAL DATA DALAM STASTISTIKA

 Pengertian visualisasi data

Visualisasi data adalah proses membuat representasi visual dari data.Visualisasi data merupakan alat yang ampuh untuk menjelajahi kumpulan data yang besar dan kompleks.


Memvisualisasikan data membantu pengguna untuk memahami pola, tren, hubungan, dan outlier yang tersembunyi di dalam data yang besar dan kompleks.


Visualisasi data atau data visualization juga dapat didefinisikan sebagai bentuk grafis atau visual dari data dan informasi.


Visualisasi data mengacu pada teknik yang digunakan untuk mengkomunikasi data atau informasi dengan membuatnya sebagai objek visual (misalnya, titik, garis, atau batang) dalam grafik.


Visualisasi data merupakan ilmu dan seni.


Ilmu dalam artian kita perlu memperhatikan panduan dan aturan ilmiah yang mengikatnya.


Seni dalam artian kita bisa menggunakan dan mengkombinasikan penggunaan variabel dan elemen grafis untuk membuat visual data yang efektif dan menarik.


Tujuan visualisasi data

Setidaknya ada tiga tujuan visualisasi data, yaitu:


mempresentasikan data dan informasi


membantu eksplorasi data

metode untuk analisis data


Mempresentasikan data dan informasi

Tujuan utama dari visualisasi data adalah untuk mengkomunikasikan informasi secara jelas dan efisien kepada pengguna.


Melalui visualisasi yang baik, data kompleks yang ditampilkan secara visual menjadi lebih mudah dipahami oleh orang awam.



Selain itu, visualisasi yang efektif membantu pengguna dalam menganalisis dan penalaran data. Kita akan pelajari bagian ini se


Membantu proses eksplorasi data

Dalam konteks statistika dan data science, proses analisis data menggunakan grafik merupakan proses yang vital.


Proses ini masuk ke dalam tahap Exploratory Data Analysis (EDA).


Visualisasi data yang efektif merupakan langkah awal dalam sebuah analisis data yang baik.


Hal ini dikarenakan data yang ditampilkan secara visual dapat menunjukkan pola-pola yang tidak bisa disampaikan oleh data berupa teks atau angka.


Maka, langkah pertama dalam proses analisis data adalah membuat grafik-grafik dari data dan memahaminya.


Metode analisis data

Konsep ini memunculkan istilah visual analytics.


Visual analytics atau analisis visual merupakan ilmu untuk melakukan penalaran analitik (reasoning analytics) dengan didukung oleh antarmuka visual yang interaktif.


Dengan perkembangan produksi data yang semakin cepat, metode ini memungkinkan pembuat keputusan menggunakan fleksibilitas, kreativitas, dan pengetahuan latar belakang mereka.


Advertisements

Selain itu, metode ini dapat digunakan untuk memaksimalkan kapasitas penyimpanan dan pemrosesan yang sangat besar dari komputer saat ini untuk mendapatkan wawasan tentang masalah yang kompleks.


Ditambah dengan proses pembuatan dan penggunaan visualisasi data yang efektif, proses analisis dengan berdasarkan visual bisa sangat powerful.


Jenis visualisasi data

Terdapat banyak bentuk atau jenis visualisasi yang telah umum digunakan.


Berikut adalah 15 buah di antaranya:


1. Column Chart

2. Bar Graph

3. Stacked Bar Graph

4. Stacked Column Chart

5. Area Chart

6. Dual Axis Chart

7. Line Graph

8. Mekko Chart

9. Pie Chart

10. Waterfall Chart

11. Bubble Chart

12. Scatter Plot Chart

13. Bullet Graph

14. Funnel Chart

15. Heat Map


Cara membuat visualisasi data

Setelah mengetahui beberapa tips dan kesalahan yang sering terjadi dalam proses visualisasi data, selanjutnya kita akan bahas bagaimana langkah-langkahnya secara detil.

Setidaknya ada enam tahap yang kita lakukan:

  1. Menentukan tujuan visualisasi data
  2. Menentukan target visualisasi data
  3. Mendapatkan dan meng-eksplor data
  4. Menentukan jenis visualisasi
  5. Membuatnya efektif dan menarik
  6. Evaluasi

Mari kita bahas lebih dalam.

Menentukan tujuan

Pertama, tentukan tujuan visualisasi data yang akan kita lakukan.

Seperti yang dijelaskan di atas, ada tiga tujuan visualisasi data.

  • mempresentasikan data dan informasi
  • membantu eksplorasi data
  • metode untuk analisis data

Tujuan visualisasi menentukan kemana arah visualisasi data kita.

Menentukan target visualisasi data

Siapa target audience yang kita targetkan?

Hal ini sangat penting untuk kita perhatikan, terutama jika tujuan visualisasi adalah untuk menampilkan informasi.

Advertisements

Informasi yang akan kita sajikan haruslah sesuai dengan target audiens, agar informasi dapat disampaikan secara efektif dan menarik.

Beberapa hal yang perlu kita pertimbangkan antara lain:

  • Usia audiens (anak-anak vs remaja vs dewasa vs lansia)
  • Latar belakang pendidikan

Pertanyaan selanjutnya adalah:

Apa medium visualisasi data yang akan kita buat?

Apakah hanya akan ditampilkan di layar monitor kita untuk membantu eksplorasi data?

Apa untuk paper yang akan disubmit di jurnal ilmiah?

Untuk laporan skripsi atau tugas akhir?

Laporan perusahaan?

Infografis?

Website atau video youtube?

Sudah bisa membayangkan, mengapa menentukan medium visualisasi di awal sangat penting?

Mendapatkan dan meng-eksplor data

Setelah tahu apa tujuan dan target dari visualisasi data, kini saatnya kita mendapatkan data dan mempersiapkannya untuk dapat divisualkan dengan baik.

Pertama, kita cari data yang kita butuhkan.

Kita bisa mencari data ke berbagai sumber, misal data kependudukan ke BPS, atau data spasial ke Inageoportal.

Data juga bisa kita dapatkan dari buku atau laporan-laporan yang sudah ada.

Advertisements

Kedua, kita susun ulang data kita.

Semakin banyak data yang kita dapatkan, semakin berat proses ini dilakukan.

Apalagi seringkali kita mendapatkan data yang raw dan belum siap olah.

Pada tahap ini, kita dapat melakukan join data, atau mem-format ulang kolom dan baris data kita.

Tentu kita perlu melakukan restrukturisasi untuk mempermudah proses visualisasi data kita nantinya.

Ketiga, kita lakukan filter data.

Pada tahap ini, kita buang semua data kita. Kecuali yang benar-benar kita perlukan.

Misal, jika kita hanya perlukan data Provinsi Aceh, maka data provinsi lain dapat kita buang.

Atau jika kita hanya memerlukan data tahun 2000-2010, maka data di luar periode ini sebaiknya kita buang juga.

Semakin fokus dan ramping akan semakin baik.

Tapi tentunya harus selalu mempetimbangkan tujuan visualisasi data yang kita lakukan.

Bagaimana jika kita belum yakin dengan visualisasi yang akan kita lakukan?

Jawaban pertama untuk pertanyaan ini adalah, berkonsultasilah.

Tanyakan ke dosen pembimbing, tanyakan ke klien, tanyakan ke supervisor.

Minta pendapat mereka.

Advertisements

Cara lainnya adalah dengan kembali ke data raw yang sudah dirapikan.

Lalu lakukan eksplorasi visualisasi data dengan data-data yang ada.

Ajukan berbagai macam pertanyaan dan buat visualisasi untuk menjawab pertanyaan-pertanyaanmu.

Bagaimana jika data yang kita punya belum dapat digunakan untuk menjawab tujuan visualisasi?

Cari data lagi.

Atau lakukan analisis data.

Gunakan statistika deskriptif sederhana, pengujian hipotesis, atau lakukan pemodelan statistika dan data mining.

Menentukan jenis visualisasi

Kini tiba saatnya proses visualisasi data.

Untuk menentukan bentuk visualisasi datanya, kita jawab dulu pertanyaan berikut:

  • Apa tujuan visualisasi?
  • Apa jenis datanya?
  • Apakah variabel memiliki perubahan akibat perubahan waktu?
  • Berapa variabel yang akan ditampilkan?
  • Berapa jumlah kelas atau kategori di setiap kelas?
1. Apa tujuan visualisasi?

Pertanyaan ini dapat dijawab dengan memilih satu dari empat tujuan visualisasi, yaitu:

  • Menunjukkan perbandingan
  • Menunjukkan sebaran atau distribusi
  • Menunjukkan komposisi
  • Menunjukkan hubungan
2. Apa jenis datanya?

Lihat kembali jenis dan skala data yang akan divisualkan.

Data dapat dibagi menjadi dua jenis:

  • Data kualitatif
  • Data kuantitatif

Pemahaman mengenai jenis dan skala data akan sangat membantu dalam menentukan jenis visualisasi yang tepat.

Untuk lebih memahami topik ini, baca artikel berikut.

3. Apakah variabel berubah seiring waktu?

Pertanyaan ini sekaligus juga digunakan untuk menentukan apakah ada trend temporal yang terjadi pada data kita.

Advertisements

Jawaban untuk pertanyaan ini adalah:

  • Data statis/ tidak berubah/ hanya menampilkan satu waktu
  • Data berubah seiring waktu

Jika data berubah seiring waktu, lihat juga berapa periode waktu yang terekam dalam data kita:

  • Dua periode
  • Banyak periode
4. Berapa variabel yang akan ditampilkan?

Perhatikan juga berapa jumlah variabel yang akan kita tampilkan:

  • Satu variabel
  • Lebih dari satu variabel
5. Berapa jumlah kelas atau kategori di setiap kelas?

Selanjutnya, lihat jumlah kategori di setiap variabel.

Kita kategorikan menjadi:

  • Sedikit kelas
  • Banyak kelas

Nama : M Athallah Permana A
Npm : 19316019
Kelas : TK 19 A

Komentar

Postingan populer dari blog ini

Geometric Distribution & Poisson Distribution

CONDITIONAL PROBABILITAS

Desain Eksperimen