Pendahuluan
Di era big data sekarang ini, visualisasi data menjadi alat penting untuk menyampaikan insight dari kumpulan angka. Namun visualisasi tidak selalu bersifat netral misalnya cara kita memilih, menata, dan menyorot data bisa membawa bias. Salah satu bentuk bias berbahaya adalah confirmation bias atau "menyukai data yang mengonfirmasi hipotesis kita", yang bisa membuat kita mengabaikan data yang justru menantang asumsi awal.
Di Kompasiana, beberapa penulis menyoroti persoalan penyajian data yang "mempercantik" narasi dibanding menyajikan apa adanya. Misalnya dalam artikel "a picture is worth a thousand words can lead to misleading data visualization", disebut bahwa visualisasi yang disalahgunakan bisa "menipu ribuan pikiran" jika pembuatnya memilih hanya data yang "enak dilihat" atau mendukung argumen.
1. Mengenal Bias dalam Visualisasi Data
Confirmation Bias & Cherry-Picking
Confirmation bias (bias konfirmasi) adalah kecenderungan untuk mencari, memilih, atau menafsirkan informasi sedemikian rupa hingga memperkuat keyakinan yang sudah ada. (Wikipedia) Dalam konteks visualisasi, ini bisa berarti memilih subset data yang mendukung hipotesis dan mengabaikan data yang bertentangan (biasa disebut juga dengan cherry-picking). Cherry-picking adalah praktik memilih "buah terbaik" dan menyembunyikan yang tidak sesuai narasi. Ini bisa terjadi secara sadar maupun tak sadar, dan sering kali mengikis integritas analisis. (Institute of Data)
Bias Persepsi & Interpretasi Visual
Tak hanya pada pemilihan data, bias juga bisa muncul saat orang melihat grafik: kita cenderung memperkirakan pola yang konsisten dengan keyakinan kita sendiri, bahkan ketika data menunjukkan variasi atau inkonsistensi. Dalam studi "Seeing What You Believe ... Belief Biases Correlation Estimation", peneliti menemukan bahwa jika seseorang percaya bahwa dua variabel berkorelasi, mereka cenderung menilai korelasi lebih kuat dari seharusnya dalam scatterplot. (arXiv)
Artinya, visualisasi yang tampak objektif bisa tetap "diwarnai" oleh apa yang sudah kita percaya sebelumnya.
Visualisasi yang Menyembunyikan Variabilitas
Desain grafik yang menyembunyikan variasi atau outlier (misalnya dengan menghapus skala ekstrem, memotong sumbu, menggunakan agregat tinggi) bisa memperkuat narasi tunggal. Misalnya, bar chart yang hanya menampilkan rata-rata tanpa error bar atau distribusi internal dapat menyamarkan variasi penting. (arXiv)