1 Pendahuluan
Visualisasi data adalah seni bagian dan ilmu bagian.Tantangannya adalah untuk mendapatkan seni yang benar tanpa salah sains dan sebaliknya. Visualisasi data pertama dan terutama harus menyampaikan data secara akurat. Itu tidak boleh menyesatkan atau memutarbalikkan. Jika satu angka dua kali lebih besar dari yang lain, tetapi dalam visualisasi mereka terlihat hampir sama, maka visualisasi itu salah. Pada saat yang sama, visualisasi data harus menyenangkan secara estetika. Presentasi visual yang baik cenderung meningkatkan pesan visualisasi. Jika gambar mengandung warna yang menggelegar, elemen visual yang tidak seimbang, atau fitur lain yang mengganggu, maka pemirsa akan merasa lebih sulit untuk memeriksa gambar tersebut dan menafsirkannya dengan benar.
Dalam pengalaman saya, para ilmuwan sering (meskipun tidak selalu!) Tahu cara memvisualisasikan data tanpa terlalu menyesatkan. Namun, mereka mungkin tidak memiliki rasa estetika visual yang berkembang dengan baik, dan mereka mungkin secara tidak sengaja membuat pilihan visual yang mengurangi pesan yang diinginkan. Desainer, di sisi lain, dapat menyiapkan visualisasi yang terlihat indah tetapi bermain cepat dan longgar dengan data. Adalah tujuan saya untuk memberikan informasi yang berguna bagi kedua kelompok.
Buku ini mencoba untuk membahas prinsip-prinsip utama, metode, dan konsep yang diperlukan untuk memvisualisasikan data untuk publikasi, laporan, atau presentasi. Karena visualisasi data adalah bidang yang luas, dan dalam definisi terluasnya dapat mencakup beragam topik seperti gambar teknik skematik, animasi 3D, dan antarmuka pengguna, saya harus membatasi ruang lingkup saya untuk buku ini. Saya secara khusus membahas kasus visualisasi statis yang disajikan dalam bentuk cetak, online, atau sebagai slide. Buku ini tidak mencakup visual interaktif atau film, kecuali dalam satu bagian singkat dalam bab tentang memvisualisasikan ketidakpastian. Oleh karena itu, sepanjang buku ini, saya akan menggunakan kata-kata "visualisasi" dan "angka" secara bergantian. Buku ini juga tidak memberikan instruksi apa pun tentang cara membuat angka dengan perangkat lunak visualisasi yang ada atau perpustakaan pemrograman. Bibliografi beranotasi di bagian akhir buku ini berisi petunjuk untuk teks yang sesuai yang membahas topik-topik ini.
Buku ini dibagi menjadi tiga bagian. Yang pertama, “Dari data hingga visualisasi,” menjelaskan berbagai jenis plot dan diagram, seperti grafik batang, grafik sebar, atau diagram lingkaran. Penekanan utamanya adalah ilmu visualisasi.Dalam bagian ini, alih-alih berusaha memberikan liputan ensiklopedis dari setiap pendekatan visualisasi yang mungkin, saya membahas serangkaian inti visual yang kemungkinan akan Anda temui dalam publikasi dan / atau kebutuhan dalam karya Anda sendiri. Dalam mengatur bagian ini, saya telah mencoba untuk mengelompokkan visualisasi berdasarkan jenis pesan yang mereka sampaikan dan bukan tipe data yang divisualisasikan. Teks statistik sering menggambarkan analisis data dan visualisasi berdasarkan jenis data, pengorganisasian bahan berdasarkan jumlah dan jenis variabel (satu variabel kontinu, satu variabel diskrit, dua variabel kontinu, satu kontinu dan satu variabel diskrit, dll.). Saya percaya bahwa hanya ahli statistik yang menganggap organisasi ini bermanfaat.Kebanyakan orang berpikir dalam hal pesan, seperti seberapa besar sesuatu itu, bagaimana itu terdiri dari bagian, bagaimana hubungannya dengan sesuatu yang lain, dan seterusnya.
Bagian kedua, "Prinsip desain gambar," membahas berbagai masalah desain yang muncul saat mengumpulkan visualisasi data. Penekanan utamanya tetapi tidak eksklusif adalah aspek estetika dari visualisasi data. Setelah kami memilih jenis plot atau bagan yang tepat yang sesuai untuk dataset kami, kami harus membuat pilihan estetika tentang elemen visual, seperti warna, simbol, dan ukuran font. Pilihan-pilihan ini dapat memengaruhi seberapa jelas visualisasi dan seberapa elegan tampilannya. Bab-bab dalam bagian kedua ini membahas masalah paling umum yang telah saya lihat muncul berulang kali dalam aplikasi praktis.
Bagian ketiga, "Topik lain-lain," mencakup beberapa masalah yang tersisa yang tidak masuk ke dalam dua bagian pertama.Ini membahas format file yang biasa digunakan untuk menyimpan gambar dan plot, memberikan pemikiran tentang pilihan perangkat lunak visualisasi, dan menjelaskan cara menempatkan angka individu ke dalam konteks dokumen yang lebih besar.
Angka jelek, buruk, dan salah
Sepanjang buku ini, saya sering menunjukkan versi berbeda dari angka yang sama, beberapa sebagai contoh bagaimana membuat visualisasi yang baik dan beberapa sebagai contoh bagaimana tidak. Untuk memberikan pedoman visual sederhana tentang contoh mana yang harus ditiru dan mana yang harus dihindari, saya dengan jelas memberi label angka-angka bermasalah sebagai "jelek", "buruk", atau "salah" (Gambar 1.1 ):
- jelek — Sosok yang memiliki masalah estetika tetapi jelas dan informatif.
- buruk —Sosok yang memiliki masalah terkait persepsi;mungkin tidak jelas, membingungkan, terlalu rumit, atau menipu.
- salah — Sosok yang memiliki masalah yang berkaitan dengan matematika; itu secara objektif salah.

Gambar 1.1: Contoh figur yang jelek, buruk, dan salah. (A) Plot bar yang menunjukkan tiga nilai (A = 3, B = 5, dan C = 4). Ini adalah visualisasi yang masuk akal tanpa cacat besar. (B) Versi bagian yang jelek (a). Meskipun plotnya benar secara teknis, tapi secara estetika tidak menyenangkan.Warnanya terlalu cerah dan tidak berguna. Grid latar belakang terlalu menonjol. Teks ditampilkan menggunakan tiga font berbeda dalam tiga ukuran berbeda. (c) Versi bagian yang buruk (a). Setiap bilah ditampilkan dengan skala y- sumbu sendiri. Karena skala tidak sejajar, ini membuat angka itu menyesatkan. Orang bisa dengan mudah mendapatkan kesan bahwa ketiga nilai itu lebih dekat daripada yang sebenarnya. (D) Versi bagian yang salah (a). Tanpa skala sumbu y eksplisit, angka-angka yang diwakili oleh batang tidak dapat dipastikan. Bilah tampak memiliki panjang 1, 3, dan 2, meskipun nilai yang ditampilkan dimaksudkan menjadi 3, 5, dan 4.
Saya tidak secara eksplisit memberi label angka-angka yang baik. Angka apa pun yang tidak jelas dicap sebagai cacat harus dianggap setidaknya dapat diterima. Ini adalah sosok yang informatif, terlihat menarik, dan dapat dicetak apa adanya. Perhatikan bahwa di antara angka-angka yang baik, masih akan ada perbedaan kualitas, dan beberapa angka yang baik akan lebih baik daripada yang lain.
Saya biasanya memberikan alasan saya untuk peringkat tertentu, tetapi beberapa masalah selera. Secara umum, peringkat “jelek” lebih subyektif daripada peringkat “buruk” atau “salah”. Selain itu, batas antara "jelek" dan "buruk" agak cair. Kadang-kadang pilihan desain yang buruk dapat mengganggu persepsi manusia ke titik di mana peringkat "buruk" lebih tepat daripada peringkat "jelek".Bagaimanapun, saya mendorong Anda untuk mengembangkan mata Anda sendiri dan untuk mengevaluasi secara kritis pilihan saya.
