Hindari gambar garis

25 Hindari gambar garis

Kapan pun memungkinkan, visualisasikan data Anda dengan bentuk warna yang solid dan bukan dengan garis yang menggambarkan bentuk itu. Bentuk padat lebih mudah dirasakan sebagai objek yang koheren, lebih kecil kemungkinannya untuk membuat artefak visual atau ilusi optik, dan melakukan lebih segera menyampaikan jumlah daripada melakukan garis besar. Dalam pengalaman saya, visualisasi menggunakan bentuk padat lebih jelas dan lebih menyenangkan untuk dilihat daripada versi yang setara yang menggunakan gambar garis. Jadi, saya menghindari gambar garis sebanyak mungkin. Namun, saya ingin menekankan bahwa rekomendasi ini tidak menggantikan prinsip tinta proporsional (Bab 17 ).
Gambar garis memiliki sejarah panjang dalam bidang visualisasi data karena sepanjang sebagian besar abad ke-20, visualisasi ilmiah digambar dengan tangan dan harus dapat direproduksi dalam warna hitam-putih. Ini menghalangi penggunaan area yang diisi dengan warna-warna solid, termasuk isian skala abu-abu padat. Sebaliknya, area yang diisi kadang-kadang disimulasikan dengan menerapkan pola penetasan, lintas-penetasan, atau stipple. Perangkat lunak plot awal meniru simulasi yang digambar tangan dan juga menggunakan gambar garis, pola garis putus-putus atau putus-putus, dan penetasan. Sementara alat visualisasi modern dan platform reproduksi dan penerbitan modern tidak memiliki keterbatasan sebelumnya, banyak aplikasi merencanakan masih default untuk menguraikan dan bentuk kosong daripada daerah diisi. Untuk meningkatkan kesadaran Anda tentang masalah ini, di sini saya akan menunjukkan kepada Anda beberapa contoh angka yang sama yang digambar dengan kedua garis dan bentuk yang diisi.
Penggunaan gambar garis yang paling umum dan paling tidak tepat terlihat dalam histogram dan plot bar. Masalah dengan bar yang digambarkan sebagai garis besar adalah bahwa tidak segera jelas sisi mana dari setiap garis yang ada di dalam bar dan sisi mana yang berada di luar. Sebagai konsekuensinya, khususnya ketika ada celah di antara palang, kita berakhir dengan pola visual yang membingungkan yang mengurangi pesan utama gambar (Gambar 25.1 ). Mengisi palang dengan warna terang, atau abu-abu jika reproduksi warna tidak memungkinkan, hindari masalah ini (Gambar 25.2 ).
Histogram zaman penumpang Titanic, digambar dengan bar kosong. Bilah kosong membuat pola visual yang membingungkan. Di tengah histogram, sulit untuk mengetahui bagian mana di dalam jeruji dan bagian mana di luar.
Gambar 25.1: Histogram usia penumpang Titanic, digambar dengan palang kosong. Bilah kosong membuat pola visual yang membingungkan. Di tengah histogram, sulit untuk mengetahui bagian mana di dalam jeruji dan bagian mana di luar.
Histogram yang sama dari Gambar 25.1, sekarang digambar dengan bilah penuh. Bentuk distribusi usia jauh lebih mudah terlihat dalam variasi angka ini.
Gambar 25.2: Histogram yang sama dengan Gambar 25.1 , sekarang digambar dengan bilah penuh. Bentuk distribusi usia jauh lebih mudah terlihat dalam variasi angka ini.
Selanjutnya, mari kita lihat plot kepadatan sekolah tua. Saya menunjukkan perkiraan kepadatan untuk distribusi sepal-panjang dari tiga spesies iris, seluruhnya diambil dalam warna hitam-putih sebagai gambar garis (Gambar 25.3 ).Distribusi ditampilkan hanya dengan garis besarnya, dan karena gambarnya hitam-putih, kami menggunakan gaya garis yang berbeda untuk membedakannya. Angka ini memiliki dua masalah utama. Pertama, gaya garis putus-putus tidak memberikan pemisahan yang jelas antara area di bawah kurva dan area di atasnya. Meskipun sistem visual kami cukup baik dalam menghubungkan elemen garis individu menjadi garis kontinu, garis putus-putus tetap terlihat keropos dan tidak berfungsi sebagai batas yang kuat dari area yang tertutup. Kedua, karena garis-garis berpotongan dan area-area yang mereka tutup tidak berbayang, sulit untuk mengelompokkan kepadatan yang berbeda dari enam garis bentuk yang berbeda. Efek ini akan lebih kuat seandainya saya menggunakan garis putus-putus daripada garis putus-putus untuk ketiga distribusi.
Perkiraan kepadatan sepal panjang dari tiga spesies iris yang berbeda. Gaya garis putus-putus yang digunakan untuk versicolor dan virginica mengurangi persepsi bahwa area di bawah kurva berbeda dari area di atas mereka.
Gambar 25.3: Perkiraan kepadatan dari sepal dari tiga spesies iris yang berbeda. Gaya garis putus-putus yang digunakan untuk versicolor dan virginica mengurangi persepsi bahwa area di bawah kurva berbeda dari area di atas mereka.
Kami dapat mencoba untuk mengatasi masalah batas berpori dengan menggunakan garis berwarna daripada garis putus-putus (Gambar 25.4 ). Namun, area kepadatan dalam plot yang dihasilkan masih memiliki sedikit kehadiran visual.Secara keseluruhan, saya menemukan versi dengan area penuh (Gambar 25.5 ) yang paling jelas dan intuitif. Namun, penting untuk membuat area yang diisi sebagian transparan, sehingga distribusi lengkap untuk setiap spesies terlihat.
Perkiraan kepadatan sepal panjang dari tiga spesies iris yang berbeda. Dengan menggunakan garis-garis padat dan berwarna, kami telah menyelesaikan masalah pada Gambar 25.3 bahwa area di bawah dan di atas garis tampaknya terhubung. Namun, kami masih tidak memiliki rasa yang kuat tentang ukuran area di bawah setiap kurva.
Gambar 25.4: Perkiraan kepadatan dari sepal dari tiga spesies iris yang berbeda. Dengan menggunakan garis-garis padat dan berwarna, kami telah menyelesaikan masalah pada Gambar 25.3 bahwa area di bawah dan di atas garis tampaknya terhubung. Namun, kami masih tidak memiliki rasa yang kuat tentang ukuran area di bawah setiap kurva.
Perkiraan kepadatan sepal panjang dari tiga spesies iris yang berbeda, ditampilkan sebagai daerah teduh sebagian transparan.
Gambar 25.5: Perkiraan kepadatan dari sepal dari tiga spesies iris yang berbeda, ditampilkan sebagai daerah teduh sebagian transparan.
Gambar garis juga muncul dalam konteks plot pencar, ketika berbagai tipe titik digambar sebagai lingkaran terbuka, segitiga, persilangan, dll. Sebagai contoh, perhatikan Gambar 25.6 . Angka tersebut mengandung banyak noise visual, dan tipe titik yang berbeda tidak sangat terpisah satu sama lain. Menggambar gambar yang sama dengan bentuk berwarna solid mengatasi masalah ini (Gambar 25.7 ).
Ekonomi bahan bakar kota versus perpindahan engine, untuk mobil dengan penggerak roda depan (FWD), penggerak roda belakang (RWD), dan penggerak semua roda (4WD). Gaya titik yang berbeda, semua simbol garis-hitam-putih, membuat kebisingan visual yang besar dan membuatnya sulit untuk membaca gambar.
Gambar 25.6: Ekonomi bahan bakar kota versus perpindahan engine, untuk mobil dengan penggerak roda depan (FWD), penggerak roda belakang (RWD), dan penggerak semua roda (4WD). Gaya titik yang berbeda, semua simbol garis-hitam-putih, membuat kebisingan visual yang besar dan membuatnya sulit untuk membaca gambar.
Ekonomi bahan bakar kota versus perpindahan engine. Dengan menggunakan kedua warna yang berbeda dan bentuk padat yang berbeda untuk varian drive-train yang berbeda, gambar ini dengan jelas memisahkan varian drive-train sambil tetap dapat direproduksi dalam skala abu-abu jika diperlukan.
Gambar 25.7: Ekonomi bahan bakar kota versus perpindahan engine.Dengan menggunakan kedua warna yang berbeda dan bentuk padat yang berbeda untuk varian drive-train yang berbeda, gambar ini dengan jelas memisahkan varian drive-train sambil tetap dapat direproduksi dalam skala abu-abu jika diperlukan.
Saya sangat suka titik padat daripada titik terbuka, karena titik padat memiliki lebih banyak tampilan visual. Argumen yang kadang-kadang saya dengar dalam mendukung poin terbuka adalah bahwa mereka membantu dengan overplotting, karena area kosong di tengah setiap titik memungkinkan kita untuk melihat titik lain yang mungkin terletak di bawahnya. Menurut pendapat saya, manfaat dari dapat melihat titik-titik yang overplot tidak, secara umum, lebih besar daripada kerugian dari kebisingan visual tambahan dari simbol terbuka. Ada beberapa pendekatan lain untuk menangani overplotting, lihat Bab 18 untuk beberapa saran.
Akhirnya, mari pertimbangkan boxplots. Boxplots umumnya digambar dengan kotak kosong, seperti pada Gambar 25.8 .Saya lebih suka bayangan cahaya untuk kotak, seperti pada Gambar 25.9 . Bayangan memisahkan kotak lebih jelas dari latar belakang plot, dan itu membantu khususnya ketika kita menunjukkan banyak plot kotak tepat di samping satu sama lain, seperti halnya pada Gambar 25.8 dan 25.9 . Pada Gambar 25.8 , sejumlah besar kotak dan garis dapat kembali menciptakan ilusi area latar belakang di luar kotak yang sebenarnya berada di bagian dalam beberapa bentuk lain, seperti yang kita lihat pada Gambar 25.1 . Masalah ini dihilangkan pada Gambar 25.9 . Saya kadang-kadang mendengar kritik bahwa menaungi bagian dalam kotak memberi terlalu banyak bobot ke pusat 50% dari data, tapi saya tidak membeli argumen itu. Hal ini melekat pada boxplot, kotak yang diarsir atau tidak, untuk memberikan bobot lebih ke pusat 50% dari data daripada yang lainnya.Jika Anda tidak ingin penekanan ini, maka jangan gunakan boxplot. Alih-alih, gunakan plot biola, titik-titik gugup, atau plot sina (Bab 9 ).
Distribusi suhu rata-rata harian di Lincoln, Nebraska, pada 2016. Kotak diambil dengan cara tradisional, tanpa naungan.
Gambar 25.8: Distribusi suhu rata-rata harian di Lincoln, Nebraska, pada 2016. Kotak diambil dengan cara tradisional, tanpa naungan.
Distribusi suhu rata-rata harian di Lincoln, Nebraska, pada 2016. Dengan memberi kotak warna abu-abu terang, kita bisa membuatnya lebih baik dengan latar belakang.
Gambar 25.9: Distribusi suhu rata-rata harian di Lincoln, Nebraska, pada 2016. Dengan memberi kotak warna abu-abu terang, kita bisa membuatnya lebih baik dengan latar belakang.