19 Jebakan umum penggunaan warna
Warna dapat menjadi alat yang sangat efektif untuk meningkatkan visualisasi data. Pada saat yang sama, pilihan warna yang buruk dapat merusak visualisasi yang luar biasa.Warna perlu diterapkan untuk melayani tujuan, harus jelas, dan tidak boleh mengalihkan perhatian.
19.1 Pengkodean terlalu banyak atau informasi yang tidak relevan
Satu kesalahan umum adalah mencoba memberi warna pada pekerjaan yang terlalu besar untuk ditangani, dengan menyandikan terlalu banyak item berbeda dalam warna berbeda. Sebagai contoh, perhatikan Gambar 19.1 . Ini menunjukkan pertumbuhan populasi versus ukuran populasi untuk semua 50 negara bagian AS dan Distrik Columbia.Saya telah berusaha mengidentifikasi setiap negara dengan memberikan warna tersendiri. Namun, hasilnya tidak terlalu berguna. Meskipun kita dapat menebak keadaan mana dengan melihat titik-titik berwarna dalam plot dan legenda, dibutuhkan banyak upaya untuk bolak-balik di antara keduanya untuk mencoba menyamakannya. Ada terlalu banyak warna yang berbeda, dan banyak dari mereka sangat mirip satu sama lain. Sekalipun dengan banyak usaha kita dapat mengetahui dengan tepat keadaan yang mana, visualisasi ini mengalahkan tujuan pewarnaan. Kita harus menggunakan warna untuk meningkatkan angka dan membuatnya lebih mudah dibaca, bukan untuk mengaburkan data dengan membuat teka-teki visual.

Gambar 19.1: Pertumbuhan populasi dari tahun 2000 hingga 2010 dibandingkan dengan jumlah populasi pada tahun 2000, untuk semua 50 negara bagian AS dan Discrict of Columbia. Setiap negara ditandai dalam warna berbeda. Karena ada begitu banyak negara, sangat sulit untuk mencocokkan warna dalam legenda dengan titik-titik dalam plot pencar.Sumber data: Biro Sensus AS
Sebagai pedoman praktis, skala warna kualitatif berfungsi paling baik ketika ada tiga hingga lima kategori berbeda yang perlu diwarnai. Begitu kami mencapai delapan hingga sepuluh kategori berbeda atau lebih, tugas mencocokkan warna dengan kategori menjadi terlalu memberatkan untuk berguna, bahkan jika warna tetap cukup berbeda untuk dibedakan secara prinsip. Untuk dataset Gambar 19.1 , mungkin yang terbaik adalah menggunakan warna hanya untuk menunjukkan wilayah geografis masing-masing negara dan untuk mengidentifikasi masing-masing negara dengan pelabelan langsung, yaitu, dengan menempatkan label teks yang tepat berdekatan dengan titik data (Gambar 19.2 ).Meskipun kami tidak dapat melabeli setiap negara bagian tanpa membuat angka terlalu ramai, pelabelan langsung adalah pilihan yang tepat untuk angka ini. Secara umum, untuk angka-angka seperti ini, kita tidak perlu memberi label pada setiap titik data tunggal. Cukup dengan memberi label subset representatif, misalnya seperangkat status yang secara khusus ingin kami panggil dalam teks yang akan menyertai gambar. Kami selalu memiliki opsi untuk juga menyediakan data yang mendasarinya sebagai tabel jika kami ingin memastikan pembaca memiliki akses secara keseluruhan.

Gambar 19.2: Pertumbuhan populasi dari tahun 2000 hingga 2010 dibandingkan dengan jumlah populasi pada tahun 2000. Berbeda dengan Gambar 19.1 , saya sekarang telah mewarnai negara bagian berdasarkan wilayah dan secara langsung memberi label bagian negara bagian.Mayoritas negara bagian dibiarkan tanpa label untuk menjaga angka tersebut dari kepadatan. Sumber data: Biro Sensus AS
Gunakan pelabelan langsung alih-alih warna saat Anda perlu membedakan lebih dari sekitar delapan item kategori.
Masalah umum kedua adalah pewarnaan demi pewarnaan, tanpa memiliki tujuan yang jelas untuk warnanya. Sebagai contoh, perhatikan Gambar 19.3 , yang merupakan variasi dari Gambar 4.2 . Namun, sekarang alih-alih mewarnai bar berdasarkan wilayah geografis, saya telah memberikan warna masing-masing bar, sehingga secara agregat bar menciptakan efek pelangi. Ini mungkin terlihat seperti efek visual yang menarik, tetapi tidak menciptakan wawasan baru ke dalam data atau membuat gambar lebih mudah dibaca.

Gambar 19.3: Pertumbuhan populasi di AS dari tahun 2000 hingga 2010. Warna pelangi negara tidak memiliki tujuan dan mengganggu. Selain itu, warnanya terlalu jenuh. Sumber data: Biro Sensus AS
Selain penggunaan warna berbeda secara serampangan, Gambar 19.3 memiliki masalah terkait warna kedua: Warna yang dipilih terlalu jenuh dan intens. Intensitas warna ini membuat sosok sulit dilihat. Sebagai contoh, sulit untuk membaca nama-nama negara tanpa mata kita tertuju pada area-area besar yang berwarna tepat di sebelah nama-nama negara bagian. Demikian pula, sulit untuk membandingkan titik akhir batang dengan garis kotak yang mendasarinya.
Hindari area penuh warna yang terlalu jenuh.Mereka menyulitkan pembaca Anda untuk memeriksa sosok Anda dengan cermat.
19.2 Menggunakan skala warna non-monoton untuk mengkodekan nilai data
Dalam Bab 4 , saya mencantumkan dua kondisi kritis untuk merancang skala warna berurutan yang dapat mewakili nilai data: Warna perlu menunjukkan dengan jelas nilai data mana yang lebih besar atau lebih kecil dari yang lainnya, dan perbedaan antara warna perlu memvisualisasikan perbedaan yang sesuai antara nilai data. Sayangnya, beberapa skala warna yang ada — termasuk yang sangat populer — melanggar salah satu atau kedua kondisi ini. Skala yang paling populer adalah skala pelangi (Gambar 19.4 ). Itu berjalan melalui semua warna yang mungkin dalam spektrum warna. Ini berarti skala efektif melingkar; warna di awal dan akhir hampir sama (merah tua). Jika dua warna ini berakhir bersebelahan dalam satu plot, kami tidak secara naluri memandangnya sebagai nilai data yang terpisah secara maksimal. Selain itu, skalanya sangat non-monoton. Ini memiliki daerah di mana warna berubah sangat lambat dan lainnya ketika warna berubah dengan cepat. Kurangnya monotonitas menjadi sangat jelas jika kita melihat skala warna dalam skala abu-abu (Gambar 19.4 ). Skala beralih dari gelap sedang ke terang menjadi sangat gelap dan kembali ke gelap sedang, dan ada peregangan besar di mana perubahan cahaya sangat sedikit diikuti oleh peregangan yang relatif sempit dengan perubahan besar dalam kecerahan.

Gambar 19.4: Skala warna pelangi sangat non-monotonik. Ini menjadi jelas terlihat dengan mengubah warna menjadi nilai abu-abu. Dari kiri ke kanan, skala berubah dari cukup gelap ke terang menjadi sangat gelap dan kembali ke cukup gelap. Selain itu, perubahan cahaya sangat tidak seragam. Bagian teringan dari skala (sesuai dengan warna kuning, hijau muda, dan cyan) mengambil hampir sepertiga dari seluruh skala sementara bagian paling gelap (terkait dengan biru tua) terkonsentrasi di wilayah sempit skala.
Dalam visualisasi data aktual, skala pelangi cenderung mengaburkan fitur data dan / atau menyoroti aspek data yang sewenang-wenang (Gambar 19.5 ). Selain itu, warna dalam skala pelangi juga terlalu jenuh. Melihat Gambar 19.5 untuk periode waktu yang lama bisa sangat tidak nyaman.

Gambar 19.5: Persentase orang yang mengidentifikasi kulit putih di negara bagian Texas. Skala warna pelangi bukan skala yang tepat untuk memvisualisasikan nilai data kontinu, karena cenderung menempatkan penekanan pada fitur data yang sewenang-wenang. Di sini, ini menekankan negara-negara di mana sekitar 75% dari populasi mengidentifikasi sebagai kulit putih. Sumber data: Sensus AS Decennial 2010
19.3 Tidak merancang untuk kekurangan penglihatan warna
Setiap kali kita memilih warna untuk visualisasi, kita harus ingat bahwa sebagian besar pembaca kita mungkin memiliki beberapa bentuk kekurangan penglihatan warna (yaitu, buta warna). Pembaca ini mungkin tidak dapat membedakan warna yang terlihat jelas berbeda dengan kebanyakan orang lain. Namun, orang-orang dengan gangguan penglihatan warna secara harfiah tidak dapat melihat warna apa pun.Sebaliknya, mereka biasanya akan mengalami kesulitan untuk membedakan jenis warna tertentu, misalnya merah dan hijau (defisiensi penglihatan warna merah-hijau) atau biru dan hijau (defisiensi penglihatan warna biru-kuning). Istilah teknis untuk kekurangan ini adalah deuteranomaly / deuteranopia dan protanomaly / protanopia untuk varian merah-hijau (di mana orang-orang mengalami kesulitan dalam memahami warna hijau atau merah, masing-masing) dan tritanomaly / tritanopia untuk varian biru-kuning (di mana orang mengalami kesulitan melihat biru ). Istilah yang berakhiran “anomali” mengacu pada beberapa penurunan dalam persepsi warna masing-masing, dan istilah yang berakhiran “anopia” merujuk pada ketiadaan sama sekali persepsi warna itu. Sekitar 8% pria dan 0,5% wanita menderita semacam kekurangan penglihatan warna, dan deuteranomaly adalah bentuk paling umum sedangkan tritanomali relatif jarang.
Seperti dibahas dalam Bab 4 , ada tiga jenis dasar skala warna yang digunakan dalam visualisasi data: skala sekuensial, skala divergen, dan skala kualitatif. Dari ketiga ini, skala sekuensial secara umum tidak akan menimbulkan masalah bagi orang-orang dengan defisiensi penglihatan warna (cvd), karena skala sekuensial yang dirancang dengan baik akan menghadirkan gradien terus-menerus dari warna gelap ke terang. Gambar 19.6 menunjukkan skala Panas dari Gambar 4.3 dalam versi simulasi deuteranomaly, protanomaly, dan tritanomaly. Meskipun tidak satu pun dari skala yang disimulasikan cvd ini yang terlihat seperti aslinya, semuanya menghadirkan gradien yang jelas dari gelap ke terang dan semuanya bekerja dengan baik untuk menyampaikan besarnya nilai data.

Gambar 19.6: Simulasi defisiensi penglihatan warna (cvd) dari skala warna berurutan Heat, yang membentang dari merah tua hingga kuning muda. Dari kiri ke kanan dan atas ke bawah, kita melihat skala asli dan skala seperti yang terlihat di bawah simulasi deuteranomaly, protanomaly, dan tritanomaly. Meskipun warna-warna tertentu terlihat berbeda di bawah tiga jenis cvd, dalam setiap kasus kita dapat melihat gradien yang jelas dari gelap ke terang. Oleh karena itu, skala warna ini aman digunakan untuk cvd.
Hal-hal menjadi lebih rumit untuk perbedaan skala, karena kontras warna populer dapat menjadi tidak dapat dibedakan di bawah cvd. Secara khusus, warna merah dan hijau memberikan kontras paling kuat untuk orang dengan penglihatan warna normal tetapi menjadi hampir tidak dapat dibedakan untuk deutan (orang dengan deuteranomali) atau protan (orang dengan protanomali) (Gambar 19.7 ). Demikian pula, kontras biru-hijau terlihat untuk deutan dan protan tetapi menjadi tidak dapat dibedakan untuk tritan (orang dengan tritanomali) (Gambar 19.8 ).

Gambar 19.7: Kontras merah-hijau menjadi tidak dapat dibedakan di bawah cvd merah-hijau (deuteranomaly atau protanomaly).

Gambar 19.8: Kontras biru-hijau menjadi tidak bisa dibedakan di bawah cvd biru-kuning (tritanomaly).
Dengan contoh-contoh ini, tampaknya hampir mustahil untuk menemukan dua warna kontras yang aman di bawah semua bentuk cvd. Namun, situasinya tidak terlalu buruk. Seringkali dimungkinkan untuk membuat sedikit modifikasi pada warna sehingga mereka memiliki karakter yang diinginkan dan juga aman untuk cvd. Sebagai contoh, skala ColorBrewer PiYG (pink ke kuning-hijau) dari Gambar 4.5 terlihat merah-hijau untuk orang-orang dengan penglihatan warna normal namun tetap dapat dibedakan untuk orang-orang dengan cvd (Gambar 19.9 ).

Gambar 19.9: Skala ColorBrewer PiYG (pink ke kuning-hijau) dari Gambar 4.5 terlihat seperti kontras merah-hijau untuk orang-orang dengan penglihatan warna biasa tetapi bekerja untuk semua bentuk kekurangan penglihatan warna. Ini bekerja karena warna kemerahan sebenarnya merah muda (campuran merah dan biru) sedangkan warna kehijauan juga mengandung kuning. Perbedaan dalam komponen biru antara dua warna dapat diambil bahkan oleh deutan atau protan, dan perbedaan dalam komponen merah dapat diambil oleh tritan.
Hal-hal yang paling rumit untuk skala kualitatif, karena di sana kita membutuhkan banyak warna yang berbeda dan mereka semua harus dapat dibedakan satu sama lain di bawah semua bentuk cvd. Skala warna kualitatif pilihan saya, yang saya gunakan secara luas di seluruh buku ini, dikembangkan secara khusus untuk mengatasi tantangan ini (Gambar 19.10 ). Dengan menyediakan delapan warna berbeda, palet bekerja untuk hampir semua skenario dengan warna diskrit. Seperti yang dibahas di awal bab ini, Anda sebaiknya tidak mewarnai kode lebih dari delapan item berbeda dalam plot.

Gambar 19.10: Palet warna kualitatif untuk semua kekurangan penglihatan warna (Okabe dan Ito 2008 ) . Kode alfanumerik mewakili warna dalam ruang RGB, disandikan sebagai hexadecimal. Di banyak pustaka plot dan program manipulasi gambar, Anda bisa langsung memasukkan kode ini.Jika perangkat lunak Anda tidak mengambil hexadecimal secara langsung, Anda juga dapat menggunakan nilai-nilai pada Tabel 19.1 .
| Nama | Kode hex | Warna | C, M, Y, K (%) | R, G, B (0-255) | R, G, B (%) |
|---|---|---|---|---|---|
| jeruk | # E69F00 | 41 ° | 0, 50, 100, 0 | 230, 159, 0 | 90, 60, 0 |
| langit biru | # 56B4E9 | 202 ° | 80, 0, 0, 0 | 86, 180, 233 | 35, 70, 90 |
| hijau kebiruan | # 009E73 | 164 ° | 97, 0, 75, 0 | 0, 158, 115 | 0, 60, 50 |
| kuning | # F0E442 | 56 ° | 10, 5, 90, 0 | 240, 228, 66 | 95, 90, 25 |
| biru | # 0072B2 | 202 ° | 100, 50, 0, 0 | 0, 114, 178 | 0, 45, 70 |
| merah terang | # D55E00 | 27 ° | 0, 80, 100, 0 | 213, 94, 0 | 80, 40, 0 |
| ungu kemerahan | # CC79A7 | 326 ° | 10, 70, 0, 0 | 204, 121, 167 | 80, 60, 70 |
| hitam | # 000000 | - | 0, 0, 0, 100 | 0, 0, 0 | 0, 0, 0 |
Meskipun ada beberapa skala warna yang baik dan aman untuk cvd, kami harus menyadari bahwa itu bukan peluru ajaib. Sangat mungkin untuk menggunakan skala cvd-safe namun menghasilkan angka yang tidak dapat diuraikan oleh seseorang dengan cvd. Salah satu parameter penting adalah ukuran elemen grafis berwarna. Warna jauh lebih mudah dibedakan ketika diterapkan ke area yang luas daripada yang kecil atau garis tipis (Stone, Albers Szafir, dan Setlur 2014 ) .Dan efek ini diperburuk di bawah cvd (Gambar 19.11 ). Selain berbagai pertimbangan desain warna yang dibahas dalam bab ini dan di Bab 4 , saya sarankan untuk melihat angka warna di bawah simulasi cvd untuk mendapatkan gambaran tentang bagaimana mereka terlihat bagi orang dengan cvd.Ada beberapa layanan online dan aplikasi desktop yang tersedia yang memungkinkan pengguna untuk menjalankan angka sewenang-wenang melalui simulasi cvd.

Gambar 19.11: Elemen berwarna menjadi sulit dibedakan pada ukuran kecil. Panel kiri atas (berlabel "asli") menunjukkan empat persegi panjang, empat garis tebal, empat garis tipis, dan empat kelompok titik, semuanya berwarna dalam empat warna yang sama. Kita bisa melihat bahwa warna menjadi lebih sulit untuk membedakan elemen visual yang lebih kecil atau lebih tipis. Masalah ini menjadi diperburuk dalam simulasi cvd, di mana warna sudah lebih sulit dibedakan bahkan untuk elemen grafis besar.
Untuk memastikan angka Anda berfungsi untuk orang-orang dengan DVD, jangan hanya mengandalkan skala warna tertentu. Sebagai gantinya, uji angka-angka Anda di simulator cvd.
Referensi
Okabe, M., dan K. Ito. 2008. "Desain Universal Berwarna (CUD): Cara Membuat Gambar dan Presentasi yang Ramah bagi Orang Buta Warna." http://jfly.iam.u-tokyo.ac.jp/color/ .
Stone, M., D. Albers Szafir, dan V. Setlur. 2014. "Model Rekayasa untuk Perbedaan Warna sebagai Fungsi Ukuran."Di Konferensi Warna dan Gambar 22 . Masyarakat untuk Sains dan Teknologi Pencitraan.
