Pengodean berlebihan

20 Pengodean berlebihan

Dalam Bab 19 , kita telah melihat bahwa warna tidak selalu dapat menyampaikan informasi seefektif yang kita inginkan.Jika kami memiliki banyak item berbeda yang ingin kami identifikasi, melakukannya dengan warna mungkin tidak berfungsi. Akan sulit untuk mencocokkan warna dalam plot dengan warna dalam legenda (Gambar 19.1 ). Dan bahkan jika kita hanya perlu membedakan dua sampai tiga item yang berbeda, warna mungkin gagal jika item berwarna sangat kecil (Gambar 19.11 ) dan / atau warna terlihat serupa untuk orang yang menderita kekurangan penglihatan warna (Gambar 19.7 dan 19.8 ). Solusi umum dalam semua skenario ini adalah menggunakan warna untuk meningkatkan tampilan visual gambar tanpa bergantung sepenuhnya pada warna untuk menyampaikan informasi utama. Saya menyebut prinsip desain ini sebagai redundant coding , karena itu meminta kita untuk menyandikan data secara berlebihan, menggunakan beberapa dimensi estetika yang berbeda.

20.1 Merancang legenda dengan pengkodean redundan

Plot pencar dari beberapa kelompok data sering dirancang sedemikian rupa sehingga titik-titik yang mewakili kelompok berbeda hanya berbeda dalam warnanya. Sebagai contoh, perhatikan Gambar 20.1 , yang menunjukkan lebar sepal versus panjang sepal dari tiga spesies Iris yang berbeda.(Sepal adalah daun terluar dari bunga di tanaman berbunga.) Titik-titik yang mewakili spesies berbeda berbeda dalam warna mereka, tetapi sebaliknya semua titik terlihat persis sama. Meskipun angka ini hanya mengandung tiga kelompok titik yang berbeda, sulit dibaca bahkan untuk orang dengan penglihatan warna normal. Masalah muncul karena titik data untuk dua spesies Iris virginica dan Iris versicolor berbaur, dan dua warna masing-masing, hijau dan biru, tidak terlalu berbeda satu sama lain.
Lebar sepal versus panjang sepal untuk tiga spesies iris yang berbeda (Iris setosa, Iris virginica, dan Iris versicolor). Setiap titik mewakili pengukuran untuk satu sampel tanaman. Sejumlah kecil jitter telah diterapkan pada semua posisi titik untuk mencegah penempatan berlebih. Angka tersebut diberi label "buruk" karena titik virginica berwarna hijau dan titik berwarna biru sulit dibedakan satu sama lain.
Gambar 20.1: Lebar sepal versus panjang sepal untuk tiga spesies iris yang berbeda ( Iris setosa , Iris virginica , dan Iris versicolor ). Setiap titik mewakili pengukuran untuk satu sampel tanaman. Sejumlah kecil jitter telah diterapkan pada semua posisi titik untuk mencegah penempatan berlebih.Angka tersebut diberi label "buruk" karena titik virginica berwarna hijau dan titik berwarna biru sulit dibedakan satu sama lain.
Secara mengejutkan, titik hijau dan biru terlihat lebih berbeda untuk orang dengan defisiensi penglihatan warna merah-hijau (deuteranomaly atau protanomaly) daripada orang dengan penglihatan warna normal (bandingkan Gambar 20.2, baris atas, dengan Gambar 20.1 ). Di sisi lain, untuk orang dengan defisiensi biru-kuning (tritanomaly) titik biru dan hijau terlihat sangat mirip (Gambar 20.2 , kiri bawah). Dan jika kita mencetak gambar dalam skala abu-abu (yaitu, kita desaturasigambar itu), kita tidak dapat membedakan spesies iris mana pun (Gambar 20.2 , kanan bawah).
Simulasi kekurangan visi warna pada Gambar 20.1.
Gambar 20.2: Simulasi kekurangan warna pada Gambar 20.1 .
Ada dua perbaikan sederhana yang dapat kita lakukan pada Gambar 20.1 untuk mengatasi masalah ini. Pertama, kita dapat menukar warna yang digunakan untuk Iris setosa dan Iris versicolor , sehingga warna biru tidak lagi berada tepat di sebelah warna hijau (Gambar 20.3 ). Kedua, kita bisa menggunakan tiga bentuk simbol yang berbeda, sehingga semua titik terlihat berbeda. Dengan dua perubahan ini, baik versi asli gambar (Gambar 20.3 ) dan versi di bawah defisiensi warna-penglihatan dan dalam skala abu-abu (Gambar 20.4 ) menjadi terbaca.
Lebar sepal versus panjang sepal untuk tiga spesies iris yang berbeda. Dibandingkan dengan Gambar 20.1, kami telah menukar warna untuk Iris setosa dan Iris versicolor dan kami telah memberikan masing-masing spesies iris bentuk titik mereka sendiri.
Gambar 20.3: Lebar sepal versus panjang sepal untuk tiga spesies iris yang berbeda. Dibandingkan dengan Gambar 20.1 , kami telah menukar warna untuk Iris setosa dan Iris versicolor dan kami telah memberikan masing-masing spesies iris bentuk titik mereka sendiri.
Simulasi kekurangan visi warna pada Gambar 20.3. Karena penggunaan bentuk titik yang berbeda, bahkan versi skala abu-abu sepenuhnya desaturated dari angka tersebut dapat terbaca.
Gambar 20.4: Simulasi kekurangan warna pada Gambar 20.3 . Karena penggunaan bentuk titik yang berbeda, bahkan versi skala abu-abu sepenuhnya desaturated dari angka tersebut dapat terbaca.
Mengubah bentuk titik adalah strategi sederhana untuk plot pencar tetapi tidak selalu berhasil untuk jenis plot lainnya.Dalam plot garis, kita dapat mengubah jenis garis (padat, putus-putus, titik-titik, dll., Lihat juga Gambar 2.1 ), tetapi menggunakan garis putus-putus atau putus-putus sering kali menghasilkan hasil yang kurang optimal. Secara khusus, garis putus-putus atau putus-putus biasanya tidak terlihat bagus kecuali mereka lurus sempurna atau hanya melengkung dengan lembut, dan dalam kedua kasus itu menciptakan suara visual. Selain itu, seringkali diperlukan upaya mental yang signifikan untuk mencocokkan berbagai jenis pola garis putus-putus dari plot ke legenda. Jadi apa yang kita lakukan dengan visualisasi seperti Gambar 20.5 , yang menggunakan garis untuk menunjukkan perubahan harga saham dari waktu ke waktu untuk empat perusahaan teknologi besar yang berbeda?
Harga saham dari waktu ke waktu untuk empat perusahaan teknologi besar. Harga saham untuk setiap perusahaan telah dinormalisasi menjadi 100 pada Juni 2012. Angka ini dilabeli sebagai "buruk" karena dibutuhkan energi mental yang cukup untuk mencocokkan nama-nama perusahaan dalam legenda dengan kurva data. Sumber data: Yahoo Finance
Gambar 20.5: Harga saham dari waktu ke waktu untuk empat perusahaan teknologi besar. Harga saham untuk setiap perusahaan telah dinormalisasi menjadi 100 pada Juni 2012. Angka ini dilabeli sebagai "buruk" karena dibutuhkan energi mental yang cukup untuk mencocokkan nama-nama perusahaan dalam legenda dengan kurva data. Sumber data: Yahoo Finance
Angka tersebut berisi empat garis yang mewakili harga saham dari empat perusahaan yang berbeda. Garis diberi kode warna menggunakan skala warna ramah-warna. Jadi harus relatif jujur ​​untuk mengaitkan setiap baris dengan perusahaan yang sesuai. Namun tidak. Masalahnya di sini adalah bahwa jalur data memiliki urutan visual yang jelas.Garis kuning, mewakili Facebook, jelas merupakan garis tertinggi, dan garis hitam, mewakili Apple, jelas merupakan yang terendah, dengan Alphabet dan Microsoft di antaranya, dalam urutan itu. Namun urutan empat perusahaan dalam legenda adalah Alphabet, Apple, Facebook, Microsoft (urutan alfabet). Dengan demikian, urutan garis data yang dirasakan berbeda dari urutan perusahaan dalam legenda, dan dibutuhkan upaya mental yang mengejutkan untuk mencocokkan garis data dengan nama perusahaan.
Masalah ini muncul secara umum dengan merencanakan perangkat lunak yang membuat legenda secara otomatis.Perangkat lunak yang merencanakan tidak memiliki konsep tatanan visual yang akan dilihat pemirsa. Sebaliknya, perangkat lunak mengurutkan legenda dengan urutan lain, paling umum berdasarkan abjad. Kami dapat memperbaiki masalah ini dengan secara manual memesan kembali entri dalam legenda sehingga mereka cocok dengan pemesanan yang telah ditentukan dalam data (Gambar 20.6 ). Hasilnya adalah angka yang membuatnya lebih mudah untuk mencocokkan legenda dengan data.
Harga saham dari waktu ke waktu untuk empat perusahaan teknologi besar. Harga saham untuk setiap perusahaan telah dinormalisasi menjadi 100 pada bulan Juni 2012. Sumber data: Yahoo Finance
Gambar 20.6: Harga saham dari waktu ke waktu untuk empat perusahaan teknologi besar. Harga saham untuk setiap perusahaan telah dinormalisasi menjadi 100 pada bulan Juni 2012. Sumber data: Yahoo Finance
Jika ada urutan visual yang jelas dalam data Anda, pastikan untuk mencocokkannya dalam legenda.
Menyesuaikan urutan legenda dengan urutan data selalu membantu, tetapi manfaatnya sangat jelas di bawah simulasi defisiensi penglihatan warna (Gambar 20.7 ). Sebagai contoh, ini membantu dalam versi tritanomaly dari gambar, di mana biru dan hijau menjadi sulit untuk dibedakan (Gambar 20.7 , kiri bawah). Ini juga membantu dalam versi skala abu-abu (Gambar 20.7 , kanan bawah). Meskipun dua warna untuk Facebook dan Alphabet memiliki nilai abu-abu yang hampir sama, kita dapat melihat bahwa Microsoft dan Apple diwakili oleh warna yang lebih gelap dan mengambil dua posisi terbawah. Oleh karena itu, kami menganggap dengan benar bahwa garis tertinggi sesuai dengan Facebook dan garis tertinggi kedua ke Alfabet.
Simulasi kekurangan warna pada Gambar 20.6.
Gambar 20.7: Simulasi kekurangan warna pada Gambar 20.6 .

20.2 Merancang angka tanpa legenda

Meskipun keterbacaan legenda dapat ditingkatkan dengan menyandikan data secara berlebihan, dalam berbagai estetika, legenda selalu menambah beban mental pada pembaca. Dalam membaca legenda, pembaca perlu mengambil informasi di satu bagian visualisasi dan kemudian mentransfernya ke bagian lain. Kita biasanya dapat membuat hidup pembaca kita lebih mudah jika kita menghilangkan legenda itu sama sekali. Namun, menghilangkan legenda tidak berarti bahwa kita tidak memberikan satu dan sebaliknya menulis kalimat seperti "Titik-titik kuning mewakili Iris versicolor " dalam keterangan gambar. Menghilangkan legenda berarti kita mendesain gambar sedemikian rupa sehingga segera jelas apa yang mewakili berbagai elemen grafis, bahkan jika tidak ada legenda eksplisit yang hadir.
Strategi umum yang dapat kita gunakan disebut pelabelan langsung , di mana kita menempatkan label teks yang sesuai atau elemen visual lainnya yang berfungsi sebagai tiang penuntun ke seluruh gambar. Kami sebelumnya menemukan label langsung pada Bab 19 (Gambar 19.2 ), sebagai alternatif untuk menggambar legenda dengan lebih dari 50 warna berbeda. Untuk menerapkan konsep pelabelan langsung ke angka harga saham, kami menempatkan nama masing-masing perusahaan tepat di sebelah akhir baris data masing-masing (Gambar 20.8 ).
Harga saham dari waktu ke waktu untuk empat perusahaan teknologi besar. Harga saham untuk setiap perusahaan telah dinormalisasi menjadi 100 pada bulan Juni 2012. Sumber data: Yahoo Finance
Gambar 20.8: Harga saham dari waktu ke waktu untuk empat perusahaan teknologi besar. Harga saham untuk setiap perusahaan telah dinormalisasi menjadi 100 pada bulan Juni 2012. Sumber data: Yahoo Finance
Kapan pun memungkinkan, rancang gambar Anda sehingga mereka tidak membutuhkan legenda.
Kita juga dapat menerapkan konsep pelabelan langsung ke data iris dari awal bab ini, khususnya Gambar 20.3 . Karena ini adalah sebaran plot dari banyak titik yang terpisah menjadi tiga kelompok yang berbeda, kita perlu mengarahkan label pada kelompok daripada titik-titik individual. Salah satu solusinya adalah menggambar elips yang menutupi sebagian besar titik dan kemudian memberi label elips (Gambar 20.9 ).
Lebar sepal versus panjang sepal untuk tiga spesies iris yang berbeda. Saya telah menghapus kisi latar belakang dari angka ini karena jika tidak angkanya menjadi terlalu sibuk.
Gambar 20.9: Lebar sepal versus panjang sepal untuk tiga spesies iris yang berbeda. Saya telah menghapus kisi latar belakang dari angka ini karena jika tidak angkanya menjadi terlalu sibuk.
Untuk plot kerapatan, kita bisa juga memberi label langsung pada kurva daripada memberikan legenda kode warna (Gambar 20.10 ). Dalam Gambar 20.9 dan 20.10 , saya telah mewarnai label teks dengan warna yang sama dengan data.Label berwarna dapat sangat meningkatkan efek pelabelan langsung, tetapi juga dapat menjadi sangat buruk. Jika label teks dicetak dalam warna yang terlalu terang, maka label menjadi sulit dibaca. Dan, karena teks terdiri dari garis-garis yang sangat tipis, teks berwarna sering tampak lebih ringan daripada area yang diisi dengan warna yang sama. Saya biasanya menghindari masalah ini dengan menggunakan dua warna berbeda untuk setiap warna, satu warna terang untuk area yang diisi dan warna gelap untuk garis, garis besar, dan teks. Jika Anda hati-hati memeriksa Gambar 20.9 atau 20.10 , Anda akan melihat bagaimana setiap titik data atau area yang diarsir diisi dengan warna terang dan memiliki garis besar yang digambar dalam warna yang lebih gelap dari rona yang sama. Dan label teks digambar dengan warna gelap yang sama.
Perkiraan kepadatan sepal panjang dari tiga spesies iris yang berbeda. Setiap perkiraan kepadatan secara langsung dilabeli dengan nama spesies masing-masing.
Gambar 20.10: Perkiraan kepadatan sepal dari tiga spesies iris yang berbeda. Setiap perkiraan kepadatan secara langsung dilabeli dengan nama spesies masing-masing.
Kita juga dapat menggunakan plot kerapatan seperti yang ada pada Gambar 20.10 sebagai pengganti legenda, dengan menempatkan plot kerapatan ke dalam margin plot sebar (Gambar 20.11 ). Ini memungkinkan kita untuk memberi label langsung pada plot kepadatan marginal daripada plot pencar pusat dan karenanya menghasilkan gambar yang agak kurang berantakan daripada Gambar 20.9 dengan elips yang berlabel langsung.
Lebar sepal versus panjang sepal untuk tiga spesies iris yang berbeda, dengan estimasi kepadatan marginal dari masing-masing variabel untuk setiap spesies.
Gambar 20.11: Lebar sepal versus panjang sepal untuk tiga spesies iris yang berbeda, dengan estimasi kepadatan marginal dari masing-masing variabel untuk setiap spesies.
Dan akhirnya, setiap kali kita mengkodekan variabel tunggal dalam banyak estetika, kita biasanya tidak ingin banyak legenda terpisah untuk estetika yang berbeda. Alih-alih, seharusnya hanya ada satu elemen visual seperti legenda yang menyampaikan semua pemetaan sekaligus. Dalam kasus di mana kita memetakan variabel yang sama ke posisi sepanjang sumbu utama dan ke warna, ini menyiratkan bahwa bilah warna referensi harus berjalan bersama dan diintegrasikan ke dalam sumbu yang sama. Gambar 20.12menunjukkan kasus di mana kita memetakan suhu ke posisi sepanjang sumbu x dan ke warna, dan karena itu kami telah mengintegrasikan legenda warna ke dalam sumbu x .
Suhu di Lincoln, Nebraska, pada 2016. Gambar ini adalah variasi dari Gambar 9.9. Temperatur sekarang ditunjukkan oleh lokasi sepanjang sumbu x dan warna, dan bilah warna di sepanjang sumbu x memvisualisasikan skala yang mengubah suhu menjadi warna.
Gambar 20.12: Suhu di Lincoln, Nebraska, pada 2016. Gambar ini adalah variasi dari Gambar 9.9 . Temperatur sekarang ditunjukkan oleh lokasi sepanjang sumbu x dan warna, dan bilah warna di sepanjang sumbu xmemvisualisasikan skala yang mengubah suhu menjadi warna.