Jangan pergi 3D

26 Jangan pergi 3D

Plot 3D cukup populer, khususnya dalam presentasi bisnis tetapi juga di kalangan akademisi. Mereka juga hampir selalu digunakan secara tidak tepat. Jarang saya melihat plot 3D yang tidak dapat diperbaiki dengan mengubahnya menjadi angka 2D biasa. Dalam bab ini, saya akan menjelaskan mengapa plot 3D memiliki masalah, mengapa plot umumnya tidak diperlukan, dan dalam situasi terbatas apa plot 3D mungkin sesuai.

26.1 Hindari 3D serampangan

Banyak perangkat lunak visualisasi memungkinkan Anda untuk merapikan plot Anda dengan mengubah elemen grafis plot menjadi objek tiga dimensi. Paling umum, kita melihat diagram lingkaran berubah menjadi disk yang diputar dalam ruang, plot bar berubah menjadi kolom, dan plot garis diubah menjadi band. Khususnya, tidak satu pun dari kasus ini apakah dimensi ketiga menyampaikan data aktual. 3D digunakan hanya untuk menghias dan menghiasi plot. Saya menganggap penggunaan 3D ini sebagai serampangan. Ini benar-benar buruk dan harus dihapus dari kosakata visual para ilmuwan data.
Masalah dengan 3D serampangan adalah bahwa proyeksi objek 3D menjadi dua dimensi untuk dicetak atau ditampilkan pada monitor mendistorsi data. Sistem visual manusia mencoba untuk memperbaiki distorsi ini karena memetakan proyeksi 2D dari gambar 3D kembali ke ruang 3D. Namun, koreksi ini hanya bisa sebagian. Sebagai contoh, mari kita ambil diagram pai sederhana dengan dua iris, satu mewakili 25% dari data dan satu 75%, dan memutar pai ini di ruang angkasa (Gambar 26.1 ). Saat kita mengubah sudut di mana kita melihat pie, ukuran irisan tampaknya juga berubah.Secara khusus, potongan 25%, yang terletak di bagian depan pai, terlihat jauh lebih besar dari 25% ketika kita melihat pai dari sudut datar (Gambar 26.1 a).
Bagan pai 3D yang sama ditunjukkan dari empat sudut yang berbeda. Memutar pai ke dalam dimensi ketiga membuat irisan pai di depan tampak lebih besar daripada yang sebenarnya dan irisan pai di belakang tampak lebih kecil. Di sini, di bagian (a), (b), dan (c), irisan biru yang sesuai dengan 25% data secara visual menempati lebih dari 25% area yang mewakili pai. Hanya bagian (d) yang merupakan representasi data yang akurat.
Gambar 26.1: Diagram pai 3D yang sama ditunjukkan dari empat sudut yang berbeda. Memutar pai ke dalam dimensi ketiga membuat irisan pai di depan tampak lebih besar daripada yang sebenarnya dan irisan pai di belakang tampak lebih kecil. Di sini, di bagian (a), (b), dan (c), irisan biru yang sesuai dengan 25% data secara visual menempati lebih dari 25% area yang mewakili pai. Hanya bagian (d) yang merupakan representasi data yang akurat.
Masalah serupa muncul untuk jenis plot 3D lainnya. Gambar 26.2 menunjukkan rincian penumpang Titanic berdasarkan kelas dan jenis kelamin menggunakan bar 3D. Karena cara batang diatur relatif terhadap sumbu, batang semua terlihat lebih pendek daripada yang sebenarnya. Misalnya, ada total 322 penumpang yang bepergian di kelas 1, namun Gambar 26.2 menunjukkan bahwa jumlahnya kurang dari 300. Ilusi ini muncul karena kolom yang mewakili data terletak pada jarak dari dua permukaan belakang di mana garis horizontal abu-abu ditarik. Untuk melihat efek ini, pertimbangkan untuk memperpanjang salah satu tepi bawah salah satu kolom hingga menyentuh garis abu-abu terendah, yang mewakili 0. Lalu, bayangkan melakukan hal yang sama ke salah satu tepi atas, dan Anda akan melihat bahwa semua kolom lebih tinggi dari yang terlihat pada pandangan pertama. (Lihat Gambar 6.10 di Bab 6 untuk versi 2D yang lebih masuk akal dari gambar ini.)
Jumlah penumpang wanita dan pria di Titanic yang bepergian di kelas 1, 2, dan 3, ditampilkan sebagai plot bar bertumpuk 3D. Jumlah total penumpang di kelas 1, 2, dan 3 masing-masing adalah 322, 279, dan 711 (lihat Gambar 6.10). Namun dalam plot ini, bilah kelas 1 tampaknya mewakili kurang dari 300 penumpang, bilah kelas 3 tampaknya mewakili kurang dari 700 penumpang, dan bilah kelas 2 tampaknya lebih dekat dengan 210–220 penumpang daripada 279 penumpang yang sebenarnya. Lebih lanjut, bilah kelas 3 secara visual mendominasi sosok tersebut dan membuat jumlah penumpang di kelas 3 tampak lebih besar daripada yang sebenarnya.
Gambar 26.2: Jumlah penumpang perempuan dan laki-laki di Titanic yang bepergian di kelas 1, 2, dan 3, ditampilkan sebagai plot batang bertumpuk 3D. Jumlah total penumpang di kelas 1, 2, dan 3 masing-masing adalah 322, 279, dan 711 (lihat Gambar 6.10 ). Namun dalam plot ini, bilah kelas 1 tampaknya mewakili kurang dari 300 penumpang, bilah kelas 3 tampaknya mewakili kurang dari 700 penumpang, dan bilah kelas 2 tampaknya lebih dekat dengan 210–220 penumpang daripada 279 penumpang yang sebenarnya. Lebih lanjut, bilah kelas 3 secara visual mendominasi sosok tersebut dan membuat jumlah penumpang di kelas 3 tampak lebih besar daripada yang sebenarnya.

26.2 Hindari skala posisi 3D

Sementara visualisasi dengan 3D serampangan dapat dengan mudah diabaikan sebagai buruk, kurang jelas apa yang harus dipikirkan tentang visualisasi menggunakan tiga skala posisi asli ( x , y , dan z ) untuk mewakili data. Dalam hal ini, penggunaan dimensi ketiga memiliki tujuan yang sebenarnya. Namun demikian, plot yang dihasilkan seringkali sulit untuk ditafsirkan, dan dalam pikiran saya mereka harus dihindari.
Pertimbangkan sebaran sebar 3D efisiensi bahan bakar versus perpindahan dan daya untuk 32 mobil. Kami telah melihat dataset ini sebelumnya di Bab 2 , Gambar 2.5 . Di sini, kami merencanakan perpindahan di sepanjang sumbu x, daya di sepanjang sumbu y , dan efisiensi bahan bakar di sepanjang sumbu z , dan kami mewakili setiap mobil dengan titik (Gambar 26.3 ). Meskipun visualisasi 3D ini ditunjukkan dari empat perspektif yang berbeda, sulit untuk membayangkan bagaimana tepatnya poin didistribusikan di ruang angkasa. Saya menemukan bagian (d) dari Gambar 26.3 sangat membingungkan. Tampaknya hampir menunjukkan dataset yang berbeda, meskipun tidak ada yang berubah selain sudut dari mana kita melihat titik-titiknya.
Efisiensi bahan bakar versus perpindahan dan daya untuk 32 mobil (model 1973-74). Setiap titik mewakili satu mobil, dan warna titik mewakili jumlah silinder mobil. Keempat panel (a) - (d) menunjukkan data yang persis sama tetapi menggunakan perspektif yang berbeda. Sumber data: Trend Motor, 1974.
Gambar 26.3: Efisiensi bahan bakar versus perpindahan dan daya untuk 32 mobil (model 1973-74). Setiap titik mewakili satu mobil, dan warna titik mewakili jumlah silinder mobil. Keempat panel (a) - (d) menunjukkan data yang persis sama tetapi menggunakan perspektif yang berbeda. Sumber data: Trend Motor, 1974.
Masalah mendasar dengan visualisasi 3D tersebut adalah mereka memerlukan dua transformasi data yang terpisah dan berturut-turut. Transformasi pertama memetakan data dari ruang data ke ruang visualisasi 3D, seperti yang dibahas dalam Bab 2 dan 3 dalam konteks skala posisi. Yang kedua memetakan data dari ruang visualisasi 3D ke dalam ruang 2D dari gambar akhir. (Transformasi kedua ini jelas tidak terjadi untuk visualisasi yang ditampilkan dalam lingkungan 3D yang sebenarnya, seperti ketika ditampilkan sebagai pahatan fisik atau objek yang dicetak 3D. Keberatan utama saya di sini adalah visualisasi 3D yang ditampilkan pada tampilan 2D.) Transformasi kedua adalah dapat dibalik, karena setiap titik pada tampilan 2D sesuai dengan garis titik dalam ruang visualisasi 3D. Oleh karena itu, kami tidak dapat secara unik menentukan di mana dalam ruang 3D titik data tertentu berada.
Sistem visual kami tetap berupaya untuk membalikkan transformasi 3D ke 2D. Namun, proses ini tidak dapat diandalkan, sarat dengan kesalahan, dan sangat tergantung pada isyarat yang sesuai pada gambar yang menyampaikan rasa tiga dimensi. Ketika kita menghapus isyarat ini, inversi menjadi sepenuhnya mustahil. Ini dapat dilihat pada Gambar 26.4 , yang identik dengan Gambar 26.3 kecuali semua isyarat kedalaman telah dihilangkan. Hasilnya adalah empat pengaturan acak dari titik-titik yang tidak dapat kita tafsirkan sama sekali dan yang bahkan tidak mudah dihubungkan satu sama lain. Bisakah Anda tahu titik mana di bagian (a) yang sesuai dengan titik mana di bagian (b)? Saya tentu saja tidak bisa.
Efisiensi bahan bakar versus perpindahan dan daya untuk 32 mobil (model 1973-74). Keempat panel (a) - (d) sesuai dengan panel yang sama pada Gambar 26.3, hanya saja semua garis kisi yang memberikan isyarat kedalaman telah dihilangkan. Sumber data: Trend Motor, 1974.
Gambar 26.4: Efisiensi bahan bakar versus perpindahan dan daya untuk 32 mobil (model 1973-74). Keempat panel (a) - (d) sesuai dengan panel yang sama pada Gambar 26.3 , hanya saja semua garis kisi yang memberikan isyarat kedalaman telah dihilangkan. Sumber data: Trend Motor, 1974.
Alih-alih menerapkan dua transformasi data terpisah, salah satunya adalah non-invertible, saya pikir itu umumnya lebih baik untuk hanya menerapkan satu transformasi yang sesuai, invertible dan memetakan data langsung ke ruang 2D. Jarang diperlukan untuk menambahkan dimensi ketiga sebagai skala posisi, karena variabel juga dapat dipetakan ke skala warna, ukuran, atau bentuk. Sebagai contoh, pada Bab 2 , saya memplot lima variabel dari set data efisiensi bahan bakar sekaligus hanya menggunakan dua skala posisi (Gambar 2.5).
Di sini, saya ingin menunjukkan dua cara alternatif untuk memplot variabel yang digunakan pada Gambar 26.3 .Pertama, jika kita terutama memperhatikan efisiensi bahan bakar sebagai variabel respons, kita dapat memplotnya dua kali, sekali terhadap perpindahan dan satu kali melawan daya (Gambar 26.5 ). Kedua, jika kita lebih tertarik pada bagaimana perpindahan dan daya berhubungan satu sama lain, dengan efisiensi bahan bakar sebagai variabel sekunder yang diminati, kita dapat merencanakan daya versus perpindahan dan memetakan efisiensi bahan bakar ke ukuran titik-titik (Gambar 26.6 ). Kedua tokoh lebih berguna dan kurang membingungkan daripada Gambar 26.3 .
Efisiensi bahan bakar versus perpindahan (a) dan daya (b). Sumber data: Trend Motor, 1974.
Gambar 26.5: Efisiensi bahan bakar versus perpindahan (a) dan daya (b).Sumber data: Trend Motor, 1974.
Tenaga versus perpindahan untuk 32 mobil, dengan efisiensi bahan bakar diwakili oleh ukuran titik. Sumber data: Trend Motor, 1974.
Gambar 26.6: Daya versus perpindahan untuk 32 mobil, dengan efisiensi bahan bakar diwakili oleh ukuran titik. Sumber data: Trend Motor, 1974.
Anda mungkin bertanya-tanya apakah masalah dengan plot sebar 3D adalah bahwa representasi data aktual, titik-titik, sendiri tidak menyampaikan informasi 3D. Apa yang terjadi, misalnya, jika kita menggunakan bilah 3D? Gambar 26.7menunjukkan dataset khas yang dapat divisualisasikan dengan bar 3D, angka kematian pada tahun 1940 di Virginia dikelompokkan berdasarkan kelompok umur dan berdasarkan jenis kelamin dan lokasi perumahan. Kita dapat melihat bahwa memang bilah 3D membantu kita menafsirkan plot.Sangat tidak mungkin bahwa seseorang mungkin salah mengira sebuah bar di latar depan untuk satu di latar belakang atau sebaliknya. Namun demikian, masalah yang dibahas dalam konteks Gambar 26.2 juga ada di sini. Sulit untuk menilai dengan tepat berapa tinggi masing-masing batang, dan juga sulit untuk membuat perbandingan langsung. Sebagai contoh, apakah tingkat kematian perempuan perkotaan pada kelompok usia 65-69 lebih tinggi atau lebih rendah daripada laki-laki perkotaan pada kelompok usia 60-64?
Angka kematian di Virginia pada tahun 1940, divisualisasikan sebagai plot 3D bar. Tingkat kematian ditunjukkan untuk empat kelompok orang (perempuan dan laki-laki di kota dan pedesaan) dan lima kategori umur (50-54, 55-59, 60-64, 65-69, 70-74), dan mereka dilaporkan dalam satuan kematian per 1000 orang. Angka ini dilabeli sebagai "buruk" karena perspektif 3D membuat plot sulit dibaca. Sumber data: Molyneaux, Gilliam, dan Florant (1947)
Gambar 26.7: Angka kematian di Virginia pada tahun 1940, divisualisasikan sebagai plot 3D bar. Angka kematian diperlihatkan untuk empat kelompok orang (perempuan dan laki-laki di kota dan pedesaan) dan lima kategori umur (50-54, 55-59, 60-64, 65-69, 70-74), dan mereka dilaporkan dalam satuan kematian per 1000 orang. Angka ini dilabeli sebagai "buruk" karena perspektif 3D membuat plot sulit dibaca. Sumber data: Molyneaux, Gilliam, dan Florant ( 1947 )
Secara umum, lebih baik menggunakan plot Teralis (Bab 21 ) daripada visualisasi 3D. Dataset mortalitas di Virginia hanya membutuhkan empat panel bila ditampilkan sebagai plot Teralis (Gambar 26.8 ). Saya menganggap angka ini jelas dan mudah ditafsirkan. Segera jelas bahwa tingkat kematian lebih tinggi di antara laki-laki daripada di antara perempuan, dan juga bahwa laki-laki perkotaan tampaknya memiliki tingkat kematian yang lebih tinggi daripada laki-laki pedesaan sedangkan tidak ada tren seperti itu jelas untuk perempuan perkotaan dan pedesaan.
Angka kematian di Virginia pada tahun 1940, divisualisasikan sebagai plot Trellis. Angka kematian diperlihatkan untuk empat kelompok orang (perempuan dan laki-laki di kota dan pedesaan) dan lima kategori umur (50-54, 55-59, 60-64, 65-69, 70-74), dan mereka dilaporkan dalam satuan kematian per 1000 orang. Sumber data: Molyneaux, Gilliam, dan Florant (1947)
Gambar 26.8: Angka kematian di Virginia pada tahun 1940, divisualisasikan sebagai plot Trellis. Tingkat kematian ditunjukkan untuk empat kelompok orang (perempuan dan laki-laki di kota dan pedesaan) dan lima kategori umur (50-54, 55-59, 60-64, 65-69, 70-74), dan mereka dilaporkan dalam satuan kematian per 1000 orang. Sumber data: Molyneaux, Gilliam, dan Florant ( 1947 )

26.3 Penggunaan visualisasi 3D yang tepat

Namun, visualisasi yang menggunakan skala posisi 3D terkadang sesuai. Pertama, masalah-masalah yang dijelaskan dalam bagian sebelumnya tidak terlalu memprihatinkan jika visualisasi bersifat interaktif dan dapat diputar oleh pemirsa, atau jika ditampilkan dalam VR atau lingkungan augmented reality di mana ia dapat diperiksa dari berbagai sudut. Kedua, bahkan jika visualisasi tidak interaktif, menunjukkannya berputar perlahan, bukan sebagai gambar statis dari satu perspektif, akan memungkinkan pemirsa untuk melihat di mana dalam ruang 3D elemen grafis yang berbeda berada. Otak manusia sangat pandai merekonstruksi adegan 3D dari serangkaian gambar yang diambil dari sudut yang berbeda, dan rotasi grafik yang lambat memberikan persis gambar-gambar ini.
Akhirnya, masuk akal untuk menggunakan visualisasi 3D ketika kami ingin menunjukkan objek 3D yang sebenarnya dan / atau data yang dipetakan padanya. Sebagai contoh, memperlihatkan relief topografis pulau pegunungan adalah pilihan yang masuk akal (Gambar 26.9 ). Demikian pula, jika kita ingin memvisualisasikan konservasi urutan evolusi dari protein yang dipetakan pada strukturnya, masuk akal untuk menunjukkan struktur sebagai objek 3D (Gambar 26.10 ).Namun dalam kedua kasus tersebut, visualisasi ini masih akan lebih mudah untuk ditafsirkan jika mereka ditampilkan sebagai animasi berputar. Meskipun hal ini tidak dimungkinkan dalam publikasi cetak tradisional, hal ini dapat dilakukan dengan mudah ketika memposting angka di web atau ketika memberikan presentasi.
Relief Pulau Korsika di Laut Mediterania. Sumber data: Layanan Pemantauan Tanah Copernicus
Gambar 26.9: Relief Pulau Korsika di Laut Mediterania. Sumber data: Layanan Pemantauan Tanah Copernicus
Pola variasi evolusi dalam protein. Tabung berwarna mewakili tulang punggung protein Exonuclease III dari bakteri Escherichia coli (pengidentifikasi Bank Data Protein: 1AKO). Pewarnaan menunjukkan konservasi evolusioner dari masing-masing situs dalam protein ini, dengan pewarnaan gelap menunjukkan asam amino yang dikonservasi dan pewarnaan terang menunjukkan asam amino variabel. Sumber data: Marcos dan Echave (2015)
Gambar 26.10: Pola variasi evolusi dalam protein. Tabung berwarna mewakili tulang punggung protein Exonuclease III dari bakteri Escherichia coli (pengidentifikasi Bank Data Protein: 1AKO). Pewarnaan menunjukkan konservasi evolusioner dari masing-masing situs dalam protein ini, dengan pewarnaan gelap menunjukkan asam amino yang dikonservasi dan pewarnaan terang menunjukkan asam amino variabel. Sumber data: Marcos dan Echave ( 2015 )

Referensi

Molyneaux, L., SK Gilliam, dan LC Florant. 1947. “Perbedaan Tingkat Kematian Virginia berdasarkan Warna, Jenis Kelamin, Umur, dan Tempat Tinggal di Pedesaan atau Perkotaan.”Ulasan Sosiologis Amerika 12: 525–355.
Marcos, ML, dan J. Echave. 2015. “Terlalu Berkemas untuk Berubah: Pengemasan Rantai Samping dan Tingkat Substitusi Khusus-Lokasi dalam Evolusi Protein.” PeerJ 3: e911.