Menceritakan sebuah kisah dan mengutarakannya

29 Menceritakan sebuah kisah dan mengutarakannya

Sebagian besar visualisasi data dilakukan untuk tujuan komunikasi. Kami memiliki wawasan tentang dataset, dan kami memiliki audiens yang potensial, dan kami ingin menyampaikan wawasan kami kepada audiens kami. Untuk mengomunikasikan wawasan kita dengan sukses, kita harus menyajikan kepada hadirin sebuah cerita yang jelas dan menarik. Kebutuhan akan sebuah cerita mungkin tampak mengganggu bagi para ilmuwan dan insinyur, yang mungkin menyamakannya dengan mengada-ada, memutarbalikkan berbagai hal, atau overselling hasil. Namun, perspektif ini melewatkan peran penting yang dimainkan oleh cerita dalam bernalar dan mengingat. Kita menjadi bersemangat ketika kita mendengar cerita yang bagus, dan kita bosan ketika cerita itu buruk atau ketika tidak ada. Selain itu, komunikasi apa pun menciptakan cerita di benak audiens. Jika kami sendiri tidak memberikan cerita yang jelas, maka audiens kami akan mengarangnya. Dalam skenario kasus terbaik, kisah yang mereka buat cukup dekat dengan pandangan kami sendiri tentang materi yang disajikan. Namun, itu bisa dan seringkali jauh lebih buruk. Kisah yang dibuat-buat bisa “ini membosankan,” “penulisnya salah,” atau “penulisnya tidak kompeten.”
Tujuan Anda dalam menceritakan sebuah cerita adalah menggunakan fakta dan alasan logis untuk membuat audiens Anda tertarik dan bersemangat. Izinkan saya menceritakan sebuah kisah tentang fisikawan teoretis Stephen Hawking.Dia didiagnosis mengidap penyakit neuron motorik pada usia 21 tahun — satu tahun dalam PhD-nya — dan diberi waktu dua tahun untuk hidup. Hawking tidak menerima kesulitan ini dan mulai mencurahkan seluruh energinya untuk melakukan sains. Hawking akhirnya berusia 76 tahun, menjadi salah satu fisikawan paling berpengaruh pada masanya, dan melakukan semua pekerjaan mani sambil menjadi cacat. Saya berpendapat bahwa ini adalah kisah yang menarik. Itu juga sepenuhnya berdasarkan fakta dan benar.

29.1 Apa itu cerita?

Sebelum kita dapat membahas strategi untuk mengubah visualisasi menjadi cerita, kita perlu memahami apa sebenarnya cerita itu. Sebuah cerita adalah seperangkat pengamatan, fakta, atau peristiwa, benar atau diciptakan, yang disajikan dalam urutan tertentu sedemikian rupa sehingga mereka menciptakan reaksi emosional di antara penonton. Reaksi emosional diciptakan melalui penumpukan ketegangan di awal cerita diikuti oleh beberapa jenis resolusi menjelang akhir cerita. Kami mengacu pada aliran dari ketegangan ke resolusi juga sebagai busur cerita, dan setiap cerita yang baik memiliki busur yang jelas dan dapat diidentifikasi.
Penulis yang berpengalaman tahu bahwa ada pola standar untuk bercerita yang sesuai dengan cara berpikir manusia.Sebagai contoh, kita dapat menceritakan sebuah kisah menggunakan format Opening – Challenge – Action – Resolution. Sebenarnya, ini adalah format yang saya gunakan untuk cerita Hawking di subbab sebelumnya. Saya membuka ceritanya dengan memperkenalkan topik, fisikawan Stephen Hawking. Selanjutnya saya mempresentasikan tantangan, diagnosis penyakit neuron motorik pada usia 21. Kemudian muncul aksinya, dedikasinya yang kuat terhadap sains. Akhirnya saya mempresentasikan resolusi, bahwa Hawking menjalani hidup yang panjang dan sukses dan akhirnya menjadi salah satu fisikawan paling berpengaruh di masanya. Format cerita lain juga biasa digunakan. Artikel surat kabar sering mengikuti format Lead-Development-Resolution atau, bahkan lebih pendek, hanya Lead-Development, di mana lead memberikan poin utama di muka dan materi selanjutnya memberikan rincian lebih lanjut. Jika kita ingin menceritakan kisah Hawking dalam format ini, kita dapat memulai dengan kalimat seperti “Fisikawan berpengaruh Stephen Hawking, yang merevolusi pemahaman kita tentang lubang hitam dan kosmologi, melampaui prognosis dokternya hingga 53 tahun dan melakukan semua dari pekerjaannya yang paling berpengaruh sementara menjadi cacat berat. " Ini yang memimpin. Dalam perkembangannya, kita bisa menindaklanjuti dengan deskripsi yang lebih mendalam tentang kehidupan, penyakit, dan pengabdian Hawking pada sains. Namun format lain adalah Action – Background – Development – ​​Climax – Ending, yang mengembangkan cerita sedikit lebih cepat dari Opening – Challenge – Action-Resolution tetapi tidak secepat Lead-Development. Dalam format ini, kita dapat membuka dengan kalimat seperti “Stephen Hawking muda, menghadapi kecacatan yang melemahkan dan prospek kematian dini, memutuskan untuk mencurahkan semua upayanya ke dalam sainsnya, bertekad untuk membuat tanda sementara ia masih bisa. ” Tujuan dari format ini adalah untuk menarik penonton dan untuk menciptakan hubungan emosional sejak dini, tetapi tanpa segera memberikan resolusi final.
Tujuan saya dalam bab ini bukan untuk menggambarkan bentuk-bentuk standar pengisahan cerita ini secara lebih rinci. Ada sumber daya luar biasa yang mencakup materi ini.Untuk para ilmuwan dan analis, saya sangat merekomendasikan Schimel ( 2011 ) . Sebagai gantinya, saya ingin membahas bagaimana kita bisa membawa visualisasi data ke dalam alur cerita. Yang paling penting, kita perlu menyadari bahwa visualisasi tunggal (statis) jarang akan menceritakan keseluruhan cerita. Visualisasi dapat menggambarkan pembukaan, tantangan, tindakan, atau resolusi, tetapi tidak mungkin untuk menyampaikan semua bagian cerita ini sekaligus. Untuk menceritakan kisah yang lengkap, kita biasanya membutuhkan beberapa visualisasi.Misalnya, ketika memberikan presentasi, pertama-tama kita dapat menunjukkan beberapa latar belakang atau materi motivasi, kemudian sosok yang menciptakan tantangan, dan akhirnya beberapa tokoh lain yang memberikan resolusi.Demikian juga, dalam makalah penelitian, kami dapat menyajikan urutan angka yang bersama-sama menciptakan busur cerita yang meyakinkan. Namun, juga memungkinkan untuk menyingkat seluruh alur cerita menjadi satu tokoh.Sosok seperti itu harus mengandung tantangan dan resolusi pada saat yang sama, dan itu sebanding dengan busur cerita yang dimulai dengan petunjuk.
Untuk memberikan contoh konkret dari memasukkan angka ke dalam cerita, sekarang saya akan menceritakan sebuah kisah berdasarkan dua tokoh. Yang pertama menciptakan tantangan dan yang kedua berfungsi sebagai resolusi.Konteks cerita saya adalah pertumbuhan pracetak dalam ilmu biologi (lihat juga Bab 13 ). Pracetak adalah naskah dalam bentuk konsep yang para ilmuwan bagikan dengan rekan-rekan mereka sebelum tinjauan sejawat formal dan publikasi resmi. Para ilmuwan telah membagikan draft manuskrip selama manuskrip ilmiah telah ada. Namun, pada awal 1990-an, dengan munculnya internet, fisikawan menyadari bahwa jauh lebih efisien untuk menyimpan dan mendistribusikan draft naskah di repositori pusat. Mereka menemukan server pracetak, server web tempat para ilmuwan dapat mengunggah, mengunduh, dan mencari draft naskah.
Fisikawan server pracetak yang dikembangkan dan masih digunakan sampai sekarang disebut arXiv.org. Tak lama setelah itu didirikan, arXiv.org mulai bercabang dan menjadi populer di bidang kuantitatif terkait, termasuk matematika, astronomi, ilmu komputer, statistik, keuangan kuantitatif, dan biologi kuantitatif. Di sini, saya tertarik dengan pengiriman pracetak ke bagian biologi kuantitatif (q-bio) dari arXiv.org.Jumlah pengiriman per bulan tumbuh secara eksponensial dari 2007 hingga akhir 2013, tetapi kemudian pertumbuhan itu tiba-tiba berhenti (Gambar 29.1 ). Sesuatu pasti telah terjadi pada akhir 2013 yang secara radikal mengubah lanskap dalam pengiriman pracetak untuk biologi kuantitatif.Apa yang menyebabkan perubahan drastis dalam pertumbuhan pengiriman ini?
Pertumbuhan pengiriman bulanan ke bagian biologi kuantitatif (q-bio) dari server pracetak arXiv.org. Transisi tajam dalam laju pertumbuhan dapat dilihat sekitar 2014. Sementara pertumbuhan cepat hingga 2014, hampir tidak ada pertumbuhan yang terjadi dari 2014 hingga 2018. Perhatikan bahwa sumbu y adalah logaritmik, sehingga peningkatan linier y sesuai dengan pertumbuhan eksponensial di pengiriman pracetak. Sumber data: Jordan Anaya, http://www.prepubmed.org/
Gambar 29.1: Pertumbuhan pengiriman bulanan ke bagian biologi kuantitatif (q-bio) dari server preprint arXiv.org. Transisi tajam dalam laju pertumbuhan dapat dilihat sekitar 2014. Sementara pertumbuhan cepat hingga 2014, hampir tidak ada pertumbuhan yang terjadi dari 2014 hingga 2018. Perhatikan bahwa sumbu y adalah logaritmik, sehingga peningkatan linier ysesuai dengan pertumbuhan eksponensial di pengiriman pracetak. Sumber data: Jordan Anaya, http://www.prepubmed.org/
Saya akan berargumen bahwa akhir 2013 menandai waktu ketika pracetak lepas landas dalam biologi, dan ironisnya ini menyebabkan arsip q-bio memperlambat pertumbuhannya.Pada November 2013, server preprint khusus biologi bioRxiv diluncurkan oleh Cold Spring Harbor Laboratory (CSHL) Press. CSHL Press adalah penerbit yang sangat dihormati di kalangan ahli biologi. Dukungan CSHL Press sangat membantu dengan penerimaan pracetak secara umum dan bioRxiv khususnya di kalangan ahli biologi. Ahli biologi yang sama yang cukup curiga terhadap arXiv.org jauh lebih nyaman dengan bioRxiv. Akibatnya, bioRxiv dengan cepat diterima oleh para ahli biologi, hingga tingkat yang tidak pernah berhasil oleh arXiv. Faktanya, segera setelah diluncurkan, bioRxiv mulai mengalami pertumbuhan eksponensial yang cepat dalam pengiriman bulanan, dan perlambatan pengiriman q-bio persis bertepatan dengan dimulainya pertumbuhan eksponensial dalam bioRxiv ini (Gambar 29.2 ). Tampaknya menjadi kasus bahwa banyak ahli biologi kuantitatif yang sebaliknya mungkin telah menyetor pracetak dengan q-bio memutuskan untuk menyimpannya dengan bioRxiv sebagai gantinya.
Leveling off dari pertumbuhan pengiriman ke q-bio bertepatan dengan pengenalan server bioRxiv. Ditampilkan adalah pertumbuhan pengiriman bulanan ke bagian q-bio dari server preprint tujuan umum arxiv.org dan ke server preprint biologi bioRxiv. Server bioRxiv mulai beroperasi pada November 2013, dan tingkat pengirimannya telah meningkat secara eksponensial sejak itu. Tampaknya banyak ilmuwan yang jika tidak akan menyerahkan cetakan ke q-bio memilih untuk menyerahkan ke bioRxiv sebagai gantinya. Sumber data: Jordan Anaya, http://www.prepubmed.org/
Gambar 29.2: Leveling off dari pertumbuhan pengiriman ke q-bio bertepatan dengan pengenalan server bioRxiv. Ditampilkan adalah pertumbuhan pengiriman bulanan ke bagian q-bio dari server preprint tujuan umum arxiv.org dan ke server preprint biologi bioRxiv. Server bioRxiv mulai beroperasi pada November 2013, dan tingkat pengirimannya telah meningkat secara eksponensial sejak itu. Tampaknya banyak ilmuwan yang jika tidak akan menyerahkan cetakan ke q-bio memilih untuk menyerahkan ke bioRxiv sebagai gantinya. Sumber data: Jordan Anaya, http://www.prepubmed.org/
Ini adalah kisah saya tentang pracetak dalam biologi. Saya sengaja mengatakannya dengan dua angka, meskipun yang pertama (Gambar 29.1 ) sepenuhnya terkandung dalam yang kedua (Gambar 29.2 ). Saya pikir cerita ini memiliki dampak paling kuat ketika dipecah menjadi dua bagian, dan inilah bagaimana saya akan menyajikannya dalam sebuah ceramah. Namun, Gambar 29.2 sendiri dapat digunakan untuk menceritakan keseluruhan cerita, dan versi single-figure mungkin lebih cocok untuk media di mana audiens dapat diharapkan memiliki rentang perhatian yang pendek, seperti dalam posting media sosial.

29.2 Buat angka untuk para jenderal

Untuk sisa bab ini, saya akan membahas strategi untuk membuat tokoh-tokoh individual dan serangkaian tokoh yang membantu audiens Anda terhubung dengan cerita Anda dan tetap terlibat sepanjang seluruh alur cerita Anda. Pertama, dan yang paling penting, Anda perlu menunjukkan angka audiens yang benar-benar mereka pahami. Sangat mungkin untuk mengikuti semua rekomendasi yang saya berikan di seluruh buku ini dan masih mempersiapkan tokoh-tokoh yang bingung. Ketika ini terjadi, Anda mungkin telah menjadi korban dari dua kesalahpahaman umum; pertama, agar audiens dapat melihat sosok Anda dan segera menyimpulkan poin yang ingin Anda buat; kedua, bahwa audiens dapat dengan cepat memproses visualisasi yang kompleks dan memahami tren kunci dan hubungan yang ditampilkan. Tak satu pun dari asumsi ini yang benar. Kita perlu melakukan apa saja untuk membantu pembaca memahami makna visualisasi kita dan melihat pola yang sama dalam data yang kita lihat. Ini biasanya berarti lebih sedikit lebih banyak.Sederhanakan angka Anda sebanyak mungkin. Hapus semua fitur yang bersinggungan dengan cerita Anda. Hanya poin-poin penting yang harus dipertahankan. Saya menyebut konsep ini sebagai "membuat angka untuk para jenderal."
Selama beberapa tahun, saya bertanggung jawab atas proyek penelitian besar yang didanai oleh Angkatan Darat AS.Untuk laporan kemajuan tahunan kami, saya diperintahkan oleh manajer program untuk tidak memasukkan banyak angka. Dan angka apa pun yang saya sertakan harus menunjukkan dengan sangat jelas bagaimana proyek kami berhasil. Seorang jenderal, manajer program mengatakan kepada saya, harus dapat melihat setiap angka dan segera melihat bagaimana apa yang kami lakukan adalah meningkatkan atau melampaui kemampuan sebelumnya.Namun ketika rekan-rekan saya yang merupakan bagian dari proyek ini mengirimi saya angka-angka untuk laporan kemajuan tahunan, banyak dari angka-angka itu tidak memenuhi kriteria ini. Angka-angka itu biasanya terlalu rumit, dilabeli dengan istilah-istilah teknis yang membingungkan, atau tidak menunjukkan poin yang jelas sama sekali.Sebagian besar ilmuwan tidak dilatih untuk membuat angka untuk para jenderal.
Jangan pernah menganggap audiens Anda dapat dengan cepat memproses tampilan visual yang kompleks.
Beberapa mungkin mendengar cerita ini dan menyimpulkan bahwa para jenderal tidak terlalu pintar atau tidak begitu saja dalam sains. Saya pikir itu pesan pulang yang salah. Para jenderal sangat sibuk. Mereka tidak dapat menghabiskan 30 menit untuk mencoba menguraikan angka samar. Ketika mereka memberikan jutaan dolar dana pembayar pajak kepada para ilmuwan untuk melakukan penelitian dasar, yang paling tidak mereka harapkan sebagai imbalan adalah sejumlah demonstrasi yang jelas bahwa sesuatu yang berharga dan menarik telah dicapai. Kisah ini juga tidak boleh disalahartikan sebagai tentang pendanaan militer pada khususnya. Para jenderal adalah metafora bagi siapa pun yang mungkin ingin Anda jangkau dengan visualisasi Anda.Ini bisa menjadi resensi ilmiah untuk makalah Anda atau proposal hibah, itu bisa menjadi editor surat kabar, atau bisa menjadi penyelia Anda atau atasan atasan Anda di perusahaan tempat Anda bekerja. Jika Anda ingin cerita Anda muncul, Anda perlu membuat angka yang sesuai untuk semua jenderal ini.
Hal pertama yang akan menghalangi para jenderal adalah, ironisnya, kemudahan perangkat lunak visualisasi modern memungkinkan kita membuat visualisasi data yang canggih.Dengan kekuatan visualisasi yang nyaris tanpa batas, tergoda untuk terus menumpuk pada lebih banyak dimensi data. Dan faktanya, saya melihat tren di dunia visualisasi data untuk membuat visualisasi yang paling kompleks dan multi-segi menjadi mungkin. Visualisasi ini mungkin terlihat sangat mengesankan, tetapi mereka tidak mungkin menyampaikan cerita yang jelas. Pertimbangkan Gambar 29.3 , yang menunjukkan keterlambatan kedatangan untuk semua penerbangan yang berangkat dari wilayah Kota New York pada tahun 2013. Saya menduga Anda perlu waktu untuk memproses angka ini.
Berarti keterlambatan kedatangan versus jarak dari New York City. Setiap titik mewakili satu tujuan, dan ukuran setiap titik mewakili jumlah penerbangan dari salah satu dari tiga bandara utama New York City (Newark, JFK, atau LaGuardia) ke tujuan itu pada tahun 2013. Penundaan negatif menyiratkan bahwa penerbangan tiba lebih awal. Garis solid mewakili tren rata-rata antara keterlambatan kedatangan dan jarak. Delta secara konsisten memiliki keterlambatan kedatangan yang lebih rendah daripada maskapai lain, terlepas dari jarak yang ditempuh. Amerika memiliki penundaan yang paling rendah, rata-rata, untuk jarak pendek, tetapi memiliki penundaan tertinggi untuk jarak yang lebih jauh. Angka ini dilabeli sebagai "buruk" karena terlalu rumit. Sebagian besar pembaca akan menganggapnya membingungkan dan tidak akan secara intuitif memahami apa yang ditunjukkan oleh gambar itu. Sumber data: Departemen Transportasi AS, Biro Statistik Transportasi.
Gambar 29.3: Rata-rata keterlambatan kedatangan versus jarak dari Kota New York. Setiap titik mewakili satu tujuan, dan ukuran setiap titik mewakili jumlah penerbangan dari salah satu dari tiga bandara utama New York City (Newark, JFK, atau LaGuardia) ke tujuan itu pada tahun 2013. Penundaan negatif menyiratkan bahwa penerbangan tiba lebih awal. Garis solid mewakili tren rata-rata antara keterlambatan kedatangan dan jarak. Delta secara konsisten memiliki penundaan kedatangan yang lebih rendah daripada maskapai lain, terlepas dari jarak yang ditempuh. Amerika memiliki penundaan yang paling rendah, rata-rata, untuk jarak pendek, tetapi memiliki penundaan tertinggi untuk jarak yang lebih jauh. Angka ini dilabeli sebagai "buruk" karena terlalu rumit. Sebagian besar pembaca akan menganggapnya membingungkan dan tidak akan secara intuitif memahami apa yang ditunjukkan oleh gambar itu. Sumber data: Departemen Transportasi AS, Biro Statistik Transportasi.
Saya pikir fitur terpenting dari Gambar 29.3 adalah bahwa Amerika dan Delta memiliki keterlambatan kedatangan paling pendek. Wawasan ini jauh lebih baik disampaikan dalam grafik batang sederhana (Gambar 29.4 ). Oleh karena itu, Gambar 29.4 adalah angka yang benar untuk ditunjukkan jika cerita tentang penundaan kedatangan maskapai, bahkan jika membuat grafik itu tidak menantang keterampilan visualisasi data Anda. Dan jika Anda kemudian bertanya-tanya apakah maskapai ini memiliki penundaan kecil karena mereka tidak terbang sebanyak itu dari Kota New York, Anda dapat menyajikan grafik batang kedua yang menyoroti bahwa Amerika dan Delta adalah operator utama di wilayah Kota New York ( Gambar 29.5 ). Kedua grafik batang ini membuang variabel jarak yang ditunjukkan pada Gambar 29.3 . Ini bagus. Kita tidak perlu memvisualisasikan dimensi data yang bersinggungan dengan cerita kita, bahkan jika kita memilikinya dan bahkan jika kita bisa membuat gambar yang menunjukkannya. Sederhana dan jelas lebih baik daripada rumit dan membingungkan.
Penundaan kedatangan rata-rata untuk penerbangan keluar dari wilayah Kota New York pada 2013, oleh maskapai. American dan Delta memiliki keterlambatan kedatangan rata-rata terendah dari semua maskapai yang terbang keluar dari wilayah Kota New York. Sumber data: Departemen Transportasi AS, Biro Statistik Transportasi.
Gambar 29.4: Penundaan kedatangan rata-rata untuk penerbangan keluar dari wilayah Kota New York pada 2013, oleh maskapai. American dan Delta memiliki keterlambatan kedatangan rata-rata terendah dari semua maskapai yang terbang keluar dari wilayah Kota New York. Sumber data: Departemen Transportasi AS, Biro Statistik Transportasi.
Jumlah penerbangan yang keluar dari wilayah Kota New York pada tahun 2013, berdasarkan maskapai. Delta dan Amerika adalah maskapai penerbangan terbesar keempat dan kelima dengan penerbangan keluar dari wilayah Kota New York. Sumber data: Departemen Transportasi AS, Biro Statistik Transportasi.
Gambar 29.5: Jumlah penerbangan yang keluar dari wilayah Kota New York pada tahun 2013, berdasarkan maskapai. Delta dan Amerika adalah maskapai penerbangan terbesar keempat dan kelima dengan penerbangan keluar dari wilayah Kota New York. Sumber data: Departemen Transportasi AS, Biro Statistik Transportasi.
Saat Anda mencoba menampilkan terlalu banyak data sekaligus, pada akhirnya Anda mungkin tidak menunjukkan apa-apa.

29.3 Membangun ke arah angka yang kompleks

Namun, kadang-kadang, kami ingin menunjukkan angka yang lebih kompleks yang berisi banyak informasi sekaligus.Dalam kasus-kasus itu, kita dapat membuat segalanya lebih mudah bagi pembaca kita jika kita pertama kali menunjukkan kepada mereka versi yang disederhanakan dari gambar sebelum kita menunjukkan yang terakhir dalam kompleksitas penuhnya. Pendekatan yang sama juga sangat direkomendasikan untuk presentasi. Jangan pernah melompat langsung ke sosok yang sangat kompleks;pertama-tama tampilkan subset yang mudah dicerna.
Rekomendasi ini sangat relevan jika angka terakhir adalah plot kelipatan kecil (Bab 21 ) yang menunjukkan kisi-kisi subplot dengan struktur yang serupa. Kotak penuh lebih mudah dicerna jika audiens pertama kali melihat satu subplot dengan sendirinya. Sebagai contoh, Gambar 29.6menunjukkan jumlah agregat keberangkatan United Airlines dari Bandara Newark (EWR) pada tahun 2013, dikelompokkan berdasarkan hari kerja. Setelah kita melihat dan mencerna angka ini, melihat informasi yang sama untuk sepuluh maskapai dan tiga bandara sekaligus jauh lebih mudah untuk diproses (Gambar 29.7 ).
United Airlines berangkat dari Bandara Newark (EWR) pada 2013, pada hari kerja. Sebagian besar hari kerja menunjukkan jumlah keberangkatan yang kira-kira sama, tetapi ada lebih sedikit keberangkatan pada akhir pekan. Sumber data: Departemen Transportasi AS, Biro Statistik Transportasi.
Gambar 29.6: United Airlines berangkat dari Bandara Newark (EWR) pada 2013, pada hari kerja. Sebagian besar hari kerja menunjukkan jumlah keberangkatan yang kira-kira sama, tetapi ada lebih sedikit keberangkatan pada akhir pekan. Sumber data: Departemen Transportasi AS, Biro Statistik Transportasi.
Keberangkatan di luar bandara di wilayah kota New York pada 2013, dipecah oleh maskapai, bandara, dan hari kerja. United Airlines dan ExpressJet membuat sebagian besar keberangkatan dari Bandara Newark (EWR), JetBlue, Delta, American, dan Endeavour membuat sebagian besar keberangkatan dari JFK, dan Delta, American, Utusan, dan US Airways membuat sebagian besar dari keberangkatan dari LaGuardia (LGA). Sebagian besar tetapi tidak semua maskapai memiliki keberangkatan lebih sedikit di akhir pekan daripada selama minggu kerja. Sumber data: Departemen Transportasi AS, Biro Statistik Transportasi.
Gambar 29.7: Keberangkatan dari bandara di wilayah kota New York pada tahun 2013, dikelompokkan berdasarkan maskapai, bandara, dan hari kerja. United Airlines dan ExpressJet membuat sebagian besar keberangkatan dari Bandara Newark (EWR), JetBlue, Delta, American, dan Endeavour membuat sebagian besar keberangkatan dari JFK, dan Delta, American, Utusan, dan US Airways membuat sebagian besar dari keberangkatan dari LaGuardia (LGA). Sebagian besar tetapi tidak semua maskapai memiliki keberangkatan lebih sedikit di akhir pekan daripada selama minggu kerja. Sumber data: Departemen Transportasi AS, Biro Statistik Transportasi.

29.4 Jadikan angka-angka Anda mudah diingat

Figur sederhana dan bersih seperti plot bar sederhana memiliki keuntungan karena mereka menghindari gangguan, mudah dibaca, dan membiarkan audiens Anda fokus pada poin paling penting yang ingin Anda sampaikan. Namun, kesederhanaan bisa datang dengan kerugian: Angka akhirnya bisa terlihat generik. Mereka tidak memiliki fitur yang menonjol dan membuatnya mudah diingat. Jika saya menunjukkan kepada Anda sepuluh bargraph berturut-turut dengan cepat, Anda akan kesulitan memisahkannya dan kemudian mengingat apa yang mereka tunjukkan. Misalnya, jika Anda melihat Gambar 29.8 dengan cepat , Anda akan melihat kesamaan visual dengan Gambar 29.5 , yang saya bahas sebelumnya dalam bab ini. Namun, kedua tokoh itu tidak memiliki kesamaan selain mereka adalah grafik batang.Gambar 29.5 menunjukkan jumlah penerbangan keluar dari wilayah Kota New York oleh maskapai, sedangkan Gambar 29.8 menunjukkan hewan peliharaan paling populer di rumah tangga AS. Tidak ada figur yang memiliki elemen yang membantu Anda secara intuitif memahami topik apa yang dicakup oleh figur tersebut, dan oleh karena itu tidak ada figur yang mudah diingat.
Jumlah rumah tangga yang memiliki satu atau lebih hewan peliharaan paling populer: anjing, kucing, ikan, atau burung. Grafik batang ini sangat jelas tetapi tidak terlalu mengesankan. Kolom "kucing" telah disorot hanya untuk membuat kesamaan visual dengan Gambar 29.5. Sumber data: Sourcebook Kepemilikan & Demografi Hewan Peliharaan AS 2012, American Veterinary Medical Association
Gambar 29.8: Jumlah rumah tangga yang memiliki satu atau lebih hewan peliharaan paling populer: anjing, kucing, ikan, atau burung. Grafik batang ini sangat jelas tetapi tidak terlalu mengesankan. Kolom "kucing" telah disorot hanya untuk membuat kesamaan visual dengan Gambar 29.5 .Sumber data: Buku Sumber Kepemilikan & Demografi Hewan Peliharaan 2012 AS, American Veterinary Medical Association
Penelitian tentang persepsi manusia menunjukkan bahwa sosok yang lebih kompleks secara visual dan unik lebih mudah diingat (Bateman et al. 2010 ; Borgo et al. 2012 ) .Namun, keunikan dan kompleksitas visual tidak hanya memengaruhi daya ingat, karena dapat menghambat kemampuan seseorang untuk mendapatkan gambaran umum cepat dari informasi atau mempersulit membedakan perbedaan kecil dalam nilai. Pada ekstremnya, sosok bisa sangat berkesan tetapi benar-benar membingungkan. Angka seperti itu tidak akan menjadi visualisasi data yang baik, bahkan jika itu berfungsi dengan baik sebagai karya seni yang menakjubkan. Di sisi lain, angka-angka mungkin sangat jelas tetapi dapat dilupakan dan membosankan, dan angka-angka itu mungkin tidak memiliki dampak yang mungkin kita harapkan. Secara umum, kami ingin mencapai keseimbangan antara kedua ekstrem dan membuat angka-angka kami mengesankan dan jelas. (Namun, audiens yang dituju juga penting. Jika suatu angka dimaksudkan untuk publikasi ilmiah teknis, kita umumnya tidak akan terlalu khawatir tentang kemampuan mengingat daripada jika angka itu dimaksudkan untuk koran atau blog yang dibaca secara luas.)
Kita dapat membuat gambar lebih mudah diingat dengan menambahkan elemen visual yang mencerminkan fitur data, misalnya gambar atau piktogram dari hal-hal atau objek yang menjadi tujuan dataset. Salah satu pendekatan yang umum diambil adalah untuk menunjukkan nilai data itu sendiri dalam bentuk gambar yang diulang, sehingga setiap salinan gambar sesuai dengan jumlah yang ditentukan dari variabel yang diwakili. Sebagai contoh, kita dapat mengganti palang pada Gambar 29.8 dengan gambar berulang tentang anjing, kucing, ikan, dan burung, yang ditarik ke skala sedemikian rupa sehingga setiap hewan lengkap sesuai dengan lima juta rumah tangga (Gambar 29.9 ). Dengan demikian, secara visual, Gambar 29.9 masih berfungsi sebagai bar plot, tetapi kami sekarang telah menambahkan beberapa kompleksitas visual yang membuat gambar lebih berkesan, dan kami juga telah menunjukkan data menggunakan gambar yang secara langsung mencerminkan apa yang dimaksud dengan data.Setelah hanya melihat sekilas pada gambar, Anda mungkin dapat mengingat bahwa ada lebih banyak anjing dan kucing daripada ikan atau burung. Yang penting, dalam visualisasi seperti itu, kami ingin menggunakan gambar untuk mewakili data, daripada menggunakan gambar hanya untuk menghiasi visualisasi atau untuk membubuhi keterangan sumbu. Dalam eksperimen psikologis, pilihan yang terakhir cenderung mengalihkan perhatian daripada membantu (Haroz, Kosara, dan Franconeri 2015 ) .
Jumlah rumah tangga yang memiliki satu atau lebih hewan peliharaan paling populer, ditampilkan sebagai grafik isotipe. Setiap hewan lengkap mewakili 5 juta rumah tangga yang memiliki hewan peliharaan semacam itu. Sumber data: Sourcebook Kepemilikan & Demografi Hewan Peliharaan AS 2012, American Veterinary Medical Association
Gambar 29.9: Jumlah rumah tangga yang memiliki satu atau lebih hewan peliharaan paling populer, ditampilkan dalam grafik isotype. Setiap hewan lengkap mewakili 5 juta rumah tangga yang memiliki hewan peliharaan semacam itu. Sumber data: Buku Sumber Kepemilikan & Demografi Hewan Peliharaan 2012 AS, American Veterinary Medical Association
Visualisasi seperti Gambar 29.9 sering disebut plot isotipe.Kata isotype diperkenalkan sebagai akronim dari International System Of TYpographic Picture Education, dan secara tegas mengacu pada pictograms disederhanakan seperti logo yang mewakili objek, hewan, tanaman, atau orang (Haroz, Kosara, dan Franconeri 2015 ) . Namun, saya pikir masuk akal untuk menggunakan istilah isotipe plot lebih luas untuk diterapkan pada semua jenis visualisasi di mana salinan berulang dari gambar yang sama digunakan untuk menunjukkan besarnya nilai. Bagaimanapun, awalan "iso" berarti "sama" dan "jenis" dapat berarti jenis, kelas, atau grup tertentu.

29.5 Bersikap konsisten tetapi jangan berulang

Ketika membahas angka-angka majemuk dalam Bab 21.2 , saya menyebutkan bahwa penting untuk menggunakan bahasa visual yang konsisten untuk bagian-bagian berbeda dari tokoh yang lebih besar. Hal yang sama berlaku di seluruh angka. Jika kita membuat tiga angka yang semuanya merupakan bagian dari satu cerita yang lebih besar, maka kita perlu mendesain angka-angka itu sehingga mereka tampak seperti milik bersama. Namun, menggunakan bahasa visual yang konsisten tidak berarti bahwa semuanya harus persis sama. Di sisi lain. Adalah penting bahwa angka-angka yang menggambarkan analisis yang berbeda terlihat berbeda secara visual, sehingga audiens Anda dapat dengan mudah mengenali di mana satu analisis berakhir dan yang lainnya dimulai. Ini paling baik dicapai dengan menggunakan pendekatan visualisasi yang berbeda untuk bagian cerita yang berbeda. Jika Anda sudah menggunakan plot bar, selanjutnya gunakan sebar scatter, atau boxplot, atau plot garis. Kalau tidak, analisis yang berbeda akan mengabur dalam pikiran audiens Anda, dan mereka akan mengalami kesulitan membedakan satu bagian dari cerita dari yang lain.Sebagai contoh, jika kita mendesain ulang Gambar 21.8 dari Bab 21.2 sehingga hanya menggunakan plot bar, hasilnya terlihat kurang berbeda dan lebih membingungkan (Gambar 29.10 ).
Fisiologi dan komposisi tubuh atlet pria dan wanita. Baris kesalahan menunjukkan kesalahan standar rata-rata. Angka ini terlalu berulang. Ini menunjukkan data yang sama seperti Gambar 21.8 dan menggunakan bahasa visual yang konsisten, tetapi semua sub-angka menggunakan jenis visualisasi yang sama (plot batang). Ini menyulitkan pembaca untuk memproses bagian-bagian (a), (b), dan (c) menunjukkan hasil yang sama sekali berbeda. Sumber data: Telford dan Cunningham (1991)
Gambar 29.10: Fisiologi dan komposisi tubuh atlet pria dan wanita. Baris kesalahan menunjukkan kesalahan standar rata-rata. Angka ini terlalu berulang. Ini menunjukkan data yang sama seperti Gambar 21.8 dan menggunakan bahasa visual yang konsisten, tetapi semua sub-angka menggunakan jenis visualisasi yang sama (plot batang). Ini menyulitkan pembaca untuk memproses bagian-bagian (a), (b), dan (c) menunjukkan hasil yang sama sekali berbeda. Sumber data: Telford dan Cunningham ( 1991 )
Saat menyiapkan presentasi atau laporan, bertujuan untuk menggunakan berbagai jenis visualisasi untuk setiap analisis yang berbeda.
Serangkaian angka berulang sering merupakan konsekuensi dari cerita multi-bagian di mana setiap bagian didasarkan pada jenis data mentah yang sama. Dalam skenario itu, tergoda untuk menggunakan jenis visualisasi yang sama untuk setiap bagian. Namun, secara agregat, angka-angka ini tidak akan menarik perhatian penonton. Sebagai contoh, mari kita perhatikan sebuah cerita tentang stok Facebook, dalam dua bagian: (i) harga saham Facebook telah meningkat dengan cepat dari 2012 hingga 2017; (ii) kenaikan harga telah melampaui pertumbuhan perusahaan teknologi besar lainnya. Anda mungkin ingin memvisualisasikan dua pernyataan ini dengan dua angka yang menunjukkan harga saham dari waktu ke waktu, seperti yang ditunjukkan pada Gambar 29.11 . Namun, sementara Gambar 29.11 a melayani tujuan yang jelas dan harus tetap apa adanya, Gambar 29.11b pada saat yang sama berulang dan mengaburkan poin utama. Kami tidak terlalu peduli tentang evolusi temporal yang tepat dari harga saham Alphabet, Apple, dan Microsoft, kami hanya ingin menyoroti bahwa itu tumbuh kurang dari harga saham Facebook.
Pertumbuhan harga saham Facebook selama interval lima tahun dan perbandingan dengan saham teknologi lainnya. (a) Harga saham Facebook naik dari sekitar $ 25 / saham pada pertengahan 2012 menjadi $ 150 / saham pada pertengahan 2017. (B) Harga perusahaan teknologi besar lainnya tidak naik sebanding selama periode waktu yang sama. Harga telah diindeks ke 100 pada 1 Juni 2012 untuk memudahkan perbandingan. Angka ini diberi label "jelek" karena bagian (a) dan (b) berulang. Sumber data: Yahoo Finance
Gambar 29.11: Pertumbuhan harga saham Facebook selama lima tahun dan perbandingan dengan saham teknologi lainnya. (a) Harga saham Facebook naik dari sekitar $ 25 / saham pada pertengahan 2012 menjadi $ 150 / saham pada pertengahan 2017. (B) Harga perusahaan teknologi besar lainnya tidak naik sebanding selama periode waktu yang sama.Harga telah diindeks ke 100 pada 1 Juni 2012 untuk memudahkan perbandingan. Angka ini diberi label "jelek" karena bagian (a) dan (b) berulang. Sumber data: Yahoo Finance
Saya akan merekomendasikan untuk meninggalkan bagian (a) apa adanya tetapi ganti bagian (b) dengan plot bar yang menunjukkan peningkatan persen (Gambar 29.12 ).Sekarang kita memiliki dua tokoh berbeda yang masing-masing membuat poin unik dan jelas dan bekerja dengan baik dalam kombinasi. Bagian (a) memungkinkan pembaca untuk terbiasa dengan data mentah, yang mendasarinya dan bagian (b) menyoroti besarnya efek sambil menghapus informasi tangensial apa pun.
Pertumbuhan harga saham Facebook selama interval lima tahun dan perbandingan dengan saham teknologi lainnya. (a) Harga saham Facebook naik dari sekitar $ 25 / saham pada pertengahan 2012 menjadi $ 150 / saham pada pertengahan 2017, meningkat hampir 450%. (B) Harga perusahaan teknologi besar lainnya tidak naik sebanding selama periode waktu yang sama. Kenaikan harga berkisar antara 90% hingga 240%. Sumber data: Yahoo Finance
Gambar 29.12: Pertumbuhan harga saham Facebook selama lima tahun dan perbandingan dengan saham teknologi lainnya. (a) Harga saham Facebook naik dari sekitar $ 25 / saham pada pertengahan 2012 menjadi $ 150 / saham pada pertengahan 2017, meningkat hampir 450%. (B) Harga perusahaan teknologi besar lainnya tidak naik sebanding selama periode waktu yang sama. Kenaikan harga berkisar antara 90% hingga 240%.Sumber data: Yahoo Finance
Gambar 29.12 menggarisbawahi prinsip umum yang saya ikuti ketika menyiapkan set angka untuk menceritakan sebuah kisah: Saya mulai dengan angka yang sedekat mungkin dengan menampilkan data mentah, dan pada angka selanjutnya saya menunjukkan jumlah yang semakin banyak diturunkan. Kuantitas yang diturunkan (seperti kenaikan persen, rata-rata, koefisien model yang dipasang, dan sebagainya) berguna untuk merangkum tren utama dalam dataset besar dan kompleks. Namun, karena mereka diturunkan, mereka kurang intuitif, dan jika kami menunjukkan jumlah yang diturunkan sebelum kami menunjukkan data mentah, audiens kami akan merasa sulit untuk mengikuti. Di sisi lain, jika kita mencoba menunjukkan semua tren dengan menunjukkan data mentah, kita akan membutuhkan terlalu banyak angka dan / atau berulang-ulang.
Berapa banyak tokoh yang harus Anda gunakan untuk menceritakan kisah Anda? Jawabannya tergantung pada tempat publikasi. Untuk posting atau tweet blog pendek, buat satu angka. Untuk karya ilmiah, saya merekomendasikan antara tiga dan enam angka. Jika saya memiliki lebih dari enam angka untuk sebuah makalah ilmiah, maka beberapa dari mereka perlu dipindahkan ke bagian lampiran atau bahan pelengkap. Adalah baik untuk mendokumentasikan semua bukti yang telah kami kumpulkan, tetapi kami tidak boleh membuat audiensi kami lelah dengan menghadirkan jumlah berlebihan dari tokoh-tokoh yang tampak mirip. Dalam konteks lain, jumlah angka yang lebih besar mungkin sesuai.Namun, dalam konteks itu, kita biasanya akan menceritakan banyak cerita, atau cerita yang menyeluruh dengan subplot.Misalnya, jika saya diminta memberikan presentasi ilmiah selama satu jam, saya biasanya bertujuan untuk menceritakan tiga kisah berbeda. Demikian pula, sebuah buku atau tesis akan berisi lebih dari satu cerita, dan pada kenyataannya dapat berisi satu cerita per bab atau bagian.Dalam skenario itu, setiap alur cerita atau subplot yang berbeda harus disajikan dengan tidak lebih dari tiga hingga enam angka. Dalam buku ini, Anda akan menemukan bahwa saya mengikuti prinsip ini di tingkat bagian dalam bab. Setiap bagian kira-kira mandiri dan biasanya akan menunjukkan tidak lebih dari enam angka.

Referensi

Schimel, J. 2011. Ilmu Penulisan: Cara Menulis Makalah yang Dapat Dikutip dan Proposal yang Mendanai . Oxford University Press.
Bateman, S., R. Mandryk, C. Gutwin, A. Genest, D. McDine, dan C. Brooks. 2010. “Sampah Yang Berguna? Efek Hiasan Visual pada Pemahaman dan Memori Grafik. " Konferensi ACM tentang Faktor Manusia dalam Sistem Komputer , 2573–82. doi: 10.1145 / 1753326.1753716 .
Borgo, R., A. Abdul-Rahman, F. Mohamed, PW Grant, I. Reppa, dan L. Floridi. 2012. "Sebuah Studi Empiris tentang Penggunaan Hiasan Visual dalam Visualisasi." Transaksi IEEE pada Visualisasi dan Grafik Komputer 18: 2759–68. doi: 10.1109 / TVCG.2012.197 .
Haroz, S., R. Kosara, dan SL Franconeri. 2015. "Visualisasi ISOTYPE: Memori Kerja, Kinerja, dan Keterlibatan dengan Piktograf." Konferensi ACM tentang Faktor Manusia dalam Sistem Komputer , 1191–1200. doi: 10.1145 / 2702123.2702275 .
Telford, RD, dan RB Cunningham. 1991. "Jenis Kelamin, Olahraga, dan Ketergantungan Ukuran Tubuh pada Atlet yang Sangat Terlatih." Kedokteran dan Sains dalam Olahraga dan Latihan 23: 788-94.