14 Memvisualisasikan tren
Ketika membuat plot pencar (Bab 12 ) atau seri waktu (Bab 13 ), kita sering lebih tertarik pada tren data yang menyeluruh daripada dalam perincian spesifik tempat masing-masing titik data individu berada. Dengan menggambar tren di atas atau alih-alih titik data aktual, biasanya dalam bentuk garis lurus atau kurva, kita dapat membuat visualisasi yang membantu pembaca segera melihat fitur utama dari data. Ada dua pendekatan mendasar untuk menentukan tren: Kita dapat memuluskan data dengan beberapa metode, seperti rata-rata bergerak, atau kita dapat menyesuaikan kurva dengan bentuk fungsional yang ditentukan dan kemudian menggambar kurva yang dipasang. Setelah kami mengidentifikasi tren dalam dataset, mungkin juga berguna untuk melihat secara khusus penyimpangan dari tren atau untuk memisahkan data menjadi beberapa komponen, termasuk tren yang mendasarinya, setiap komponen siklus yang ada, dan komponen episodik atau noise acak.
14.1 Menghaluskan
Mari kita perhatikan seri waktu Dow Jones Industrial Average (singkatnya Dow Jones), indeks pasar saham yang mewakili harga 30 perusahaan besar milik publik AS. Secara khusus, kita akan melihat tahun 2009, tepat setelah kecelakaan 2008 (Gambar 14.1 ). Selama akhir tabrakan, dalam tiga bulan pertama tahun 2009, pasar kehilangan lebih dari 2.400 poin (~ 27%). Kemudian perlahan-lahan pulih untuk sisa tahun ini.Bagaimana kita bisa memvisualisasikan tren jangka panjang ini sambil tidak menekankan fluktuasi jangka pendek yang kurang penting?

Gambar 14.1: Nilai penutupan harian Dow Jones Industrial Average untuk tahun 2009. Sumber data: Yahoo! Keuangan
Dalam istilah statistik, kami mencari cara untuk memperlancarrangkaian waktu pasar saham. Tindakan smoothing menghasilkan fungsi yang menangkap pola kunci dalam data sambil menghilangkan detail kecil yang tidak relevan atau kebisingan. Analis keuangan biasanya memuluskan data pasar saham dengan menghitung rata-rata bergerak. Untuk menghasilkan rata-rata bergerak, kami mengambil jendela waktu, katakanlah 20 hari pertama dalam rangkaian waktu, menghitung harga rata-rata selama 20 hari ini, kemudian memindahkan jendela waktu satu hari, jadi sekarang mencakup hari ke 2 hingga 21, hitung rata-rata selama 20 hari ini, pindahkan jendela waktu lagi, dan seterusnya.Hasilnya adalah deret waktu baru yang terdiri dari urutan harga rata-rata.
Untuk memplot urutan rata-rata bergerak ini, kita perlu memutuskan titik waktu spesifik mana yang akan dikaitkan dengan rata-rata untuk setiap jendela waktu. Analis keuangan sering memplot setiap rata-rata di akhir rentang waktu masing-masing. Pilihan ini menghasilkan kurva yang tertinggal dari data asli (Gambar 14.2 a), dengan kelambatan yang lebih parah terkait dengan jendela waktu rata-rata yang lebih besar. Di sisi lain, ahli statistik memplot rata-rata di tengah jendela waktu, yang menghasilkan kurva yang menutupi data asli dengan sempurna (Gambar 14.2 b).

Gambar 14.2: Nilai penutupan harian Dow Jones Industrial Average untuk tahun 2009, ditunjukkan bersama dengan rata-rata pergerakan 20 hari, 50 hari, dan 100 hari mereka. (a) Rata-rata bergerak diplot pada akhir jendela waktu bergerak. (B) Rata-rata bergerak diplot di tengah jendela waktu bergerak. Sumber data: Yahoo! Keuangan
Terlepas dari apakah kita memplot deret waktu yang dihaluskan dengan atau tanpa jeda, kita dapat melihat bahwa panjang jendela waktu di mana kita rata-rata menetapkan skala fluktuasi yang tetap terlihat dalam kurva yang dihaluskan. Rata-rata pergerakan 20 hari hanya menghilangkan lonjakan kecil jangka pendek tetapi sebaliknya mengikuti data harian dengan cermat. Rata-rata pergerakan 100 hari, di sisi lain, bahkan menghilangkan tetesan atau lonjakan yang cukup substansial yang dimainkan selama rentang waktu beberapa minggu. Sebagai contoh, penurunan besar ke bawah 7000 poin pada kuartal pertama 2009 tidak terlihat dalam rata-rata bergerak 100 hari, yang menggantinya dengan kurva lembut yang tidak turun jauh di bawah 8000 poin (Gambar 14.2 ). Demikian pula, penurunan sekitar Juli 2009 benar-benar tidak terlihat dalam MA 100-hari.
Moving average adalah pendekatan yang paling sederhana untuk menghaluskan, dan memiliki beberapa batasan yang jelas. Pertama, itu menghasilkan kurva dihaluskan yang lebih pendek dari kurva asli (Gambar 14.2 ). Bagian tidak ada di awal atau di akhir atau keduanya. Dan semakin banyak deret waktu dihaluskan (yaitu, semakin besar jendela rata-rata), semakin pendek kurva halus. Kedua, bahkan dengan jendela rata-rata yang besar, rata-rata bergerak belum tentu semulus itu. Ini mungkin menunjukkan benjolan kecil dan goyangan meskipun smoothing skala besar telah dicapai (Gambar 14.2). Goyangan ini disebabkan oleh titik data individual yang masuk atau keluar dari jendela rata-rata. Karena semua titik data di jendela diberi bobot yang sama, titik data individual di batas jendela dapat memiliki dampak yang terlihat rata-rata.
Para ahli statistik telah mengembangkan banyak pendekatan untuk menghaluskan yang mengurangi kelemahan rata-rata bergerak. Pendekatan-pendekatan ini jauh lebih kompleks dan mahal secara komputasi, tetapi mereka sudah tersedia di lingkungan komputasi statistik modern. Salah satu metode yang banyak digunakan adalah LOESS (penghamburan scatterplot yang diestimasikan secara lokal, WS Cleveland ( 1979 ) ), yang cocok dengan polinomial derajat rendah untuk subset data. Yang penting, titik-titik di tengah setiap subset ditimbang lebih berat daripada titik di batas, dan skema pembobotan ini menghasilkan hasil yang jauh lebih halus daripada yang kita dapatkan dari rata-rata tertimbang (Gambar 14.3 ). Kurva LOESS yang ditampilkan di sini terlihat mirip dengan rata-rata 100 hari, tetapi kesamaan ini tidak boleh ditafsirkan secara berlebihan. Kelancaran kurva LOESS dapat disesuaikan dengan menyesuaikan parameter, dan pilihan parameter yang berbeda akan menghasilkan kurva LOESS yang lebih mirip dengan rata-rata 20 hari atau 50 hari.

Gambar 14.3: Perbandingan LOESS yang sesuai dengan rata-rata bergerak 100 hari untuk data Dow Jones pada Gambar 14.2 . Tren keseluruhan yang ditunjukkan oleh LOESS smooth hampir identik dengan moving average 100-hari, tetapi kurva LOESS jauh lebih halus dan meluas ke seluruh rentang data. Sumber data: Yahoo! Keuangan
Yang penting, LOESS tidak terbatas pada deret waktu. Ini dapat diterapkan pada plot sebar yang sewenang-wenang, seperti yang terlihat dari namanya, penghalusan sebaran yang diperkirakan secara lokal . Sebagai contoh, kita dapat menggunakan LOESS untuk mencari tren dalam hubungan antara kapasitas tangki bahan bakar mobil dan harganya (Gambar 14.4 ). Garis LOESS menunjukkan bahwa kapasitas tangki tumbuh sekitar secara linear dengan harga untuk mobil murah (di bawah $ 20.000) tetapi turun untuk mobil yang lebih mahal. Di atas harga sekitar $ 20.000, membeli mobil yang lebih mahal tidak akan membuat Anda memiliki tangki bahan bakar yang lebih besar.

Gambar 14.4: Kapasitas tangki bahan bakar versus harga 93 mobil yang dirilis untuk model tahun 1993. Setiap titik berhubungan dengan satu mobil.Garis solid menunjukkan kelancaran data. Kami melihat bahwa kapasitas tangki bahan bakar meningkat secara linear dengan harga, hingga harga sekitar $ 20.000, dan kemudian turun. Sumber data: Robin H. Lock, Universitas St. Lawrence
LOESS adalah pendekatan perataan yang sangat populer karena cenderung menghasilkan hasil yang terlihat benar bagi mata manusia. Namun, itu memerlukan pemasangan banyak model regresi yang terpisah. Ini membuatnya lambat untuk dataset besar, bahkan pada peralatan komputasi modern.
Sebagai alternatif yang lebih cepat untuk LOESS, kita dapat menggunakan model spline. Spline adalah fungsi polinomial sambungan ganda yang sangat fleksibel namun selalu terlihat mulus. Saat bekerja dengan splines, kita akan menemukan istilah simpul. Simpul dalam spline adalah titik akhir dari segmen spline individual. Jika kita paskan spline dengan segmen k , kita perlu menentukan k + 1 knot.Meskipun pemasangan spline efisien secara komputasi, khususnya jika jumlah simpul tidak terlalu besar, spline memiliki kelemahan sendiri. Yang paling penting, ada array membingungkan berbagai jenis splines, termasuk spline kubik, spline B, spline pelat tipis, spline proses Gaussian, dan banyak lainnya, dan yang mana untuk dipilih mungkin tidak jelas. Pilihan spesifik dari jenis spline dan jumlah simpul yang digunakan dapat menghasilkan fungsi perataan yang sangat berbeda untuk data yang sama (Gambar 14.5 ).

Gambar 14.5: Model pemulusan yang berbeda menampilkan perilaku yang sangat berbeda, khususnya di dekat batas data. (a) LOESS lebih halus, seperti pada Gambar 14.4 . (B) Splines regresi kubik dengan 5 knot. (c) Spline regresi pelat tipis dengan 3 knot. (d) Proses spline Gaussian dengan 6 knot. Sumber data: Robin H. Lock, Universitas St. Lawrence
Sebagian besar perangkat lunak visualisasi data akan menyediakan fitur penghalusan, kemungkinan diimplementasikan sebagai jenis regresi lokal (seperti LOESS) atau jenis spline. Metode smoothing dapat disebut sebagai GAM, model aditif umum, yang merupakan superset dari semua jenis smoothers ini. Penting untuk diperhatikan bahwa output dari fitur smoothing sangat tergantung pada model GAM tertentu yang sesuai. Kecuali jika Anda mencoba sejumlah pilihan yang berbeda, Anda mungkin tidak akan pernah menyadari sejauh mana hasil yang Anda lihat tergantung pada pilihan standar spesifik yang dibuat oleh perangkat lunak statistik Anda.
Hati-hati saat menginterpretasikan hasil dari fungsi smoothing. Dataset yang sama dapat dihaluskan dengan berbagai cara.
14.2 Menampilkan tren dengan bentuk fungsional yang ditentukan
Seperti yang dapat kita lihat pada Gambar 14.5 , perilaku smoothers untuk tujuan umum bisa agak tidak dapat diprediksi untuk dataset yang diberikan. Para smoothers ini juga tidak memberikan estimasi parameter yang memiliki interpretasi yang bermakna. Oleh karena itu, bila memungkinkan, lebih disukai untuk mencocokkan kurva dengan bentuk fungsional spesifik yang sesuai untuk data dan yang menggunakan parameter dengan makna yang jelas.
Untuk data tangki bahan bakar, kita membutuhkan kurva yang awalnya naik secara linear tetapi kemudian turun pada nilai konstan. Fungsi \ (y = A - B \ exp (-mx) \) mungkin sesuai dengan tagihan itu. Di sini, \ (A \) , \ (B \) , dan \ (m \) adalah konstanta yang kita sesuaikan agar sesuai dengan kurva dengan data. Fungsi ini kira-kira linear untuk kecil \ (x \) , dengan \ (y \ approx A - B + B mx \) , ia mendekati nilai konstan untuk besar \ (x \) , \ (y \ approx A \) , dan itu benar-benar meningkat untuk semua nilai \ (x \) . Gambar 14.6menunjukkan bahwa persamaan ini sesuai dengan data setidaknya sama halnya dengan semua smoothers yang telah kita pertimbangkan sebelumnya (Gambar 14.5 ).

Gambar 14.6: Data tangki bahan bakar diwakili dengan model analitis eksplisit. Garis solid sesuai dengan kuadrat-terkecil dari rumus \ (y = A - B \ exp (-mx) \) dengan data. Parameter yang dipasang adalah \ (A = 19.6 \) , \ (B = 29.2 \) , \ (m = 0,00015 \) . Sumber data: Robin H. Lock, Universitas St. Lawrence
Bentuk fungsional yang dapat diterapkan dalam banyak konteks berbeda adalah garis lurus sederhana, \ (y = A + mx \) . Kira-kira hubungan linear antara dua variabel secara mengejutkan umum dalam dataset dunia nyata. Sebagai contoh, pada Bab 12 , saya membahas hubungan antara panjang kepala dan massa tubuh dalam blue jays.Hubungan ini kira-kira linier, untuk burung betina dan burung jantan, dan menggambar garis tren linier di atas titik-titik dalam sebaran plot membantu pembaca memahami tren (Gambar 14.7 ).

Gambar 14.7: Panjang kepala versus massa tubuh selama 123 blue jays.Jenis kelamin burung ditunjukkan oleh warna. Angka ini setara dengan Gambar 12.2 , kecuali sekarang kami telah menggambar garis tren linier di atas masing-masing titik data. Sumber data: Keith Tarvin, Oberlin College
Saat data menampilkan hubungan non-linear, kita perlu menebak bentuk fungsional yang tepat. Dalam hal ini, kita dapat menilai ketepatan tebakan kita dengan mengubah sumbu sedemikian rupa sehingga hubungan linier muncul.Untuk menunjukkan prinsip ini, mari kita kembali ke kiriman bulanan ke server preprint bioRxiv, dibahas pada Bab 12 .Jika peningkatan pengiriman di setiap bulan sebanding dengan jumlah pengiriman di bulan sebelumnya, yaitu, jika pengiriman tumbuh dengan persentase tetap setiap bulan, maka kurva yang dihasilkan adalah eksponensial. Asumsi ini tampaknya dipenuhi untuk data bioRxiv, karena kurva dengan bentuk eksponensial, \ (y = A \ exp (mx) \) , cocok dengan data pengiriman bioRxiv dengan baik (Gambar 14.8 ).
![Pengajuan bulanan ke server preprint bioRxiv. Garis biru solid mewakili jumlah pracetak bulanan aktual dan garis hitam putus-putus mewakili kecocokan eksponensial ke data, \ (y = 60 \ exp [0,77 (x - 2014)] \). Sumber data: Jordan Anaya, http://www.prepubmed.org/](https://serialmentor.com/dataviz/visualizing_trends_files/figure-html/biorxiv-expfit-1.png)
Gambar 14.8: Pengajuan bulanan ke server preprint bioRxiv. Garis biru solid mewakili jumlah pracetak bulanan aktual dan garis hitam putus-putus mewakili kecocokan eksponensial ke data, \ (y = 60 \ exp [0,77 (x - 2014)] \) . Sumber data: Jordan Anaya, http://www.prepubmed.org/
Jika kurva asli adalah eksponensial, \ (y = A \ exp (mx) \) , maka transformasi log dari nilai y akan mengubahnya menjadi hubungan linear, \ (\ log (y) = \ log (A) + mx \) . Oleh karena itu, memplot data dengan nilai y yang ditransformasi log (atau ekuivalen, dengan sumbu y logaritmik) dan mencari hubungan linier adalah cara yang baik untuk menentukan apakah suatu dataset menunjukkan pertumbuhan eksponensial. Untuk angka penyerahan bioRxiv, kami memang memperoleh hubungan linier saat menggunakan sumbu y logaritmik (Gambar 14.9 ).
![Pengajuan bulanan ke server preprint bioRxiv, ditampilkan pada skala log. Garis biru pekat mewakili jumlah pracetak bulanan aktual, garis hitam putus-putus mewakili kecocokan eksponensial dari Gambar 14.8, dan garis hitam pekat mewakili kecocokan linier untuk data yang ditransformasi log, sesuai dengan \ (y = 43 \ exp [0,88 ( x - 2014)] \). Sumber data: Jordan Anaya, http://www.prepubmed.org/](https://serialmentor.com/dataviz/visualizing_trends_files/figure-html/biorxiv-logscale-1.png)
Gambar 14.9: Pengajuan bulanan ke server preprint bioRxiv, ditunjukkan pada skala log. Garis biru pekat mewakili jumlah pracetak bulanan aktual, garis hitam putus-putus mewakili kecocokan eksponensial dari Gambar 14.8 , dan garis hitam pekat mewakili kecocokan linier untuk data yang ditransformasi log, sesuai dengan \ (y = 43 \ exp [0,88 ( x - 2014)] \) .Sumber data: Jordan Anaya, http://www.prepubmed.org/
Pada Gambar 14.9 , selain jumlah pengiriman aktual, saya juga menunjukkan kesesuaian eksponensial dari Gambar 14.8 dan kesesuaian linier dengan data yang ditransformasi log. Kedua pasangan ini serupa tetapi tidak identik. Secara khusus, kemiringan garis putus-putus tampaknya agak tidak jelas. Garis secara sistematis berada di atas titik data individual selama setengah deret waktu. Ini adalah masalah umum dengan kecocokan eksponensial: Penyimpangan kuadrat dari titik data ke kurva yang dipasang jauh lebih besar untuk nilai data terbesar daripada nilai data terkecil sehingga penyimpangan nilai data terkecil berkontribusi sedikit ke keseluruhan jumlah kuadrat bahwa fit meminimalkan. Akibatnya, garis yang dipasang secara sistematis melampaui atau menurunkan nilai data terkecil.Untuk alasan ini, saya biasanya menyarankan untuk menghindari kecocokan eksponensial dan alih-alih menggunakan kecocokan linier pada data yang ditransformasi log.
Biasanya lebih baik untuk mencocokkan garis lurus dengan data yang ditransformasi daripada mencocokkan kurva nonlinear dengan data yang tidak ditransformasi.
Plot seperti Gambar 14.9 umumnya disebut sebagai log-linear, karena sumbu y adalah logaritmik dan sumbu x adalah linier. Plot lain yang mungkin kita temui termasuk log-log , di mana sumbu y dan x adalah logaritmik, atau linear-log , di mana y adalah linier dan x adalah logaritmik. Dalam plot log-log, hukum kekuatan dari bentuk \ (y \ sim x ^ \ alpha \)muncul sebagai garis lurus (lihat Gambar 8.7 sebagai contoh), dan dalam plot linear-log, hubungan logaritmik dari bentuk \ (y \ sim \ log (x) \) muncul sebagai garis lurus.Bentuk fungsional lainnya dapat diubah menjadi hubungan linier dengan transformasi koordinat yang lebih terspesialisasi, tetapi ketiganya (log-linier, log-log, linier-log) mencakup berbagai aplikasi dunia nyata.
14.3 Detrending dan dekomposisi seri waktu
Untuk rangkaian waktu dengan tren jangka panjang yang menonjol, mungkin berguna untuk menghapus tren ini untuk secara khusus menyoroti penyimpangan yang menonjol.Teknik ini disebut detrending , dan saya akan menunjukkannya di sini dengan harga rumah. Di AS, pemberi pinjaman hipotek Freddie Mac menerbitkan indeks bulanan, yang disebut Indeks Harga Rumah Freddie Mac, yang melacak perubahan harga rumah dari waktu ke waktu. Indeks mencoba untuk menangkap keadaan seluruh pasar rumah di wilayah tertentu, sehingga peningkatan indeks dengan, misalnya, 10% dapat diartikan sebagai kenaikan harga rumah rata-rata 10% di pasar masing-masing. Indeks secara sewenang-wenang diatur ke nilai 100 pada bulan Desember 2000.
Selama periode waktu yang lama, harga rumah cenderung menunjukkan pertumbuhan tahunan yang konsisten, kira-kira sejalan dengan inflasi. Namun, di atas tren ini ada gelembung perumahan yang mengarah ke siklus boom dan bust yang parah. Gambar 14.10 menunjukkan indeks harga rumah aktual dan tren jangka panjang untuk empat negara bagian AS terpilih. Kita melihat bahwa antara 1980 dan 2017, California mengalami dua gelembung, satu pada 1990 dan satu pada pertengahan 2000-an. Selama periode yang sama, Nevada hanya mengalami satu gelembung, pada pertengahan 2000-an, dan harga rumah di Texas dan Virginia Barat mengikuti tren jangka panjang mereka sepanjang waktu. Karena harga rumah cenderung tumbuh dalam kenaikan persen, yaitu, secara eksponensial, saya telah memilih sumbu y logaritmik pada Gambar 14.10 . Garis lurus sesuai dengan kenaikan harga tahunan 4,7% di California dan kenaikan harga tahunan 2,8% masing-masing di Nevada, Texas, dan Virginia Barat.

Gambar 14.10: Indeks Harga Rumah Freddie Mac dari 1980 hingga 2017, untuk empat negara bagian terpilih (California, Nevada, Texas, dan Virginia Barat). Indeks Harga Rumah adalah angka tanpa unit yang melacak harga rumah relatif di wilayah geografis yang dipilih seiring waktu. Indeks diskalakan secara sewenang-wenang sehingga sama dengan 100 pada bulan Desember tahun 2000. Garis biru menunjukkan fluktuasi bulanan dalam indeks dan garis abu-abu lurus menunjukkan tren harga jangka panjang di masing-masing negara. Perhatikan bahwa sumbu y adalah logaritmik, sehingga garis abu-abu lurus menunjukkan pertumbuhan eksponensial yang konsisten. Sumber data: Indeks Harga Rumah Freddie Mac
Kami menurunkan harga rumah dengan membagi indeks harga aktual pada setiap titik waktu dengan nilai masing-masing dalam tren jangka panjang. Secara visual, pembagian ini akan terlihat seperti kita mengurangi garis abu-abu dari garis biru pada Gambar 14.10 , karena pembagian nilai yang tidak ditransformasi setara dengan pengurangan nilai yang ditransformasi log. Harga rumah detrended yang dihasilkan menunjukkan gelembung perumahan lebih jelas (Gambar 14.11 ), karena detrending tersebut menekankan pergerakan tak terduga dalam serangkaian waktu. Sebagai contoh, dalam seri waktu asli, penurunan harga rumah di California dari tahun 1990 menjadi sekitar tahun 1998 terlihat sederhana (Gambar 14.10 ). Namun, selama periode waktu yang sama, berdasarkan tren jangka panjang kita akan mengharapkan harga naik. Sehubungan dengan kenaikan yang diharapkan, penurunan harga adalah substansial, sebesar 25% pada titik terendah (Gambar 14.11 ).

Gambar 14.11: Indeks Harga Freddie Mac House versi detrended yang ditunjukkan pada Gambar 14.10 . Indeks detrended dihitung dengan membagi indeks aktual (garis biru pada Gambar 14.10 ) dengan nilai yang diharapkan berdasarkan tren jangka panjang (garis abu-abu lurus pada Gambar 14.10 ). Visualisasi ini menunjukkan bahwa California mengalami dua gelembung perumahan, sekitar tahun 1990 dan pada pertengahan 2000-an, dapat diidentifikasi dari kenaikan yang cepat dan penurunan selanjutnya dalam harga perumahan aktual relatif terhadap apa yang diharapkan dari tren jangka panjang. Demikian pula, Nevada mengalami satu gelembung perumahan, pada pertengahan 2000-an, dan Texas maupun Virginia Barat tidak mengalami banyak gelembung sama sekali.Sumber data: Indeks Harga Rumah Freddie Mac
Selain detrending sederhana, kami juga dapat memisahkan deret waktu menjadi beberapa komponen berbeda, sehingga jumlah mereka memulihkan deret waktu asli. Secara umum, selain tren jangka panjang, ada tiga komponen berbeda yang dapat membentuk deret waktu. Pertama, ada noise acak, yang menyebabkan gerakan kecil dan tidak menentu naik dan turun. Kebisingan ini terlihat dalam semua deret waktu yang ditunjukkan dalam bab ini, tetapi mungkin yang paling jelas pada Gambar 14.9 . Kedua, bisa ada peristiwa eksternal unik yang meninggalkan bekasnya dalam rangkaian waktu, seperti gelembung perumahan yang berbeda seperti yang terlihat pada Gambar 14.10 . Ketiga, bisa ada variasi siklus.Misalnya, suhu luar menunjukkan variasi siklus harian. Suhu tertinggi dicapai pada sore hari dan suhu terendah di pagi hari. Temperatur luar juga menunjukkan variasi siklus tahunan. Mereka cenderung naik di musim semi, mencapai maksimum di musim panas, dan kemudian menurun di musim gugur dan mencapai minimum di musim dingin (Gambar 3.2 ).
Untuk menunjukkan konsep komponen deret waktu yang berbeda, saya di sini akan menguraikan kurva Keeling, yang menunjukkan perubahan kelimpahan CO 2 dari waktu ke waktu (Gambar 14.12 ). CO 2 diukur dalam bagian per juta (ppm). Kita melihat peningkatan jangka panjang dalam kelimpahan CO 2 yang sedikit lebih cepat dari linear, dari di bawah 325 ppm pada 1960-an menjadi di atas 400 pada dekade kedua abad ke-21 (Gambar 14.12 ). Kelimpahan CO 2juga berfluktuasi secara tahunan, mengikuti pola naik-turun yang konsisten yang ditampikan di atas peningkatan keseluruhan. Fluktuasi tahunan didorong oleh pertumbuhan tanaman di belahan bumi utara. Tumbuhan mengkonsumsi CO 2 selama fotosintesis. Karena sebagian besar daratan dunia terletak di belahan bumi utara, dan pertumbuhan tanaman paling aktif di musim semi dan musim panas, kami melihat penurunan global tahunan CO2 atmosfer yang bertepatan dengan bulan-bulan musim panas di belahan bumi utara.

Gambar 14.12: Kurva Keeling. Kurva Keeling menunjukkan perubahan kelimpahan CO 2 di atmosfer dari waktu ke waktu. Sejak 1958, kelimpahan CO 2 terus dipantau di Observatorium Mauna Loa di Hawaii, awalnya di bawah arahan Charles Keeling. Yang ditampilkan di sini adalah pembacaan CO 2 rata-rata bulanan, dinyatakan dalam bagian per juta (ppm).Pembacaan CO 2 berfluktuasi secara tahunan dengan musim tetapi menunjukkan tren kenaikan jangka panjang yang konsisten. Sumber data: Dr. Pieter Tans, NOAA / ESRL, dan Dr. Ralph Keeling, Scripps Institution of Oceanography
Kita dapat menguraikan kurva Keeling menjadi tren jangka panjang, fluktuasi musiman, dan sisanya (Gambar 14.13 ).Metode spesifik yang saya gunakan di sini disebut STL (Seasonal decomposition of Time series oleh LOESS, RB Cleveland et al. ( 1990 ) ), tetapi ada banyak metode lain yang mencapai tujuan yang sama. Dekomposisi menunjukkan bahwa selama tiga dekade terakhir, kelimpahan CO 2 telah meningkat lebih dari 50 ppm. Sebagai perbandingan, fluktuasi musiman berjumlah kurang dari 8 ppm (mereka tidak pernah menyebabkan peningkatan atau penurunan lebih dari 4 ppm relatif terhadap tren jangka panjang), dan sisanya jumlahnya kurang dari 1,6 ppm (Gambar 14.13 ). Sisanya adalah perbedaan antara pembacaan aktual dan jumlah tren jangka panjang dan fluktuasi musiman, dan di sini sesuai dengan kebisingan acak dalam pembacaan CO 2 bulanan. Namun, secara umum, sisanya juga dapat menangkap peristiwa eksternal yang unik.Misalnya, jika erupsi gunung berapi besar-besaran melepaskan sejumlah besar CO 2 , peristiwa semacam itu mungkin terlihat sebagai lonjakan tiba-tiba di sisanya.Gambar 14.13 menunjukkan bahwa tidak ada peristiwa eksternal unik yang memiliki pengaruh besar pada kurva Keeling dalam beberapa dekade terakhir.

Gambar 14.13: Dekomposisi deret waktu dari kurva Keeling, menunjukkan rata-rata bulanan (seperti pada Gambar 14.12 ), tren jangka panjang, fluktuasi musiman, dan sisanya. Sisanya adalah perbedaan antara pembacaan aktual dan jumlah tren jangka panjang dan fluktuasi musiman, dan itu mewakili kebisingan acak. Saya telah memperbesar data 30 tahun terakhir untuk lebih jelas menunjukkan bentuk fluktuasi tahunan. Sumber data: Dr. Pieter Tans, NOAA / ESRL, dan Dr. Ralph Keeling, Scripps Institution of Oceanography
Referensi
Cleveland, WS 1979. “Regresi Berbobot Lokal yang Kuat dan Menghamburkan Plot.” Jurnal Asosiasi Statistik Amerika 74: 829-36.
Cleveland, RB, WS Cleveland, JE McRae, dan I. Terpenning.1990. "STL: Prosedur Dekomposisi Tren Musiman Berdasarkan Loess." Jurnal Statistik Resmi 6: 3–73.
