一張疫情圖表,學會《Google 必修的圖表簡報術》的設計師思維

by 好豪
Published: Updated:

最近在複習自己蒐集的資料視覺化技巧筆記,找到了今年(2020 年)三月新冠肺炎疫情迅速蔓延時、在國際各大新聞網之間爆紅的一張圖表。這一張由金融時報數據專家 John Burn-Murdoch 製作的疫情圖表對我而言是最佳的資料視覺化範例之一,它包含我在《Google 必修的圖表簡報術》這本書學到最重要的幾項技巧:掌握數據脈絡說故事、活用視覺元素捕捉讀者目光、並且用直覺好懂的設計呈現資訊觀點。本文會詳細介紹以下這張疫情圖表:

2020 年 3 月爆紅的肺炎疫情資料視覺化(Source: Financial Times

好豪在這則筆記將幫助想學好資料視覺化的你,整理出這張疫情圖表值得注意的細節、以及作者展現的設計師思維。你可以把這張圖當作資料視覺化的好範本,時時想起它、對照自己設計的其他圖表是否也能透過這些設計原則變得更精彩。

掌握數據脈絡

「繪製圖表要先建立出核心想法:找出特定的聽眾族群為何、他們需要知道什麼、有何行動,才能決定用什麼資料最有幫助。」

《Google 必修的圖表簡報術》

資料視覺化的基礎要點,是徹底了解資料、依照脈絡選擇數據的功能,並且 站在讀者的角度思考:他們迫切想知道的議題是什麼?這份數據是否足以回答?有沒有錯誤解讀的可能?

新冠肺炎疫情的脈絡,主要與病毒快速傳播的特性有關,據此,需要思考如何選擇 X 軸與 Y 軸的指標才能傳達出正確的知識、並且讀者不容易被誤導?

對數尺度的 Y 軸

病毒傳播是「一傳十、十傳百」的指數成長,而不是每日增加 N 例的線性成長,因此,針對指數成長使用對數尺度(Log Scale)的確診數據是較好的選擇。

指數成長之數據,採用對數尺度前後差異(Source: Erik Pickett’s Blog

在 Y 軸上,100 ~ 1,000 確診數,以及 1,000 ~ 10,000 確診數,雖然絕對數字是 900 與 9,000 的差別,但是對數尺度的垂直距離相同!讀者可以思考看看,下列兩種數據解讀,哪個是值得傳播給大眾的資訊呢?

  • 「國內本週確診數新增 9,000 人,是上週確診數 900 人的十倍。」
  • 「國內本週確診數增加速度與上週相同、都在一週期間增加十倍確診數。」
絕對數字差十倍,但是對數尺度的垂直距離相同(Source: John Burn-Murdoch

作者 John Burn-Murdoch 認為,比起確診總數,我們更在乎疫情是否受到控制、確診成長速度是否有減緩。使用對數尺度作圖,若是成長速度沒變、數據走勢就會維持在同一條直線上,很好判斷速度是否有變化。作者表示 使用確診絕對數字既不實用、還容易令人誤以為病毒傳播速度在增加、徒增恐慌。

以圖中的日本數據為例,在第 20 天以前都維持在同一條直線上、相同成長速度,而在第 20 天以後走勢偏離原本直線、變得平緩,依此很容易看出確診數成長減緩反映在數據上。

註:作者認為 Y 軸不適合使用經各國人口數調整(per-capita)的標準化數據,主要理由是小國的數值比起大國更容易被過度放大。

將疫情爆發時間齊頭比較的 X 軸

既然是要看確診數增加速度,直覺會認為:X 軸就用日期吧!讀者可以先思考看看,如果疫情數據是下列這種製圖方式會如何呢:

X 軸單純採用日期的確診數增加數據圖表(Source: Vox 新聞網

然而每個國家疫情爆發時間不同,有些在 2020 年二月就開始增加確診數、有些 2020 年三月才開始。仔細思考我們的數據脈絡,是希望比較:各國確診數成長速度不同、哪些國家確診數增加速度較和緩、有沒有值得參考的措施。因此作者選擇 X 軸用「確診 100 人之後的第一天」為起點比較各國差異。

要注意的是,這種將起始日期齊頭比較的方法,無法呈現出疫情爆發先後順序。有沒有可能較晚爆發疫情的國家,已經在國際間蒐集較多的資訊、可以提早採取行動、所以疫情蔓延速度較慢呢?這是值得探討的問題,但是這張疫情圖表的呈現方式無法回答。

功能可見性

「數據分析圖表只有 3 到 8 秒的時間可以抓住聽眾的注意力。」

《Google 必修的圖表簡報術》

數據圖表的功能是將作者想說的故事傳達給讀者。然而,沒有經過設計的圖表就會失去功能,讀者將不知道該關心什麼、失去耐心、甚至恣意錯誤解讀。為了讓數據的功能清楚可見,《Google 必修的圖表簡報術》說明,要善用 前注意特徵,掌握讀者目光與閱讀順序,打造出資訊的視覺階層。

以色彩設計資訊階層

在數據圖表上,不是所有內容都同等重要,讓讀者看到第一眼就找到重點在哪,是設計者的責任,而色彩的運用會是吸引讀者目光最有用的工具之一。

彩色 v.s. 灰階

《Google 必修的圖表簡報術》書中提及,要將色彩當作策略工具、強調圖表重要的部分。基本招數是以灰色為基底設計圖表,再選一個(或幾個)搶眼的顏色吸引讀者目光。下圖是一個簡單的範例:

範例:只讓特定項目是彩色、其他是灰階色系,就能聚集讀者目光。(Source: Storytelling with Data

而在疫情圖表中:

  • 作者最想讓你注意到的國家,以彩色繪製;
  • 相較之下,不在作者主要比較名單之列的其他國家就以灰階表示。

如此對比,讀者自然會最先把目光停留在被彩色標注的幾個主要國家、其他國家的閱讀重要性透過灰階被淡化

或許你會懷疑,如果不是作者最想比較的主要國家,為何不直接從圖表移除就好、何必使用灰階呈現?好豪認為,灰階繪製的國家是為了呈現比較基準、也就是病毒傳播的平均速度。你可以在圖中看出確診平均速度大約是每 3 天成長一倍,也因為同時繪出許多其他國家的情況,更能反映出日本、新加坡、香港每週成長一倍的速度是明顯地相對緩慢。

色彩群組

同樣是被標註成彩色的國家之間,也能呈現分組差異喔!在圖表中,南韓、日本、新加坡、以及香港,都同樣被標註成水藍色,其他的國家則是各自有自己的顏色。這項色彩群組技巧,是利用 格式塔心理學理論相似原則:視線中在某一方面相似的各個小部分,會被讀者理解為同個群體。

在疫情圖表中,設計者刻意讓部分國家同屬水藍色,讀者就會在心中自動找出共同特色,配合設計者的註解,就會很快理解出共同特色包括確診速度已趨於和緩、並且都有明確措施減緩確診數等等。

資料標籤,將讀者目光導向重點

資料標籤(label)會直接給讀者「請看這裡」的提示,是利用 格式塔理論相近原則:讀者會同時注意到資料標籤、以及距離資料標籤最近的數據。

作者在此利用的資料標籤,有兩項重要的好處:

提醒你該注意現況、而不是過去

資料標籤都是標註在各國當下最新的數據點旁邊,依照相近原則,讀者在圖表上觀察的順序,自然地被資料標籤導引成從右看到左、會先看最近期的斜率(成長速度)是如何,資料標籤也是為了最近期的斜率所下的註解。

用資料標籤取代圖例

想像一下,如果這張圖各個國家的標示是用圖例(legend)而不是用資料標籤的話,會是什麼感覺呢?會像是連連看遊戲的感覺吧!

範例:如果圖例項目太多,要知道每條線代表什麼就需要費力地「連連看」(Source: Gapminder;製圖:好豪)

在疫情數據圖表上:

  • 如果使用圖例,當你對其中一條線特別有興趣時,還需要根據他的顏色,再回去圖例查找、才知道對應到哪個國家。
  • 如果是使用資料標籤、直接在線的尾端標註上是哪個國家,讀者就不需要費力查找了!
資料標籤取代圖例、並添加資料註解。
小細節:讓資料標籤的文字顏色與線條顏色相同、更能符合格式塔理論的相近原則。
(Source: Financial Times

用資料標籤取代圖例的技巧或許聽起來很好用,卻也不是每個情況都適合,如果你想強調的項目非常多,圖表恐怕會被資料標籤給塞滿!根據筆者好豪的資料視覺化分析經驗,如果你標註顏色的數目不像此疫情圖表是個位數、而是多到需要一個圖例列表才能完整呈現的時候,通常就表示你用的顏色太多了

資料視覺化時,顏色更適合用來強調特定資訊、而不是陳列或是單純為了繽紛。如果你有太多項目需要顏色強調,反而等同於沒有強調效果,所以,要謹慎運用顏色能帶來的視覺效果。

每個項目都不同顏色,等同於沒有任何一項被強調,只會讓圖表失焦而已。(Source: Storytelling with Data

圖表易用性

「站在讀者的立場寫作,不要陷入專業的自戀。」

《精準寫作》

我認為 John Burn-Murdoch 的疫情圖表爆紅最重要的理由,是讓不同領域的聽眾都看得懂,人人都能快速看到要點,要將此資訊散播出去就更容易。此圖表的易用性,主要來自於文字與輔助線的運用。

善用文字說明

在好豪的工作經驗中,大多數的數據使用者都期待你直接給出一個觀點、或是答案。資料科學家給出的觀點不見得完美,但是讀者需要你的觀點做為閱讀聚焦點,讀者自己會驗證數據是否足以支持你的觀點。

《Google 必修的圖表簡報術》強調,圖表的大標題是非常珍貴的空間,這個空間應該要利用來闡明觀點、數據解讀、或者呼籲行動。如果大標題空間只是用來說明這張圖表在幹嘛,就太可惜了!

以本文介紹的疫情圖表為例:

  • 低效的標題:「各國的病毒傳播速度」
  • 有價值地用標題闡述觀點:「西方國家病毒傳播速度相似;而亞洲已開發國家的病毒傳播速度已趨緩」

在大標題寫下宏觀觀點,進一步在資料標籤微觀解讀數據,滿足讀者的好奇心:為何這些亞洲國家的確診數得以趨緩?

從此圖表,我們學會使用文字輔助的簡單模板:

  • 在標題寫出「我發現…」
  • 用資料標籤標示出「理由是…」

明確結論加上數據支持,一張圖表就能呈現出一個前後呼應的資料故事

巧用輔助線

作者 John Burn-Murdoch 在 他的推特 表示,擔心讀者不會解讀對數尺度是多餘的,讀者會自己根據心中的疑問解析數據。

對此,好豪認為不盡然正確,因為作者沒有說清楚他使用的關鍵要素:輔助線

使用輔助線加上文字說明,讀者就算從沒聽過什麼是對數與指數成長,也可以直接解讀!

對照輔助線,讀者可以輕易看出:

  • 日本與新加坡等亞洲已開發國家,確診數增加速度已經減緩到每週成長一倍
  • 而大多西方主要國家,確診數增加速度則是每三天就增加一倍、或者更快!

好壞、優劣、或快慢等概念,都是透過比較而來的,John Burn-Murdoch 的圖表值得學習之處是利用輔助線直觀告訴觀眾如何比較病毒傳播速度。讀者只需要將各國數據與輔助線比較斜率,很快就能看出確診數成長速度落在哪個範圍。經過巧妙的輔助線設計之後,讀者不用仔細看 X 軸與 Y 軸究竟是什麼、也能解讀數據!

如果你的資料視覺化也需要呈現可能無法一眼看懂的複雜概念,不妨嘗試加上輔助線、達成減少讀者 認知負荷 的效果。


結語

我認為,最成功的數據圖表是讓使用者不思考也能得出洞見。這張圖表能爆紅,除了在對的時機掌握到疫情話題性以外,更重要的是作者 John Burn-Murdoch 做出讓男女老少都能迅速看懂、兼顧美觀與實用的圖表設計。

這張圖表的用到的技巧,色彩編列資訊階層、資料標籤運用、文字說明與輔助線設計等等,都不只是針對疫情數據、而是在其他類型數據圖表都能嘗試使用的通用技巧。對我來說,這一張圖就是《Google 必修的圖表簡報術》提及的多項重要技巧之實踐,再次推薦你精讀這張疫情圖表,把他收進書籤,時常複習這些資料視覺化技巧、在自己的其他作品中發揮出來!

在這則筆記所分享的主要是視覺化的概念,想要實際動手製作美麗圖表的讀者,推薦你使用 R 語言的 ggplot2 工具,要畫出上方的任何數據圖表都不是問題。好豪的另一則筆記分享了 R 語言以及 ggplot2 的自學資源,一起來練習怎麼讓自己的圖表與簡報更精美吧!

如果你還想多了解這張疫情圖表,Vox 新聞網製作的圖表解說影片相當值得一看:


參考資料:

還想了解更多資料視覺化知識嗎?推薦你閱讀好豪寫的資料視覺化商業案例分析:

推薦閱讀