俗話說:“一圖勝千言”,在圖表中我們不僅僅可以看到全國產品銷量的折線圖,還有比較類的柱狀圖。這么多的數據和信息濃縮在一個圖表中,帶給人直觀和多元的感受,但其實這像這樣數據轉化為圖表的過程有一個更好聽的名字叫做——數據可視化。
那么究竟什么是數據可視化呢?就是簡單地理解為Excel圖表嗎?
其實并不是。長久以來,數據可視化都是一個強有力的工具,被業界廣泛使用,簡單地說就是用圖形的方式展現數據。數據可視化和數據分析從來都是離不開的,就像統計學家John Tukey說的那樣“一張圖片的最大價值在于,它迫使我們注意到我們從未期望看到的東西”,一語道破數據可視化的必要性。那么數據可視化一定要通過Excel才能實現嗎,還有什么其他的工具嗎?精美好看的可視化表格是什么樣的,又有什么特點呢?
今天小億和大家從可視化圖表開始,聊聊這些。
一、數據可視化的內涵
1、什么是數據可視化?
數據可視化起源于18世紀。William Playfair在其出版的書籍中第一次使用了柱狀圖和折線圖,當時是為了表示國家的進出口量,到了今天柱狀圖和折線圖依然在使用。19世紀初,他出版了Statistical Breviary一書,里面第一次使用了餅狀圖。這三種圖形都是至今常用的、著名的可視化圖形。19世紀中葉,數據可視化主要被用于軍事,用來表示軍隊死亡原因、軍隊的分布圖等。進入20世紀,數據可視化有了飛躍性的發展。1990年,在人機界面學會上,它作為信息可視化原型的技術被發表。1995年,IEEE Information Visualization 正式創立,信息可視化作為獨立的學科被正式確立。隨著2012年世界進入大數據時代,數據可視化作為大量數據的呈現方式,成為當前重要的課題。
數據可視化是指將大型數據集中的數據以圖形圖像形式表示,并利用數據分析和開發工具發現其中未知信息的處理過程。數據可視化的目的是對數據進行可視化處理,以使能夠明確、有效地傳遞信息。比起枯燥乏味的數值,人類對于大小、位置、濃淡、顏色、形狀等能夠有更好、更快的認識,經過可視化之后的數據能夠加深人類對于數據的理解和記憶。
隨著互聯網的廣泛應用,我們的工作和生活等各個方面,每時每刻都在產生大量的數據。數據可視化作為一種有效傳遞信息的手段,被越來越廣泛地應用到很多領域,但在任何數據都要可視化的時代,還是有一部分人不明白為什么要數據可視化,數據可視化和直接的數據有什么不同嗎,這就是數據可視化意義所在了。
2、為什么要進行數據可視化?
從前文我們知道數據可視化就是指用圖形的方式來展現數據,從而更加清晰有效地傳遞信息,數據可視化的意義也就體現在清晰、高效和幫助決策。
首先我們來看清晰,有研究表明,幫助人們應對信息過載最基本的方法之一就是將其可視化。用外行的話來說,這意味著把數據畫成圖形,甚至用數據來創建交互式的圖表。現代互聯網時代的來臨,使得數據越來越多,我們生活的無時不刻都在產生數據,就像天貓“雙十一”的成交量、成交額等數據都是數據表格表示,一定會看的眼花繚亂,這也讓人很難繼續看下去。所以數據可視化能將不可見的數據現象轉化為可見、的圖形符號,能將錯綜復雜﹑看起來沒法解釋和關聯的數據建立起聯系和關聯、發現規律和特征,從而更加清晰地表達和反映數據中蘊含的信息。
復雜Excel表格
其次是高效,信息傳遞領域有句真理,“字不如表,表不如圖”。人類右腦處理圖像速度比左腦抽象處理文字速度快100萬倍,可視化的傳遞可以讓受眾更快理解、更深記憶信息。這樣,幫受眾或者領導快速抓住問題節省時間,或者讓受眾或者領導對自身業務成績產生深刻印象。所以,做數據可視化最核心的目的是高效傳遞信息,即“一屏一眼”, 例如天貓的雙Ⅱ數據大屏實況直播。所以高效傳遞信息也是數據可視化的重要意義。
最后是幫助決策,數據可視化能夠通過最合理的圖表,根據比較關系、數據維數﹑數據多少選擇。一份報告中的
數據可視化部分很少能夠一個圖表就夠用,通常需要多個指標或者同一指標的不同維度相互配合佐征分析結論。當數據變成圖表,很多原有的不明顯的關系變得明顯、有聯系,有經驗的工作人員能夠通過這些邏輯關系做出分析和決策。成功的可視化,可能表面表面簡單卻富含深意,可以讓觀察者一眼就能洞察事實并產生新的理解。管理者能夠沿著你規劃的可視化路徑、能夠迅速地找到和發現、決策之道。
二、精美的可視化圖表有哪些表現形式?
數據可視化這個詞的火熱讓很多人忽略了數據可視化中的圖表同樣也有要求。美觀、簡潔明了等等都是數據可視化圖表的要求,那接下來我們來看看精美的
數據可視化表格有哪些表現形式。
1、基礎圖表
(1)折線圖
折線圖非常方便來體現事物隨時間或其他有序類別而變化的趨勢。
不僅可分析多組數據隨時間變化的相互作用和相互影響,從而可以總結獲得一些結論和經驗,還可對比多組數據在同一個時間的大小。
(2)條形圖
條形圖使用垂直柱子顯示類別之間的數值比較。其中條形圖的一個軸顯示正在比較的類別,而另一個軸代表對應的刻度值。
(3)餅圖
餅圖 一般通過顏色區分類別,幅度的大小對比數據,并且可以展示各類別與整體之間的占比關系。
(4)散點圖
散點圖可以顯示數據集群的形狀,分析數據的分布。通過觀察散點的分布,可以推斷變量的相關性。
2、進階圖表
以上四種就是可視化圖表中的四種基本圖表,而進階圖表也有一部分是由它們變換而來。
( 1)玫瑰圖
玫瑰圖適合用于對比各類別的數據,而相比柱圖/條形圖等圖表類型來說,南丁格爾玫瑰圖能夠放大數據差異。因為它使用扇區半徑來表示數據的大小,半徑和面積的關系是平方的關系,用戶直覺上會通過面積來感知差異,所以它會將數據的比例大小夸大。
(2)氣泡圖
氣泡圖可以用于展示三個度量之間的相關關系,或者同時呈現三維數據。
(3)和弦圖
和弦圖可以清晰的看到數據之間的關系,連接兩個數據點的弧線可以根據顏色、粗細以及和圓周的接觸面積來表達不同的數值。所以和弦圖適合展現大量的復雜的數據關系。
(4)詞云圖
詞云圖的視覺沖擊力比較強,迎合著現在快節奏的生活,讓人一眼就看出這是主題,而不是像以前一樣要看密密麻麻的文字報告,簡單快捷。
(5)K線圖
K線圖又叫蠟燭圖,主要應用于股市,也是反映股票走勢的利器。
(6)帕累托圖
帕累托圖,也叫排列圖/帕拉圖/主次圖,是一種將出現的質量問題和質量改進項目按照重要程度依次排列而采用的圖表。當我們的帕累托圖完成時,便可輔助我們直觀的找到造成問題的主要原因,進而針對問題實施對策,最終達到改善的效果。
以上就是列舉的一些基本和進階的可視化圖表(并不是全部),那么圖表該如何選擇和設計呢,也是值得思考的問題。
(部分內容來源網絡,如有侵權請聯系刪除)