時間:2021-02-03來源:瀏覽數:290次
本文主要從Excel,sql還有Python三個數據分析神器來看看我們是如何從入門到精通數據分析。
Excel
貌似自己沒有專門讀一本Excel書籍, 都是遇到問題網上查詢。 如果不是特別充足的時間,也不建議買一厚本書啃,除非這本書你能花1-2天讀完,而且干貨較多我暫時整理下數據分析師常用的一部分功能,以后遇到新的需求你再google即可,舉例:我用的是Linux系統,不能安裝MS Office,所以暫時用WPS Office代替,大同小異, 實際上我最近兩年很少用Windows了。
SQL 學習SQL,先需要熟練語法,但是想要真正精通sql,還是需要大量的實踐 書籍:《Mysql數據庫從入門到精通》,粗粗看過這本,對數據分析師來說,可能僅小部分會用上,畢竟講得是Mysql所有的操作包括權限控制,事務處理,這些一般后端開發或者DBA才會用到,所以感覺也可以不讀 針對小白同學,這里重點說明下: sql是一種語言, 它用來和數據庫進行交互,進行操作數據的增刪改查,而數據庫是有多種的,比如mysql, oracle, sql server, hive等,每種數據庫適配的sql語言基本相同,所以在學習的時候,選擇其中一種數據庫進行操作學習即可,mysql是目前也是互聯網采用最廣泛的數據庫,oracle/sql server銀行等傳統企業用的比較多,而hive是集成在分布式文件系統hadoop之上的數據庫,俗稱"大數據",主要用來存儲用戶訪問的行為日志。我們學習sql這個語言語法的話,選擇mysql進行學習即可,其他大同小異。 Python Python語言語法的入門, 選擇經典, 通俗易懂,對于數據分析師,尤其是剛入門的小白,只讀到該教程的"面向對象高級編程"以前即可 Python數據分析第三方 數據分析: pandas, numpy 繪圖包: matplotlib, seaborn 機器學習: sklearn, tensorflow等 書籍:《利用Python進行數據分析》, 主要介紹如何用pandas進行數據分析,也會講到numpy,以及matplotlib和pandas繪圖, 這本書確實寫的很好,但是小白上來閱讀可能會一頭水霧,所以可以退而求其次,10 Mintutes to pandas, 當然這個10分鐘是搞不定的哈, 不過常用的pandas在里面,另外panda要精通也需要大量的練習,遇到問題google或者pandas官網文檔查詢即可,注意這些文檔不需要一頁頁閱讀,用到那個學習那個就中 《集體智慧編程》,講了經典的數據挖掘算法,Python代碼,我是剛入門的時候讀過,這本書適合有一定Python基礎的同學閱讀,可能剛入門的同學,還是聚焦于pandas的熟練使用會比較好,以后入行后有空再讀,現在信息大爆炸,即使是好東西,我們也要選擇性的獲取,珍惜自己的時間 《機器學習》周志華, 這本太經典了,我看了2遍,雖然并沒有進行公式推導,但也收獲蠻大,有空會再讀。這本書入門同學尤其是偏業務而非技術的分析師可以不用太著急讀,開始的精力先聚焦到數據思維,業務,excel,sql, 如果有富余精力,再學習python,一步一步來哈發布時間:2023-09-26瀏覽量:79次
發布時間:2022-06-28瀏覽量:970次
發布時間:2022-06-15瀏覽量:263次
發布時間:2022-06-14瀏覽量:544次
發布時間:2022-06-14瀏覽量:755次