婷婷色婷婷开心五月四房播播-久久精品国产亚洲av蜜臀-亚洲熟女乱色一区二区三区-18禁裸男晨勃露j毛免费观看

億信華辰

連續3年穩坐商務智能應用榜首
與此同時,億信華辰在數據治理領域榮登五強
首頁行業資訊數據分析

為什么要學習數據分析?數據分析產出是什么?

時間:2022-06-28來源:互聯網瀏覽數:965

「過去」以往在增量時代,每天都有新的領域、新的市場被開發。尤其是在互聯網、電商等領域的紅利期,似乎只要做好單點的突破就能獲得市場。這個蠻荒時代,業務運營主要依靠是經驗和直覺驅動。比如跨境電商領域初期,憑借世界工廠平臺的優勢,國內廠家似乎只需基于經驗選品即可大賣。 「現在」但是隨著規則的成熟,更多玩家的進入,市場從藍海變為紅海,進入到存量期,僅靠經驗驅動的增長模式不再有效。還是拿跨境電商舉例,由于賣家的劇增,海外市場的飽和,跨境電商就進入存量運營時代,已經不存在絕對的藍海市場,每個細分領域都有許多競爭對手。此時,要求商家從粗放運營轉為精細化運營,也就是用數據分析報告決定市場是否值得投入,用數據選品,用數據做經營分析,用數據庫存管理。 當然,不是說純定量的數據分析決定了一切,經驗就不重要了。而是說在決策的過程中,數據結論占據的比例與以往相比更大,同時業務經驗也是必不可少的部分。 「未來」互聯網逐漸成為“傳統行業”的未來,人工智能、元宇宙等由數據驅動的行業越來越依賴數據分析。 還有眾多制造業亟待數字化轉型,以期在全球供應鏈中提高制造環節的附加值。也就是說,在未來,數據驅動業務將更頻繁。 數據分析的底層邏輯 數據分析的本質是「沙盤演練」:戰場上,指揮員們在指揮部的地形模型前「推演」敵我雙方的趨勢確定作戰方案;商場上,管理層通過數據間的運算關系「推斷」運營的發展進而做決策。 基于這樣的定義可以知道數據分析的目的是為了做對當下運營發展有利的決策,那它是如何做到的呢?為了解答這個問題,可以從前面的定義中引申出幾個關鍵概念:數據,運算關系,推斷,決策。 什么是數據? 最通用的理解,數據是被存儲起來的信息。從應用的角度,數據是把事物做量化處理的工具,萬物皆可數據化:數值數字是數據,文本、圖像、視頻等同樣都是數據。 按字段類型劃分,可以把數據分為: 文本類:常用于描述性字段,如姓名、地址、備注等 數值類:最為常見,用于描述量化屬性,如成交金額、商品數量等 時間類:僅用于描述時間發生的時間,是重要的分析維度(如同比、環比、累計等) 按結構劃分,可以把數據分為: 結構化數據:通常指關系數據庫方式記錄的數據 半結構化數據:如日志、網頁數據 非結構化數據:指語音、圖片、視頻等形式的數據  根據數據連續的屬性不同,還可以分為: 連續型數據:在任意區間可以無限取值,比如年齡、身高 離散型數據:常見的分類數據,比如性別、年級 數據間的「運算關系」 孤立的數據往往沒有參考價值,比如量化一個人,身高是180cm,并不能意味什么。比如網易云音樂的用戶,每個用戶的年齡是數據,對使用產品的人群年齡進行分段比如18-24歲,該年齡段人數占比的指標對網易云音樂來說才有價值。從數據到指標的計算過程,就是數據間的「運算關系」,也叫「指標」。 指標的作用在于「度量」業務的發展: 比如用戶指標,度量用戶業務的發展,用戶數 比如產品指標,度量產品業務的發展, 比如經營指標,度量業務的發展,銷售額、毛利率、ROI等 這些指標(點)通過一定的結構可以編織而成指標體系(線、面)衡量局部、甚至是全局的業務。 「推斷」業務的發展 「沙盤演練」中,指揮員通過軍事沙盤上的地形,及敵我雙方的工事、兵力部署、火器配置等情況,分析敵情,制定作戰方案。數據把現實中的運營抽象到數字世界中,通過指標體系,應用各種分析方法(業務分析、產品分析、用戶分析、經營分析......),幫助經營做決策。 如何做決策? 趙括熟讀兵書,卻不能活用,淪為紙上談兵的笑話。所以獲得分析能力后,不能照本宣科,要結合實際業務場景做決策。 數據分析落地涉及流程創新、變革管理,用新的思維解決業務問題。 但這個過程并不是強迫變革,需要借助對業務的理解及軟性的能力來使分析平滑落地。 如何開始? 站在“前人”的肩膀上,可以走得更遠。餅干哥哥根據多年數據分析工作經驗沉淀出了數據分析師能力模型,跟著它“按圖索驥”,補充自身缺失的能力,最終形成獨立、落地的數據分析能力。 數據分析師能力模型 完整的數據分析師能力體系應該包括底層認知、業務場景及能力三板斧。 底層認知 在建立數據分析思維之前,應該先在底層認知達成共識。什么是認知?是對事物底層邏輯的了解,是對世界萬物的判斷,認知的本質就是做決定。 也就是說,為了幫助數據分析中每個決策的有效性(選擇什么指標、分析方法?接下來做什么?等等),需要先建立底層認知。 這一步,我們需要去明確數據分析的定義:數據分析是什么?目的/產出?分析流程? 數據分析是什么 同學們在求職過程中會發現,同樣是數據分析師崗位,但是面試的內容千差萬別,有考察機器學習、統計學等專業能力的,也有考察市場/行業分析的,還有考察產品分析的。此時就有同學問,這些真的是數據分析該做的嗎? 我們從字面上拆解,數據分析 = 數據×分析,進一步拆: 數據能力 = 統計學 ∪ 機器學習 ∪ 建模能力 ∪ 工具使用 ∪ ... 分析能力 = 經營分析 ∪ 用戶分析 ∪ 產品分析 ∪ ... 這就是認知上的偏差:當一些同學認為數據分析就是用Excel做表、python寫腳本、機器學習建模時(其實這些只是組成數據分析能力的一部分),求職市場對數據分析師的要求更為完整。 回過頭來看,數據分析到底是什么?筆者認為,數據分析是一個過程,是利用數據能力做分析的過程:從發現問題、分析原因,到落地建議;這還是一個“解構”的過程:從整體拆到局部,從一般到特殊,從面到線到點,不斷下鉆剖析,找到具體可落地的點。 數據分析產出是什么? 了解完什么是數據分析后,深入思考一個問題:這個過程的最終產出的交付物是什么? 要回答這個問題,我們需要回到數據分析的本質:解決業務問題。 也就是回到業務層面的需求是什么,才能決定最后落地交付物: 1. 解決問題 最常見的數據分析場景,就是業務發現銷售額下降、用戶流失、產品跳失率高,也就是業務層面出現了一個問題待解決,此時需要數據分析師介入幫助從數據層面挖掘原因、給出解決建議。 分析過程可能是做一些探索性數據分析、統計分析、機器學習建模,甚至是做AB測試實驗,最終交付分析報告,或者模型部署上線。 2. 理解現象 有時業務可能并不存在確切的“問題”,更多旨在通過加深對現有場景的理解,來提高現有業務模型、策略的效果;比如,現在業務使用的是客單價平均值將客戶分為高、低兩個人群進行營銷,此時數據分析師通過對消費者的洞察分析,給予更精準的人群劃分方案:利用客單價分位數,將客戶分為三個人群,這樣業務利用更新后的策略進行營銷設計,提高轉化效果。 分析過程可能是做相關分析、回歸分析,甚至是無監督的聚類,來對現狀進行解釋。 3. 支持診斷 按照需求的時效性,可以把業務需求分為臨時需求和常規需求,而前面兩者屬于業務的臨時需求,或者說是專項分析需求。對于常規需求,主要旨在提高業務流程的效率,比如對于電商運營中的商品庫存管理業務,運營需要及時查詢庫存情況,并結合銷售趨勢對低庫存量的商品進行補單;此時,數據分析師可以通過交付“低庫存預警報表”來幫助優化該流程效率。 支持診斷的內容主要集中在自動化的報表,甚至是商業智能(BI)體系的搭建。 4. 探索發現 如果說前面是基于已知模式的分析,那么業務中還存在一種需求,就是對未知的探索。最為典型的場景則是對市場、對消費者的洞察后,給出品牌及業務增長的策略。 分析過程更多是基于行業、基于市場,使用如PEST、SWOT、波特五力等商業分析模型。 分析生命周期 至此,我們知道了數據分析是什么,以及最終的產出交付物,那這個過程如何實現的呢?從落地的角度來看,數據分析是一個從發散到收斂的過程:業務理解-數據探索-分析模型-落地交付-產品生命周期 業務理解 數據分析是從業務到數據再回到業務的過程,所以理解業務是數據分析的起點。 1. 業務場景 “無場景不分析”、“脫離業務場景的分析都是耍流氓”等資深數據分析師的建議無不說明業務場景的重要性。數據分析能力模型中的業務場景模型:用戶-產品-場景,就是為了幫助讀者理解業務場景而設計的,在這里不贅述。 2. 問題定義 不知道讀者有沒這樣的體驗?就是領導交代任務給你,或者是朋友有求于你時,執行力強的人很快就完成了任務請求,但是最后卻被告知這結果并不是對方想要的?這種情況很常發生在初入數據分析崗位的新同學身上,原因歸根結底就是沒有做好問題定義! 在理解了需求所處的業務場景后,可以借助邏輯樹工具來對問題進行拆解,拆解的過程盡量要遵循MECE、“相互獨立,完全窮盡”的金字塔原理。 3. 預期價值 其實,很多企業都在討論數據分析師的價值在哪?從這一現象可以看出數據分析師需要時刻關注價值產出,圍繞價值的開展工作。 如果說前面定義問題是明確做什么,那在這一步就是要明確做到什么程度? 比如面對銷售額下降的問題,做數據分析,最終是產出一份數據分析報告就好了,還是說需要介入到測試實驗,給出增長策略?如果是后者,那對銷售額的提升幅度要提升多少才有價值?是不痛不癢的1%還是要達到顯著的10%? 如果不在價值層面做思考,并付諸價值落地的行動,最后很容易產生“價值在哪”的靈魂拷問,面臨被優化的風險。 數據探索 在業務理解階段,我們是站在業務層面與需求方溝通,但是數據分析的核心部分都是在數據層面進行的。所以在正式開始分析之前,我們需要把業務需求轉成數據需求,這個過程就是數據探索。 1. 數據初探與探索性驗證 拿到業務需求時的定義問題階段,需要數據的輔助:用數據透視業務,判斷現狀與描述是否一致。比如,業務說銷售額下降了需要分析,但是這個下降是和誰比?環比下降但是同比提升,同比下降,但是和競品相比是提升的。 這個步驟比較多的是使用探索性數據分析(Exploratory data analysis),或者說通過常見的統計指標來對數據現狀進行剖析。 2. 數據需求 如果說第一步是在用數據驗證需求的有效性,那這一步則是真正把業務問題轉為數據需求。 此外,還需要判斷數據質量及能做的特征工程,比如某些字段缺失率太高,這會影響特征的構建。 分析模型 了解業務、明確數據需求后,就可以挑選合適的武器(分析方法、模型框架)上陣。 概括來說,有四種分析方法: 1. 比較分析 指標的好壞、特征是否顯著等都可以通過比較分析的方法來實現,比如常見的歸因業務場景,本質就是做比較,通過橫向、縱向的比較找出原因。 分析方法:比如T檢驗、方差分析、同比環比、同期群分析等 2. 相關分析 分析變量之間的相關性是重要的分析場景。比如業務中想知道提高廣告預算是否能、甚至是能提升多少的銷售業績?這樣的相關性分析或許能找到最優投放ROI的配置方案。 分析方法:卡方、皮爾遜(Pearson)相關系數、斯皮爾曼(Spearman)相關系數、結構分析等 3. 預測(有監督) 不論是對企業銷售的預測、還是對用戶行為的預測,都能幫助提升業務效率,比如常見的預測用戶流失分析,及時得到高概率流失的人群名單,運營通過提前營銷干預,提高用戶留存率;常見的銷售預測能幫助企業在供應鏈側做準備。這類場景主要應用的是機器學習中的有監督分類模型。 分析方法:線性/邏輯回歸、決策樹、時間序列分析、貝葉斯等; 4. 發現(無監督) 前面三種都是基于企業已知模式的分析邏輯,還有一種分析方法——無監督的機器學習模型,可以應對未知模式的分析。比如不知道應該把現有人群分成多少個組來進行營銷最合適,就可以對人群基于核心特征做無監督的聚類分析,得出有效分組的界限。 分析方法:Kmeans聚類、DBScan聚類等; 交付落地 交付落地的最佳實踐是讓數據和分析從理論滲透到業務中,對流程進行變革提效。 1. 方案評估 在交付給業務之前,需要先對給出的解決方案做有效性評估: 模型驗證與落地評價 分析如果涉及模型的開發使用,需要通過AB測試,或者ROC等指標來證明模型在數據層面上的有效。在數據層面完成驗證后,回到業務分析需求,評估交付的方案在業務層面上的有效落地。 影響預估 數據分析是圍繞業務價值而展開的,所以在最后的落地,也得就價值進行討論,回答這個方案解決業務問題的途徑和程度: A. 途徑是對流程的優化(降本提效)還是對數據的優化(數據體系效率、數據質量)? B. 這方式能多大程度上幫助解決?比如對業務的提升是10%還是30%?是對單次項目的應用,還是說可以部署到日常流程中,在更長時間、更廣范圍內影響業務? C. 此外,要實現這樣的效果,需要投入的資源是什么 2. 講故事 分析項目的落地需要多方參與,即使是業務能力豐富的分析師,由于流程邊界的存在也不可能每步都參與執行。因此,確保項目能否有效落地的一個重要因素則是能否和業務達成共識。 如何做到?講數據故事:起因(需求定義)、過程(分析邏輯)、結局(重要結論)是否引人入勝(被認可)。 這個過程需要制作PPT向上匯報、與業務溝通,甚至是做跨部門的演講。 3. 模型實施 不論是業務模型還是算法模型,最終都有一個“靴子落地”的過程--落地實施。模型測試有效、與業務達成共識后就到了模型的部署上線階段: 對于業務模型,如RFM,則是部署到業務流程中,應用在會員管理、活動營銷等環節 對于算法模型,如推薦算法,則是部署到產品功能上線,可以以內置算法、REST接口等形式落地 產品生命周期 接在分析生命周期最后的是分析產品的生命周期:以產品的思維看待數據分析,交付至業務落地的模型應用就是產品。數據分析這個過程并不是靜態、單次的,而是一個PDCA不斷迭代升級的過程。(這個分析產品的定義包括分析服務、數據產品。) 1. 流程再造 從產品思維的角度,分析結論落地到業務流程中,對流程進行再造,提高運營效率。 2. 數據產品 當數據分析流程成熟后,大量重復執行的流程可以抽取出來,形成自動化的產品,用于服務數據分析(主要對象為數據分析師,也包括運營),這就是數據產品。分析師的結論模型就可以部署到現有的數據產品中,優化分析效率。 3. 持續改進 之所以要從產品思維的角度來看數據分析過程,是因為要像迭代產品那樣去迭代分析模型:不論是優化算法參數,還是調整分析框架,都能得到更優的結論。 業務場景 在數據分析生命周期第一步的“理解業務”中,我們提到業務場景的重要性。 根據業務經驗,筆者沉淀了一套便于理解的模型:業務場景 = 用戶 × 產品 × 場景 也就是說,要理解業務,就要了解用戶,熟悉產品,明確分析所處的上下文場景。它們決定了分析的目標、處理邏輯以及落地建議。 更詳細的討論見:回歸到營銷理論,談談到底什么是業務場景? 能力三板斧 對數據分析有了底層認知、了解業務場景后,就需要有看得見摸得著的“招式”來行動:思維方法、工具技術和項目能力這三板斧能組成不同招式應對多變的問題。 經常看到有人說數據分析如做飯,如果是這樣的話,在數據分析這個廚房里,工具技術就是鍋鏟、鐵鍋、勺子等器皿,思維方法就是切配、烹飪、打荷等技藝手法,項目能力則是最后的裝盤上菜。 思維方法 很多人學做飯,可能是因為在抖音或B站看到某個美食視頻,然后就開始按照視頻步驟備料烹飪。這個過程,也就是數據分析中學習思維方法的過程。數據分析也是先有思維方法,才能談得上是分析。 剛開始學做飯時,通常先學基礎的煎、炒、炸、烤、煮、蒸、燜、拌烹飪方式。這些基礎的能力在數據分析中就是統計學、相關分析、歸因分析等通用分析思維。 正如美食有八大菜系,分別滿足不同地域人群的口味,數據分析在不同場景下,也有不同的“分析”招式來滿足不同的業務需求: 用戶分析:同期群分析、漏斗分析、RFM用戶分層模型等 產品分析:競品分析、帕累托分析等 商業分析:PEST分析、SWOT分析等 ... 工具技術 習得了做飯的方法后,就可以選擇幾件趁手的器皿,來提高烹飪效率。 之所以不是先選擇器皿再研究做飯流程,是因為工具始終是工具,完成同一個目標或許有多種工具可以實現,再不濟我用原始的土灶也能燒飯。 不過對于部分復雜的烹飪需求,也是需要選擇特定的器皿才能完成。
(部分內容來源網絡,如有侵權請聯系刪除)
立即免費申請產品試用 免費試用
相關文章推薦
相關主題

人工
客服

立即掃碼
享受一對一服務
億信微信二維碼

預約
演示

您好,商務咨詢請聯系

400咨詢:4000011866
咨詢熱線:137-0121-6791

主站蜘蛛池模板: 玩弄白嫩少妇xxxxx性| 国产99在线 | 欧美| 亚洲欧美日韩国产精品一区| 国产精品无码av天天爽| 国产乱了真实在线观看| 国语自产精品视频在线看| 欧洲美熟女乱又伦| 中文午夜人妻无码看片| 亚洲熟妇av一区二区三区浪潮 | 人妻献身系列第54部| 午夜免费国产体验区免费的| 扒开双腿疯狂进出爽爽爽| 中文字幕av无码专区第一页| 亚洲中文久久精品无码| 国产偷窥熟女精品视频大全| 日韩亚洲av无码一区二区不卡| 午夜福利麻豆国产精品| 野外亲子乱子伦视频丶| xxxxxx性受| 亚洲av无码国产一区二区| 色翁荡熄又大又硬又粗又视频| 国产亚洲日韩欧美另类丝瓜app| 国精产品一区二区三区| 99re久久精品国产| 亚洲色欲色欲大片www无码| 老汉色av影院| 男女车车的车车网站w98免费| aⅴ精品无码无卡在线观看| 欧美白人最猛性xxxxx| 小13箩利洗澡无码视频免费网站| 国精品无码一区二区三区左线| 国产亚洲精品美女久久久| 中国老太婆bb无套内射| 国产av国片精品| 国产成人综合亚洲看片| 成人中文乱幕日产无线码| 天天澡天天添天天摸97影院| 一区二区三区av波多野结衣| 日韩精品少妇无码受不了| 超碰97久久国产精品牛牛| 久久人人爽人人爽人人片av超碰|