億信華辰
時(shí)間:2020-06-16來(lái)源:lk瀏覽數(shù):298次
在當(dāng)今的大數(shù)據(jù)時(shí)代,不僅IT行業(yè)的人們需要了解與大數(shù)據(jù)相關(guān)的知識(shí),而且傳統(tǒng)行業(yè)的從業(yè)者和普通大學(xué)生也應(yīng)了解某些大數(shù)據(jù)知識(shí)。新的基礎(chǔ)架構(gòu)計(jì)劃未來(lái),大數(shù)據(jù)技術(shù)將開(kāi)始得到全面應(yīng)用,大數(shù)據(jù)還將重塑整個(gè)產(chǎn)業(yè)結(jié)構(gòu)。
要理解大數(shù)據(jù),我們必須首先從大數(shù)據(jù)的概念開(kāi)始。與人工智能的概念不同,大數(shù)據(jù)的概念相對(duì)清晰,大數(shù)據(jù)的技術(shù)體系也已經(jīng)成熟。為了解釋大數(shù)據(jù)的概念,您可以從數(shù)據(jù)本身的特征開(kāi)始,然后從方案,應(yīng)用和行業(yè)逐步擴(kuò)展。
大數(shù)據(jù)本身的特點(diǎn)通常集中在五個(gè)方面,即數(shù)據(jù)量,數(shù)據(jù)結(jié)構(gòu)多樣性,數(shù)據(jù)價(jià)值密度,數(shù)據(jù)增長(zhǎng)速度和可信度對(duì)這五個(gè)維度的理解和認(rèn)識(shí)是理解大數(shù)據(jù)概念的關(guān)鍵。當(dāng)然,隨著大數(shù)據(jù)技術(shù)的發(fā)展及其在行業(yè)中的應(yīng)用,數(shù)據(jù)本身的規(guī)模也在一定程度上得到了擴(kuò)展,而這些擴(kuò)展本身也是對(duì)大數(shù)據(jù)概念的一種豐富和改進(jìn)。而大數(shù)據(jù)分析的特點(diǎn)和以上五個(gè)方面也是密不可分的。
數(shù)據(jù)量本身就是聚合的概念。不是數(shù)據(jù)量大的數(shù)據(jù)被稱為大數(shù)據(jù),傳統(tǒng)信息系統(tǒng)生成的“小數(shù)據(jù)”也是大數(shù)據(jù)分析的重要組成部分,這點(diǎn)必須清楚。當(dāng)前,從大數(shù)據(jù)的數(shù)據(jù)源的角度來(lái)看,它主要集中在互聯(lián)網(wǎng),物聯(lián)網(wǎng)和傳統(tǒng)信息系統(tǒng)三個(gè)渠道。當(dāng)前物聯(lián)網(wǎng)數(shù)據(jù)的比例相對(duì)較大。相信在5G時(shí)代,物聯(lián)網(wǎng)仍將是大數(shù)據(jù)的主要數(shù)據(jù)源。
與創(chuàng)新信息系統(tǒng)(ERP)中的數(shù)據(jù)不同,大數(shù)據(jù)的數(shù)據(jù)類型非常復(fù)雜,包括結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),這對(duì)傳統(tǒng)數(shù)據(jù)分析技術(shù)提出了巨大挑戰(zhàn),這也是大數(shù)據(jù)技術(shù)興起的重要原因。在工業(yè)互聯(lián)網(wǎng)時(shí)代,大數(shù)據(jù)數(shù)據(jù)結(jié)構(gòu)的多樣性將得到進(jìn)一步體現(xiàn),這也給數(shù)據(jù)價(jià)值過(guò)程帶來(lái)了新的挑戰(zhàn)。
與傳統(tǒng)信息系統(tǒng)相比,大數(shù)據(jù)中的數(shù)據(jù)價(jià)值密度相對(duì)較低,這就需要更快,更方便的方式來(lái)完成數(shù)據(jù)值提取過(guò)程,這也是當(dāng)前大數(shù)據(jù)平臺(tái)所關(guān)注的核心競(jìng)爭(zhēng)力之一。實(shí)際上,早期Hadoop和Spark平臺(tái)之所以能夠脫穎而出的重要原因是它們的數(shù)據(jù)處理(排序)速度相對(duì)較快。
通常傳統(tǒng)信息系統(tǒng)的數(shù)據(jù)增量是可以預(yù)測(cè)的,或者增長(zhǎng)率是可控的,但是在大數(shù)據(jù)時(shí)代,數(shù)據(jù)增長(zhǎng)率已經(jīng)大大超過(guò)了傳統(tǒng)數(shù)據(jù),處理能力已經(jīng)超過(guò)自身的極限。數(shù)據(jù)增長(zhǎng)是一個(gè)相對(duì)的概念。與消費(fèi)互聯(lián)網(wǎng)相比,工業(yè)互聯(lián)網(wǎng)帶來(lái)的數(shù)據(jù)增長(zhǎng)可能更加客觀,因此工業(yè)互聯(lián)網(wǎng)時(shí)代將進(jìn)一步打開(kāi)大數(shù)據(jù)的價(jià)值空間。
大數(shù)據(jù)時(shí)代帶來(lái)的一個(gè)重要副作用是,很難區(qū)分真假數(shù)據(jù),這也是當(dāng)前大數(shù)據(jù)技術(shù)必須重點(diǎn)解決的問(wèn)題之一。從當(dāng)前大型Internet平臺(tái)采用的方法來(lái)看,它通常是技術(shù)和管理的結(jié)合。例如,通過(guò)對(duì)用戶進(jìn)行身份驗(yàn)證,可以解決某些數(shù)據(jù)的真實(shí)性(專業(yè)性)問(wèn)題。
億信華辰大數(shù)據(jù)分析平臺(tái)表明,數(shù)據(jù)價(jià)值密度通常是衡量數(shù)據(jù)價(jià)值的重要基礎(chǔ)。與傳統(tǒng)信息系統(tǒng)相比,大數(shù)據(jù)中的數(shù)據(jù)值密度較低,需要更快,更方便。完成數(shù)據(jù)的價(jià)值提取過(guò)程,這也是當(dāng)前大數(shù)據(jù)平臺(tái)的核心功能之一。
發(fā)布時(shí)間:2023-09-26瀏覽量:79次
發(fā)布時(shí)間:2022-06-28瀏覽量:970次
發(fā)布時(shí)間:2022-06-15瀏覽量:263次
發(fā)布時(shí)間:2022-06-14瀏覽量:544次
發(fā)布時(shí)間:2022-06-14瀏覽量:755次
400咨詢:4000011866
手機(jī)咨詢:137-0121-6791
技術(shù)支持QQ:400-0011-866
(工作日9:00-18:00)
產(chǎn)品建議郵箱
yixin@esensoft.com