發(fā)布時(shí)間:2022-02-22 14:54:59來(lái)源:勵(lì)普教育綜合
大數(shù)據(jù)的概念與特征你知道嗎?隨著互聯(lián)網(wǎng)的飛速發(fā)展,特別是近年來(lái)隨著社交網(wǎng)絡(luò)、物聯(lián)網(wǎng)、云計(jì)算以及多種傳感器的廣泛應(yīng)用,以數(shù)量龐大,種類眾多,時(shí)效性強(qiáng)為特征的非結(jié)構(gòu)化數(shù)據(jù)不斷涌現(xiàn),數(shù)據(jù)的重要性愈發(fā)凸顯,傳統(tǒng)的數(shù)據(jù)存儲(chǔ)、分析技術(shù)難以實(shí)時(shí)處理大量的非結(jié)構(gòu)化信息,大數(shù)據(jù)的概念應(yīng)運(yùn)而生。
大數(shù)據(jù)的概念與特點(diǎn):
大數(shù)據(jù)是一個(gè)較為抽象的概念,正如信息學(xué)領(lǐng)域大多數(shù)新興概念,大數(shù)據(jù)至今尚無(wú)確切、統(tǒng)一的定義。在維基百科中關(guān)于大數(shù)據(jù)的定義為:大數(shù)據(jù)是指利用常用軟件工具來(lái)獲取、管理和處理數(shù)據(jù)所耗時(shí)間超過(guò)可容忍時(shí)間的數(shù)據(jù)集。
IDC在對(duì)大數(shù)據(jù)作出的定義為:
大數(shù)據(jù)一般會(huì)涉及2種或2種以上數(shù)據(jù)形式。它要收集超過(guò)100TB的數(shù)據(jù),并且是高速、實(shí)時(shí)數(shù)據(jù)流;或者是從小數(shù)據(jù)開(kāi)始,但數(shù)據(jù)每年會(huì)增長(zhǎng)60%以上。這個(gè)定義給出了量化標(biāo)準(zhǔn),但只強(qiáng)調(diào)數(shù)據(jù)量大,種類多,增長(zhǎng)快等數(shù)據(jù)本身的特征。研究機(jī)構(gòu)Gartner給出了這樣的定義:大數(shù)據(jù)是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。這也是一個(gè)描述性的定義,在對(duì)數(shù)據(jù)描述的基礎(chǔ)上加入了處理此類數(shù)據(jù)的一些特征,用這些特征來(lái)描述大數(shù)據(jù)。
大數(shù)據(jù)有四個(gè)基本特征:
數(shù)據(jù)規(guī)模大( Volume) ,數(shù)據(jù)種類多( Variety) ,數(shù)據(jù)要求處理速度快( Velocity) ,數(shù)據(jù)價(jià)值密度低( Value),即所謂的四V特性。
這些特性使得大數(shù)據(jù)區(qū)別于傳統(tǒng)的數(shù)據(jù)概念。大數(shù)據(jù)的概念與“海量數(shù)據(jù)”不同,后者只強(qiáng)調(diào)數(shù)據(jù)的量,而大數(shù)據(jù)不僅用來(lái)描述大量的數(shù)據(jù),還更進(jìn)一步指出數(shù)據(jù)的復(fù)雜形式、數(shù)據(jù)的時(shí)間特性以及對(duì)數(shù)據(jù)的分析、處理等專業(yè)化處理,較終獲得有價(jià)值信息的能力。
(一)數(shù)據(jù)量大
大數(shù)據(jù)聚合在一起的數(shù)據(jù)量是非常大的,根據(jù)IDC的定義至少要有超過(guò)100TB的可供分析的數(shù)據(jù),數(shù)據(jù)量大是大數(shù)據(jù)的基本屬性。導(dǎo)致數(shù)據(jù)規(guī)模激增的原因有很多,首先是隨著互聯(lián)網(wǎng)絡(luò)的廣泛應(yīng)用,使用網(wǎng)絡(luò)的人、企業(yè)、機(jī)構(gòu)增多,數(shù)據(jù)獲取、分享變得相對(duì)容易,以前,只有少量的機(jī)構(gòu)可以通過(guò)調(diào)查、取樣的方法獲取數(shù)據(jù),同時(shí)發(fā)布數(shù)據(jù)的機(jī)構(gòu)也很有限,人們難以短期內(nèi)獲取大量的數(shù)據(jù),而現(xiàn)在用戶可以通過(guò)網(wǎng)絡(luò)非常方便的獲取數(shù)據(jù),同時(shí)用戶在有意的分享和無(wú)意的點(diǎn)擊、瀏覽都可以的提供大量數(shù)據(jù);其次是隨著各種傳感器數(shù)據(jù)獲取能力的大幅提高,使得人們獲取的數(shù)據(jù)越來(lái)越接近原始事物本身,描述同一事物的數(shù)據(jù)量激增。
(二)數(shù)據(jù)類型多樣
數(shù)據(jù)類型繁多,復(fù)雜多變是大數(shù)據(jù)的重要特性。以往的數(shù)據(jù)盡管數(shù)量龐大,但通常是事先定義好的結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)是將事物向便于人類和計(jì)算機(jī)存儲(chǔ)、處理、查詢的方向抽象的結(jié)果,結(jié)構(gòu)化在抽象的過(guò)程中,忽略一些在特定的應(yīng)用下可以不考慮的細(xì)節(jié),抽取了有用的信息。
(三)數(shù)據(jù)處理速度快
要求數(shù)據(jù)的處理,是大數(shù)據(jù)區(qū)別于傳統(tǒng)海量數(shù)據(jù)處理的重要特性之一。隨著各種傳感器和互聯(lián)網(wǎng)絡(luò)等信息獲取、傳播技術(shù)的飛速發(fā)展普及,數(shù)據(jù)的產(chǎn)生、發(fā)布越來(lái)越容易,產(chǎn)生數(shù)據(jù)的途徑增多,個(gè)人甚至成為了數(shù)據(jù)產(chǎn)生的主體之一,數(shù)據(jù)呈爆炸的形式增長(zhǎng),新數(shù)據(jù)不斷涌現(xiàn),增長(zhǎng)的數(shù)據(jù)量要求數(shù)據(jù)處理的速度也要相應(yīng)的提升,才能使得大量的數(shù)據(jù)得到有效的利用,否則不斷激增的數(shù)據(jù)不但不能為解決問(wèn)題帶來(lái)優(yōu)勢(shì),反而成了解決問(wèn)題的負(fù)擔(dān)。
更多培訓(xùn)課程: 鄭州大數(shù)據(jù) 更多學(xué)校信息: 鄭州中原區(qū)達(dá)內(nèi)IT培訓(xùn)機(jī)構(gòu) 咨詢電話:
雅思 托福 GRE 托業(yè) SAT GMAT A-Level ACT 多鄰國(guó)英語(yǔ)測(cè)試 OSSD 英語(yǔ)四六級(jí) 詞匯 職稱英語(yǔ) 英語(yǔ)口語(yǔ) 商務(wù)英語(yǔ) 考研英語(yǔ) 青少兒英語(yǔ) 成人英語(yǔ) 個(gè)人提升英語(yǔ) 少兒英語(yǔ) 初高中英語(yǔ) 劍橋英語(yǔ) 一級(jí)建造師 二級(jí)建造師 消防工程師 消防設(shè)施操作員 BIM 造價(jià)工程師 環(huán)評(píng)師 監(jiān)理工程師 咨詢工程師 安全工程師 建筑八大員 注冊(cè)電氣工程師 一級(jí)注冊(cè)建筑師 公路水運(yùn)檢測(cè) 通信工程 裝配式工程師 二級(jí)注冊(cè)建筑師 智慧消防工程師 智慧建造工程師 全過(guò)程工程咨詢師 EPC工程總承包 碳排放管理師 初級(jí)會(huì)計(jì)師 中級(jí)會(huì)計(jì)師 注冊(cè)會(huì)計(jì)師(cpa) CFA ACCA CMA 基金從業(yè) 證券從業(yè) 會(huì)計(jì)證 初中級(jí)經(jīng)濟(jì)師 薪稅師 企業(yè)合規(guī)師 會(huì)計(jì)就業(yè) 教師資格 人力資源管理 導(dǎo)游考試 心理咨詢師 健康管理師 家庭教育指導(dǎo)師 普通話 營(yíng)養(yǎng)師 物流師 網(wǎng)絡(luò)主播 專利代理師 教師招聘 少兒編程 書(shū)法培訓(xùn) 國(guó)學(xué)啟蒙 繪畫(huà)美術(shù) 音樂(lè) 舞蹈 棋類 國(guó)畫(huà) 樂(lè)器 機(jī)器人編程 小孩子注意力訓(xùn)練 兒童專注力 兒童情緒管理 少兒小主播 信奧賽C++