大數(shù)據(jù)的含義是什么?
大數(shù)據(jù)指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。
大數(shù)據(jù)具有“4v”特性:
1.數(shù)據(jù)量大(volume):大數(shù)據(jù)的起始計量單位是pb(1024tb)、eb(1024pb,約100萬tb)或zb(1024eb,約10億tb),未來甚至會達到y(tǒng)b(1024zb)或bb(1024yb)。
2.數(shù)據(jù)多樣性(variety):大數(shù)據(jù)類型繁多,包括網(wǎng)絡日志、音頻、視頻、圖片、地理位置等各種結構化、半結構化和非結構化的數(shù)據(jù)。結構化數(shù)據(jù)是指存儲在數(shù)據(jù)庫里,可以用二維表結構實現(xiàn)表達的數(shù)據(jù);非結構化數(shù)據(jù)是指數(shù)據(jù)結構不規(guī)則或不完整,沒有預定義的數(shù)據(jù),包括所有格式的辦公文檔、文本、圖片、報表、圖像、音頻信息、視頻信息等;半結構化數(shù)據(jù)是介于完全結構化數(shù)據(jù)和完全非結構化數(shù)據(jù)之間的數(shù)據(jù),具有一定的結構性,例如員工簡歷,有的簡歷只有教育情況,有的簡歷包括教育、婚姻、戶籍、出入境等很多信息。
3.價值密度低(value):大數(shù)據(jù)價值密度的高低與數(shù)據(jù)總量的大小成反比。以視頻為例,在連續(xù)不間斷的監(jiān)控中,有用數(shù)據(jù)可能僅有一兩秒。原始零散、復雜多樣,甚至可能有數(shù)據(jù)噪聲和污染的數(shù)據(jù)需要經(jīng)歷價值“提純”才能得出信息、獲取知識。
4.數(shù)據(jù)的產(chǎn)生和處理速度快(velocity):大數(shù)據(jù)的智能化和實時性要求越來越高,對處理速度也有極嚴格的要求,一般要在秒級時間范圍內(nèi)給出分析結果,超出這個時間數(shù)據(jù)就可能失去價值,即大數(shù)據(jù)的處理要符合“1秒定律”。
全資子公司具有哪些優(yōu)缺點?驗資賬戶開戶需要提供哪些資料10%征收企業(yè)所得稅的條件法人股東和自然人股東的區(qū)別是什么上海貿(mào)易公司營業(yè)執(zhí)照怎么辦理臨港注冊公司需要注意哪些問題什么是直接融資,有哪些種類公司注冊虛擬地址費用是多少