什么是大數(shù)據(jù)?這是我們認(rèn)識大數(shù)據(jù)、應(yīng)對大數(shù)據(jù)發(fā)展需要回答的首要問題。從一般意義上說,大數(shù)據(jù)是指那些超過傳統(tǒng)數(shù)據(jù)庫系統(tǒng)處理能力的數(shù)據(jù),數(shù)據(jù)量通常在10TB(1TB=1024GB,為1萬億字節(jié))以上。具體來說,大數(shù)據(jù)具有4個基本特征:一是數(shù)據(jù)體量巨大。百度資料表明,其新首頁導(dǎo)航每天需要提供的數(shù)據(jù)超過1.5PB(1PB=1024TB),這些數(shù)據(jù)如果打印出來將超過5千億張A4紙。有資料證實(shí),到目前為止,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量僅為200PB。二是數(shù)據(jù)類型多樣?,F(xiàn)在的數(shù)據(jù)類型不僅是文本形式,更多的是圖片、視頻、音頻、地理位置信息等多類型的數(shù)據(jù),個性化數(shù)據(jù)占絕對多數(shù)。三是處理速度快。數(shù)據(jù)處理遵循“1秒定律”,可從各種類型的數(shù)據(jù)中快速獲得高價值的信息。四是價值密度低。以視頻為例,一小時的視頻,在不間斷的監(jiān)控過程中,可能有用的數(shù)據(jù)僅僅只有一兩秒。
大數(shù)據(jù)時代來啦!
大數(shù)據(jù)是與智能制造、無線網(wǎng)絡(luò)革命并行的又一次顛覆性的技術(shù)變革。其具體內(nèi)容包括:海量數(shù)據(jù)分析技術(shù)、大數(shù)據(jù)處理技術(shù)、分布式計(jì)算技術(shù)、數(shù)據(jù)可視化技術(shù)。其中的分布式計(jì)算技術(shù),也稱云計(jì)算技術(shù),可以同時滿足海量數(shù)據(jù)處理需求,比如1000萬人同時搜索某一數(shù)據(jù),它會將這些數(shù)據(jù)交給分布于全世界的服務(wù)器并通過它們來進(jìn)行處理,結(jié)果與1萬人同時搜索這一數(shù)據(jù)沒什么兩樣。
大數(shù)據(jù)發(fā)展之快,已遠(yuǎn)遠(yuǎn)超出人們的想象。特別值得關(guān)注的是,2012年3月,奧巴馬政府發(fā)布了“大數(shù)據(jù)研究與開發(fā)計(jì)劃”,并宣布先期投資超過2億美元的資金,用于研發(fā)大數(shù)據(jù)關(guān)鍵技術(shù),以搶占數(shù)據(jù)資源開發(fā)利用的制高點(diǎn)。2012年5月,聯(lián)合國“全球脈動”計(jì)劃發(fā)布了《大數(shù)據(jù)開發(fā):機(jī)遇與挑戰(zhàn)》報(bào)告,英國、德國、法國、日本、加拿大等發(fā)達(dá)國家積極響應(yīng)。我國也于2012年10月成立了中國通信學(xué)會大數(shù)據(jù)專家委員會。種種跡象表明,世界各國特別是發(fā)達(dá)國家都把大數(shù)據(jù)的發(fā)展擺到國家戰(zhàn)略層面加以推動,使大數(shù)據(jù)正在成為世界新的戰(zhàn)略資源爭奪的一個新焦點(diǎn)。
對于大數(shù)據(jù)的發(fā)展,全球知名咨詢公司麥肯錫研究認(rèn)為,數(shù)據(jù)已經(jīng)滲透到每一個行業(yè)和業(yè)務(wù)職能領(lǐng)域,逐漸成為重要的生產(chǎn)因素;而人們對于海量數(shù)據(jù)的運(yùn)用將預(yù)示著新一波生產(chǎn)率增長浪潮的到來,在政府公共服務(wù)、民生醫(yī)療服務(wù)、維護(hù)社會安定、動態(tài)安全監(jiān)管等領(lǐng)域的廣泛應(yīng)用,將產(chǎn)生巨大的社會價值和產(chǎn)業(yè)空間。有機(jī)構(gòu)預(yù)測,大數(shù)據(jù)應(yīng)用將使美國零售業(yè)凈利潤增長實(shí)現(xiàn)60%,可使制造業(yè)的產(chǎn)品開發(fā)和組裝成本降低50%。這種影響和變化是革命性的,說明大數(shù)據(jù)蘊(yùn)含著大價值。
數(shù)字出版向大數(shù)據(jù)進(jìn)化
以閱讀為起點(diǎn),在數(shù)字技術(shù)的支撐下,一本書的數(shù)據(jù)究竟會有多大?從當(dāng)前數(shù)字出版產(chǎn)品的形態(tài)看,讀一篇小說,或許5M綽綽有余;查閱學(xué)習(xí)資料,也許涉及300M文獻(xiàn);享受一段聲光電多媒體讀物,可能總計(jì)不足1G……因此,數(shù)字出版目前典型的特點(diǎn)是“小數(shù)據(jù)”生產(chǎn)與制作,數(shù)字出版產(chǎn)品能夠帶給讀者更多的是碎片化的知識、相關(guān)的興趣點(diǎn)以及多姿多彩的閱讀體驗(yàn)。至于閱讀的深度挖掘、知識的重新組織,乃至閱讀信息本身的智能型分析與匹配、數(shù)據(jù)之間的關(guān)系,讀者閱讀興趣產(chǎn)生的數(shù)據(jù),則正是大數(shù)據(jù)浪潮下,數(shù)字出版開啟的瑰麗想象。
在不遠(yuǎn)的將來,數(shù)字出版或許應(yīng)該首先是數(shù)據(jù)出版,它整合、梳理大量內(nèi)容資料,全面、細(xì)致囊括相關(guān)知識,是海量數(shù)據(jù)、龐大數(shù)據(jù)庫的有效管理。其次,它將是數(shù)據(jù)關(guān)系的智能服務(wù),它能夠智能挖掘、匹配一切閱讀興趣,為讀者的沉浸閱讀、深入學(xué)習(xí)提供內(nèi)容和工具,是滿足閱讀需求的數(shù)據(jù)綜合服務(wù)。最后,數(shù)字出版必將成為大數(shù)據(jù)出版,即以內(nèi)容為基準(zhǔn),包含各種服務(wù)的PB級大數(shù)據(jù);處理速度迅速、涵蓋多種類型以及信息感知無處不在、隨機(jī)變化但智慧關(guān)聯(lián)。
印刷業(yè)如何敲開大數(shù)據(jù)之門
數(shù)碼印刷的出現(xiàn),成為了處在困境中的傳統(tǒng)印刷行業(yè)的救世主,它由于無需傳統(tǒng)膠印繁雜的工序,只需由計(jì)算機(jī)發(fā)往印刷機(jī)即出成品,準(zhǔn)確又即使,成為當(dāng)今印刷的偏愛。數(shù)碼印刷具有快速及時、成本節(jié)約、無版印刷、信息可變等等一系列優(yōu)點(diǎn)。
按需印刷指按照用戶的要求,依指定的地點(diǎn)和時間予以提供為目的,直接將所需資料的檔數(shù)據(jù)進(jìn)行數(shù)碼印刷、裝訂。按需印刷又稱“實(shí)時印刷”和“閃電印刷”,是數(shù)字技術(shù)在印刷環(huán)節(jié)的極好實(shí)踐,即“按當(dāng)天的訂數(shù)印刷,第二天發(fā)貨”。它始于20世紀(jì)80年代,能滿足個性印刷、減少浪費(fèi)及印刷品一步到位的要求,實(shí)現(xiàn)零庫存、實(shí)時出書和可選擇的個性印書。
不論是數(shù)碼印刷還是按需印刷,它使得傳統(tǒng)印刷走向了高速與及時。這為數(shù)據(jù)處理提供了保證與可能。
傳統(tǒng)印刷業(yè)在不斷轉(zhuǎn)型與升級,大數(shù)據(jù)是一種趨勢,如果傳統(tǒng)印刷業(yè)抓住了它,也就等于抓住了市場。



滬公網(wǎng)安備 31011702001106號