91精品久久久久久久久久精品厂,91久久久久久熟女,国产乱老熟视频胖女人,91麻豆精品国产自产精品观看

關于我們 | English | 網站地圖

大數據時代

2013-05-31 13:00:00 中國能源網   作者: 庫克耶  

接下翻譯這本《大數據時代》的任務時,我的目標是做到110%的好。因為作者維克托邁爾-舍恩伯格畢竟不像我們每天在一線與數據廝殺搏斗,其愛其恨都更深刻。特別地,我們可以為中文的讀者補充很多中國的例子和參考資料。很遺憾,我們最終只做到了90%,應該補充的一些材料還沒有整理好,遣詞造句也多有生硬疏忽之處。如果再給我一個月的時間,就可以達到我預想的110%甚至120%。

為什么現在把這個版本呈現給諸位呢?一是因為我們的努力使得本書中譯本的出版和英文原版完全同步,單從獲取知識的角度講,我們一點兒不比美國的讀者慢!二是我相信作者在書中的一個重要觀點,就是大數據時代,要允許一點點的錯誤和不完美,因為效率可能更加重要!留下一些可供提高的地方,也使得我們的每一次印刷,都能夠與以前有所不同。親,這不是建議你等到某個更好的版本才去購買,而是說,其實你應該每個版本都買一本:)。

《大數據時代》這本書是200%的好,因此90%的譯本也絕對值得一讀。首先,作者拋出了大數據時代處理數據理念上的三大轉變:要全體不要抽樣,要效率不要絕對精確,要相關不要因果;接著,從萬事萬物數據化和數據交叉復用的巨大價值兩個方面,講述驅動大數據戰車在材質和智力方面向前滾動的最根本動力;最后,作者冷靜描繪了大數據帝國前夜的脆弱和不安,包括產業生態環境、數據安全隱私、信息公正公開等問題。

國內最近也出版了一些大數據方面的著作,可以和本書互為補充。鄭毅的《證析》對于數據通過交叉復用體現的新價值、大數據戰略在企業與政府執行層面的流程和大數據科學家這一新職位,以及圍繞這個職位的能力和責任給出了最深刻、最具體的描述;子沛的《大數據》對于數據的公正性、公平性以及信息和數據管理等方面理念、政策和執行的變化,特別是美國在這方面的進展,給出了完整的介紹;蘇萌、林森和我合著的《個性化:商業的未來》則對大數據時代最重要的技術、個性化技術,以及與之相關的新商業模式給出了從理念到技術細節的全景工筆。總的來說,這三本書都針對本書的某一局部給出了更深刻的介紹和洞見,也各有明顯超出本書的優點,但三本之和也無法囊括本書的菁華,亦缺乏本書的宏大視野。

簡單地說,這本書好在三個地方:

一是觀點擲地有聲,絕非主流媒體上若干討論的簡單匯總和平均,更不是一個宏大概念面前曖昧的叫好聲。讀者可能對其中一些觀點并不認同,但是讀完之后不可能一個都記不住。

二是觀念高屋建瓴,作者試圖從很多實例和經驗,包括歷史事件中萃取出普適性的觀念,而不僅僅是適用于幾個特定情況的案例分析。

三是例子豐富翔實,不大的篇幅包括了上百個學術和商業的實例。三點近乎完美地結合起來,體現了作者駕馭大問題的能力和豐富的知識,以及,可能更為重要地,作者渴求立言立說的野心!所以說,這本書絕對不是一堆枯燥的綱要,更不是一本巨厚的雜志。

我在這里拼命叫好,是為了這本書賣得更多,但不代表作者的所有觀點都是絕對真理。舉個例子,我本人對于大數據時代“相關關系比因果關系更重要”這個觀點就不認同。有了機器學習,特別是集成學習,我們解決問題的方式變成了訓練所有可能的模型和擬合所有可能的參數問題從一個端口進去,答案從另一個端口出來,中間則是一個黑匣子,因為沒有人能夠從成千上萬的參數擬合值里面讀到“科學”,我們讀到的只是“計算機工程”。與其說大數據讓我們重視相關勝于因果,不如說機器學習和以結果為導向的研究思路讓我們變成這樣。

那么,大數據是不是都這樣了?其實很多時候恰恰相反。想想瑞士日內瓦的強子對撞機,我們在上面捕獲了人類有史以來最大規模的單位時間數據。我們是希望找到或者驗證某種相關關系嗎?不是!我們試圖回答的,正是人類所能問出的關于因果關系最偉大的問題:希格斯玻色子是否存在,我們的宇宙是否有可能用標準模型刻畫。這個問題的最終答案,將打破人和神的界限!認為相關重于因果,是某些有代表性的大數據分析手段(譬如機器學習)里面內稟的實用主義的魅影,絕非大數據自身的訴求。從小處講,作者試圖避免的“數據的獨裁”和“錯誤的前提導致錯誤的結論”,其解決之道恰在于挖掘因果邏輯而非相關性;從大處講,放棄對因果性的追求,就是放棄了人類凌駕于計算機之上的智力優勢,是人類自身的放縱和墮落。如果未來某一天機器和計算完全接管了這個世界,那么這種放棄就是末日之始。蘇珊朗格(SusanLanger)在《哲學新視野》一書中說:

【“某些觀念有時會以驚人的力量給知識狀況帶來巨大的沖擊。由于這些觀念能一下子解決許多問題,所以,它們似乎將有希望解決所有基本問題,澄清所有不明了的疑點。每個人都想迅速地抓住它們,作為進入某種新實證科學的法寶,作為可以用來建構一個綜合分析體系的概念軸心。這種"宏大概念"突然流行起來,一時間把幾乎所有的東西都擠到了一邊。”】

這段話通常被認為是對當時“存在主義”和“精神分析法”這類萬能概念的善意批評,而如今特別適合作為一盆冷水潑在那些沒有任何深刻理解,卻月月日日分分秒秒穿行于各種“大數據嘉年華”的投資人、媒體人和創業者身上。希望《大數據時代》給予各位的是一些實實在在的知識和思考,并且喚起各位安靜思索相關問題的心境。大數據是一個很重要的概念,代表了很重要的趨勢,但我不希望它成為一種放之四海皆準的萬能概念因為越是萬能的,就越是空洞的!人類學家克利福德吉爾茲(CliffordGeertz)在其著作《文化的解釋》中曾給出了一個樸素而冷靜的勸說:“努力在可以應用、可以拓展的地方,應用它、拓展它;在不能應用、不能拓展的地方,就停下來。”我想,這應該是所有人面對一個新領域或新概念時應有的態度。

大數據的道路上沒有戈多,我們已經在路上,晃晃悠悠。人類的自由意志和諸神之下的尊嚴,會在這條道路上異化甚至消逝嗎?極目遠眺,不知道世界的盡頭,是否是一個冷酷的仙境!諸位為之奮斗吧,而我只想,做一個,麥田里的守望者。以為序。

謝文:實實在在大數據

中國互聯網發展的重要參與者,知名IT評論人謝文

因為我本身十分關注大數據,也寫過若干關于大數據的文章,做過若干關于大數據的演講,所以對有關這一主題的論文和書籍非常有興趣。過去幾年,在這方面我讀過十幾本書、上百篇論文和文章。相對而言,維克托邁爾-舍恩伯格教授的《大數據時代》是迄今為止我讀過的最好的一本專著,中英文都算上。

此書的一大貢獻就是在大數據方興未艾、眾說紛紜的時刻,進一步闡述和厘清了大數據的基本概念和特點,這對許多以為大數據就是“數據大”的人來說很有幫助。

在人類歷史長河中,即使是在現代社會日新月異的發展中,人們還主要是依賴抽樣數據、局部數據和片面數據,甚至在無法獲得實證數據的時候純粹依賴經驗、理論、假設和價值觀去發現未知領域的規律。因此,人們對世界的認識往往是表面的、膚淺的、簡單的、扭曲的或者是無知的。維克托指出,大數據時代的來臨使人類第一次有機會和條件,在非常多的領域和非常深入的層次獲得和使用全面數據、完整數據和系統數據,深入探索現實世界的規律,獲取過去不可能獲取的知識,得到過去無法企及的商機。大數據的出現,使得通過數據分析獲得知識、商機和社會服務的能力從以往局限于少數象牙塔之中的學術精英圈子擴大到了普通的機構、企業和政府部門。門檻的降低直接導致了數據的容錯率提高和成本的降低,但正如維克托所強調的,最重要的是人們可以在很大程度上從對于因果關系的追求中解脫出來,轉而將注意力放在相關關系的發現和使用上。只要發現了兩個現象之間存在的顯著相關性,就可以創造巨大的經濟或社會效益,而弄清二者為什么相關可以留待學者們慢慢研究。大數據之所以可能成為一個“時代”,在很大程度上是因為這是一個可以由社會各界廣泛參與,八面出擊,處處結果的社會運動,而不僅僅是少數專家學者的研究對象。

大數據將逐漸成為現代社會基礎設施的一部分,就像公路、鐵路、港口、水電和通信網絡一樣不可或缺。但就其價值特性而言,大數據卻和這些物理化的基礎設施不同,不會因為人們的使用而折舊和貶值。例如,一組DNA可能會死亡或毀滅,但數據化的DNA卻會永存。所以,維克托贊同許多物理學家的看法,世界的本質就是數據。因此,大數據時代的經濟學、政治學、社會學和許多科學門類都會發生巨大甚至是本質上的變化和發展,進而影響人類的價值體系、知識體系和生活方式。哲學史上爭論不休的世界可知論和不可知論將會轉變為實證科學中的具體問題。可知性是絕對的,無事無物不可知;不可知性是相對的,是尚未知道的意思。對于不從事網絡業、IT業以及數據分析和使用的讀者,本書的一大好處就是通俗易懂,通過具體實例說明問題,有助于人們的理解和聯想。在時限上,作者概括了直到2012年7月大數據方向上的最新發展,避免了許多同類作品存在的例證過于陳舊、視野相對狹窄的毛病。

作為一位生活在歐美現代社會的學者,維克托是把民主、開放和理性作為已知前提來討論大數據革命的。這對生活在發展中國家,社會現代化程度尚且有限的讀者來說,也許是個遺憾,因為書中描述的許多已經發生的事例可能更像是神話。沒有市場經濟制度和法治體系作為基礎支撐,大數據很可能成為發達國家在下一輪全球化競爭中的利器,而發展中國家依然處于被動依附的狀態之中。整個世界可能被割裂為大數據時代、小數據時代和無數據時代。處于發展中國家前列的中國,目前正面臨著一個重大的歷史抉擇關口。應該說,在過去的三十余年時間里,中國在快速走向工業化、信息化、網絡化方面交出了一份不錯的成績單。如今適逢世界走向數據化,邁入大數據時代的時刻,無論對個人、企業還是對社會和國家,都有認真理解、嚴肅決策的必要性和緊迫性。哪怕僅從這一點考慮,讀一讀這本書也是很值得的。

田溯寧:擁抱大數據時代

寬帶資本董事長田溯寧

從硅谷到北京,大數據的話題正在被傳播。隨著智能手機以及“可佩帶”計算設備的出現,我們的行為、位置,甚至身體生理數據等每一點變化都成為了可被記錄和分析的數據。以此為基礎,“反饋經濟”(feedbackeconomy)等新經濟、新商業模式也正在開始形成。維克托邁爾-舍恩伯格教授這本《大數據時代》,是我看到的最好的大數據著作,不管對于產業實踐者,還是對于政府和公眾機構,都是非常具有價值的。

如今,一個大規模生產、分享和應用數據的時代正在開啟。正如維克托教授所說,大數據的真實價值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,絕大部分都隱藏在表面之下。而發掘數據價值、征服數據海洋的“動力”就是云計算。互聯網時代,尤其是社交網絡、電子商務與移動通信把人類社會帶入了一個以“PB”(1024TB)為單位的結構與非結構數據信息的新時代。在云計算出現之前,傳統的計算機是無法處理如此量大、并且不規則的“非結構數據”的。

以云計算為基礎的信息存儲、分享和挖掘手段,可以便宜、有效地將這些大量、高速、多變化的終端數據存儲下來,并隨時進行分析與計算。大數據與云計算是一個問題的兩面:一個是問題,一個是解決問題的方法。通過云計算對大數據進行分析、預測,會使得決策更為精準,釋放出更多數據的隱藏價值。數據,這個21世紀人類探索的新邊疆,正在被云計算發現、征服。

《大數據時代》列舉了眾多在公共衛生、商業服務領域大數據變革的例子。一旦“不再追求精確度,不再追求因果關系,而是承認混雜性,探索相關關系”,“思維轉變過來,數據就能被巧妙地用來激發新產品和新型服務”。數據正成為巨大的經濟資產,成為新世紀的礦產與石油,將帶來全新的創業方向、商業模式和投資機會。

龐大的人群和應用市場,復雜性高、充滿變化,使得中國成為世界上最復雜的大數據國家。解決這種由大規模數據引發的問題,探索以大數據為基礎的解決方案,是中國產業升級、效率提高的重要手段。數據挖掘不僅能夠成為公司競爭力的來源,也將成為國家競爭力的一部分。聯系到我國現代化所面臨的種種問題以及教育、交通、醫療保健等各方面挑戰,通過大數據這種創新方式來解決問題,創建新的產業群,實現“中國制造到中國創造”的改變,意義就更大。

“大數據”發展的障礙,在于數據的“流動性”和“可獲取性”。美國政府創建了Data.gov網站,為大數據敞開了大門;英國、印度也有“數據公開”運動。中國要趕上這樣一場大數據變革,各界應該首先開始嘗試公開數據、方式與方法。如同工業革命要開放物質交易、流通一樣,開放、流通的數據是時代趨勢的要求。《大數據時代》一書也提到了數據擁有權、隱私性保護等問題,但相比較來看,新科技可能帶來的改變要遠遠大于其存在的問題。

本書的譯者周濤教授是我國最年輕有為的大數據專家。這位27歲的天才型教授,數年來一直帶領我國學術界在大數據研究上向國際一流看齊。更可貴的是,他不僅做研究,也關注著研究成果的商業化及傳播。這部譯著就是他這種努力的一個成果。

現代歷史上的歷次技術革命,中國均是學習者。而在這次云計算與大數據的新變革中,中國與世界的距離最小,在很多領域甚至還有著創新與領先的可能。只要我們以開放的心態、創新的勇氣擁抱“大數據時代”,就一定會抓住歷史賦予中國創新的機會。

 




責任編輯: 中國能源網