Google 及其云智慧

作者: Stephen Baker  來源: 商業周刊  發布時間: 2017-09-12 15:45  閱讀: 7266 次  推薦: 7   原文鏈接   [收藏]  

【編者按】“云”的想法,是創造一個平臺,讓所有大型的信息創造、學習、管理和使用機構不得不加入。這個平臺由此成為一臺自我生長的超級計算機。而這個超級計算機的品牌就是谷歌。

百年前,每個企業自己用發電機發電,后來則從大型電力網絡買電。可以把“云”比作這個大型電力網絡,它的品牌就是谷歌。所有用戶都要向谷歌買電,而全世界的發電廠都急于向谷歌賣電,或者說不加入谷歌網絡自己發的電就賣不出去。“超市”摧毀獨立小商店, 邏輯大概也類似。這是互聯網上的典型美國方式。

這一知識在非計算機的行業并不普及。在商界恐怕也是如此。但在行政管理上,它意義重大。

  英文原文:Google and the Wisdom of Clouds

  作者:斯蒂芬·貝克(Stephen Baker),譯/趙斌,英文原文發布于 2007/12/12  

  這項全新的遠大戰略旨在把強大得超乎想象的計算能力分派到眾人手中。

  這是一個簡單的問題,是克里斯托夫·比希利亞為信心十足的 Google 應聘者們出的一道題。作為 Google 公司的高級軟件工程師,27 歲的比希利亞留著一頭卷曲的長發,他希望了解這些大學本科生是否已經準備好以 Google 人的方式去思考。“告訴我,”他問道,“如果有 1000 多倍的數據量。你將怎么辦?”真是個奇怪的問題。假如他們真的跑回學校,愚蠢地想要去處理容量多達 1000 多倍的細節信息,那么學校的服務器恐怕會被拖累得慢如爬蟲。

  比希利亞將在面試中闡釋他的問題。他告訴應聘者,要想 在 Google 發展,就必須學會從更寬廣、更宏觀的角度來工作 和思考。他描述了 Google 全球運行的計算機網絡。的確,這些設備可以實現對搜索需求的即時回饋;而當形成集群,它們將能更快地處理浩如煙海的數據,其檢索答案或指令的速度將超過世界上任何一臺單機。絕大部分硬件設備并不安放在 Google 公司園區,而在園區之外,沒準就在地球上某個大型冷卻數據中心里高速運轉著。Google 內部把這種大規模計算機集群稱作“云”。在 Google,工程師編程過程中的一大挑戰便是如何駕馭“云”,提高它的數據處理能力從而大幅領先于小型計算機群。比希利亞表示,Google 的新員工通常要花費數月才能習慣從這種角度思考;他認為,Google 的新人需要的是高級培訓課程。2006 年秋季的一天,當他在會議間歇偶遇公司首席執行官埃里克·施米特時,他腦海里浮現出一個想 法。他將利用自己的“20%時間”(即 Google 分配給員工用于獨立開發項目的時間)來啟動一門課程,這將在他的母校華盛頓大學進行,著重引導學生們進行“云”系統的編程開發。他計劃把這個項目命名為 Google 101。施米特很是欣賞這一計劃。 在接下來的數月中,比希利亞的 Google 101 計劃不斷發展和深化,最終促成了 Google 與 IBM 在 2007 年 10 月開展了一 次雄心勃勃的合作——把全球多所大學納入類似 Google 的計算“云”中。

  隨著“云”概念影響的擴大,Google 的足跡必然會遠遠超出搜索、媒體和廣告領域,從而使這家 IT 巨頭得以涉足科學研究甚至更新的業務領域。在這一過程中,Google 在某種意義上可能會成為世界頭號的超級計算機。“我最初以為(比希利亞)不過是想在教育上做點事情,這當然也不錯,” 施米特最近一個下午在 Google 總部回想道,“9 個月后他拿出了新戰略(即‘云’計劃),太出乎意料了。”隨著自身的不斷拓展, “云”計劃將通過 Google 自身的設備或是通過提供相同服務的其他廠商,為學生、研究人員和企業家們提供 Google 式的無限的計算處理能力。

  Google 的“云”到底是什么?它是由幾十萬甚至上百萬臺廉價的服務器所組成的網絡。單個而論,這些機器的性能并不比家用臺式機強大多少。但是這個網絡存儲的數據量驚人, 能容納不計其數的網絡數據拷貝,因此搜索速度更快,在眨眼之間便能為數十億的搜索提交答案。與許多傳統的超級計算機不同,Google 的系統永遠不會老化。如果網絡中某一臺機器落伍(通常在使用 3 年后),工程師們就會把它淘汰,而代之以性能更強的新款計算機。這就意味著“云”幾乎能“長生不老”。

  向“云”規模的數據處理邁進,是一個信息技術產業的里程碑。從最基本的層面講,“云”的發展就如同 100 年來人類用電的進程演變。100 年前,農場和公司逐漸關閉了自己的發電機,轉而從高效的發電廠購買電力。Google 的高管們很早就預料到這一轉變,并為之籌劃準備。以 Google 設備為核心的“云計算”完全符合由該公司創始人謝爾蓋·布林和拉里·佩奇 10 年前提出的遠大構想:“構建起跨越全世界的信息,供人們隨時隨地訪問。” 比希利亞的想法剛好為實現這個構想開辟了一條道路。“沒準他腦子里早就有數,只是沒告訴我,” 施米特表示,“一開始,我沒有意識到他將試圖改變計算機專家對于計算的固有想法。這個目標太偉大了。”

  單行道

  對于小型公司和企業主而言,“云”意味著機會,在密集型數據處理領域這一競技場中,它就像是一道標準線。今天, 掌控“云”系統的互聯網巨頭中,只有少數幾家擁有吞吐海量信息并開展相關業務的能力。我們的文字、圖片、點擊和搜索全都是這個產業的原材料。很大程度上,這是一條單行道。人們產出數據,Google、雅虎和亞馬遜等公司則將信息轉化成觀點、服務,最終變成收入。這種狀況已開始改變。2006 年, 亞馬遜向付費用戶開放了自己的計算機網絡,調動新的參與者加入“云”計算,無論其規模大小。一些用戶只是簡單地將數據庫存儲在亞馬遜,另一些則使用亞馬遜的服務器搜索數據或建立網絡服務。2007 年 11 月,雅虎也將一個電腦集群(即小規模的“云”)開放給卡內基-梅隆大學的研究人員。微軟同樣通過開放服務器群來加深與科學研究團體的聯系。市場調查公司 IDC 的高級分析師弗蘭克·金斯表示:隨著這些“云”的發展,“新興的網絡公司將有望造訪這些服務器。這就如同在播撒 Google 種子”。隨著搜索新材料和藥品的數據處理實驗室把工作室搬到了“云”上,這些新公司很多將會出現在科學和醫藥領域。

  要想讓“云”發揮出潛能,與此相關的編程和操作就應該與使用互聯網一樣簡單。分析家稱,這給“云”搜索及其相關的軟件工具打開了增長的市場,對于 Google 及其競爭對手來說,這些業務唾手可得。Google 將為用戶提供多少存儲容量,或以什么形式、什么價格提供,施米特都不會明說。“通常來講,我們開始時會采取免費策略”,他表示,并強調大客戶“應該很有可能負擔一些費用”。那么這些“云”能發展到多大的規模呢?“無限大”,施米特表示。隨著“云”策略的展開,更多人看到 Google 隨時做好了成為下一代計算的主導力量的準備。“Google 渴望占據‘云計算’市場中相當的份額,或成為每天都與普通人打交道的‘云’”,施米特說道。那么有什么樣的商業計劃呢?就目前而言,Google 仍將繼續植根于核心業務,這給它帶來了源源不斷的廣告收入。從投資角度來說,“云”計劃在初始階段不過是像雷達屏幕上顯示的一個小光點。它在遠處盤旋,目標很大卻煙霧彌漫,很難拼湊在一起,但仍充滿著無限可能。當比希利亞第一次和施米特談論 Google 101 時,改變計算和科研的現狀還并不是他的主要意圖。 他說,當時他只想返回學校。與公司里很多已拿到博士學位的同事不同,比希利亞剛從華盛頓大學畢業就被 Google 錄用,他甚至沒讀過碩士。因此他渴望從 Google 的日常工作中抽身,換換腦子。在 Google,比希利亞每天都需要從公寓搭乘班車長途跋涉到公司,然后開始 10 小時的搜索運算法則的編寫工作。他想回到西雅圖,哪怕每周只有一天,去和他的教授兼導師埃德·拉佐斯卡一起工作。

  在突發靈感想到“云”計劃并直接和老板詳細討論之前,比希利亞并沒多加考慮。他和施米特已相識數年。5 年前他剛入職 Google 時還只是一個年僅 22 歲的程序員。其工位就在首席執行官的辦公室附近。比希利亞回憶說,他走進辦公室時被一架飛機模型所吸引。這讓他想起母親在美國聯合航空公司從事的空乘工作。自然而然地。他與話語溫和、有學者派頭的施米特聊起了數據計算,那種感覺就像在大學一樣。后來雖然比希利亞搬到了其他辦公樓,但兩人仍然保持著聯系。在他們第一次討論“Google 101”計劃的那一天,施米特提出了很好的建議:把項目縮減到比希利亞能在兩個月內完成的規模。“我實際上沒太在意他的話”,施米特回憶說,但是他想盡快給這位年輕的工程師反饋。他說,即使比希利亞失敗了,但“他很聰明。一定能從失敗中獲得經驗”。

  要想順利啟動“Google 101”計劃,比希利亞必須把項目的來龍去脈和 Google“云”的些許魔力透露給合作對象,同時又不能深入“云”本身或揭示出核心機密。這些機密會激發計算機學家無窮無盡的思考,Google 對此守口如瓶。畢竟這臺“超級計算機”是公司運營的支柱,它能自動處理搜索、放置廣告、傳遞電子郵件等業務。計算機從事這些工作時,包括比希利亞在內的上千名 Google 工程師僅僅只是“服侍”著它。 他們“教會”系統新的技術或為它尋找新的主攻市場,同時在其中添加新的集群,如 2007 年一年就增加了 4 個新的數據中心,平均每個成本達 6 億美元。在搭建這臺“計算機”的過程中,在搜索領域名聲大震的 Google 隨時準備扮演計算機業的新角色。不久之前,科學家和研究人員還在期望國家實驗室能啟動數據計算方面的前沿研究。如今,IBM 負責開放系統開發的副總裁丹尼爾·弗賴感嘆:“Google 現在做的事情。10 年 前只有國家實驗室才能做。”

  那么,比希利亞如何讓學生們訪問這臺機器呢?最簡單的辦法當然是直接從學校連接專線到 Google 服務器。然而公司并不準備對學生們完全開放這臺裝有授權軟件、存儲著私人信息以及運營著 106 億美元業務的計算機。比希利亞因此購買了價位適中的 40 臺計算機組成集群。發出訂單后,他開始琢磨如何給這些服務器付錢。就在賣家組裝電腦集群時,比希利亞告訴 Google 的幾名經理:一大筆賬單馬上就到。之后他“拿著花銷報告從下到上請示了一通,結果沒人反對”。說到這里,他又加上了自己喜歡的一句格言:“請求原諒比尋求批準容易得多。”

  狂熱的學習者

  2006 年 11 月 10 日,排成陣列的計算機群出現在華盛頓大學計算機科學學院的教學樓里。比希利亞和幾個技術負責人得想辦法把將近 1 噸重的機柜抬上 4 層放到機房里。他們最終解決了這個問題,并準備在第二年 1 月開始上課。

  比希利亞的母親布倫達說,她的兒子似乎從小就注定要走一條不平凡的道路。直到兩歲他才開口說話,但很快就開始成句成句地說。第一次是在一家人開車行至離家不遠的華盛頓吉格港時,一只小蟲子從打開的車窗飛進來,只聽到從后排座傳來比利亞的聲音:“媽媽,有一個東西在我嘴里。” 在學校里, 這個男孩沒完沒了的提問和飛快的學習進度惹惱了老師。父母看到他很傷心、很受挫,便把他帶回家教了 3 年。比希利亞說,那段時間他失去了很多小伙伴,但是學會了如何成為一個生意人。他對冰島野馬興趣濃厚,并在十六七歲時投身到養馬行當。 他的父親吉姆回憶道,一次,他們開車一直向北行駛到馬尼托巴買了馬匹,卻并沒有考慮到如何把它們運回家。“整個旅行 就像塞維·蔡斯電影里的場景”,他說。比希利亞學會了用計算機為他的販馬事業和父親的豪華游艇業務制作網頁。比希利亞斷定計算機比養馬更有前途,因此義無反顧地報考了華盛頓大學,并選修了盡可能多的學科,包括數學、物理和計算機等相關學科。

  2006 年年末,當比希利亞往返于 Google 大廈和西雅圖之間籌備“Google 101”計劃時,他運用生意人的技巧,招募 了一支組織松散的志愿者隊伍。他和學院的實習生一起設計課程,還在 Google 公司位于學校附近的華盛頓州科克蘭德分部拉攏部分同事,讓他們抽出 20%的時間來幫忙教課。比希利亞聽從了施米特的建議,把“Google 101”集中在學生們容易上手的方面。“我想得最多的是,什么課程我能在兩個月里教會他們,同時又真正有用和重要?”他回憶道。最終他的答案是 MapReduce 。比希利亞十分推崇 MapReduce ,這是 Google 數據計算的核心軟件。公司著名的搜索運算法為每一次搜索提供信息。MapReduce 則傳遞出速度。它把每個任務分解為成百甚至上千塊小任務,然后發送到計算機集群中。眨眼之間,每臺計算機傳送回自己的那部分信息,MapReduce 則迅速整合這些反饋并形成答案。雖然其他一些軟件也有同樣的功能, 但 MapReduce 速度更快,且顯示出幾乎可以解決無限任務的能力。提到 MapReduce ,比希利亞變得十分興奮和狂熱:“我還記得剛畢業時來到 Google 學習 MapReduce 時的情景,這的的確確改變了我對計算機科學乃至所有事情的想法。” 他把該軟件稱為“非常簡單但極其卓越的模型”。這個軟件是由其華盛頓大學校友杰弗里·迪安開發的。因此,通過回到母校教授 MapReduce ,比希利亞會將這個軟件和“這種思考方式”帶回它的源頭。

  阻礙只有一個:MapReduce 曾經安全地“沉寂”在 Google 主機中,而且不允許外界使用,“Google 101”項目也不行。 Google 曾拿出一部分相關信息與他人共享,以開發開源版本“Hadoop”。Google 當時想在不泄露核心技術的前提下,推動自身的標準成為“云”計算的體系結構。開發 Hadoop 的團隊屬于一家名為 Nutch 的公司。說也奇怪,這家公司現在歸入雅虎麾下,雅虎希望依靠 MapReduce 的衍生產物給自己的數據計算提供一點 Google “云”的魔力。好在 Hadoop 仍然保持開源狀態,這意味著 Google 團隊能應用它,還能免費安裝在華盛頓大學的計算機集群中。

  “Google 101‛一出現在冬季學期的課程安排中,學生們立即蜂擁而來選修這門課程。起初比希利亞和 Google 的同事們嘗試自己教課,不過后來他們及時地把這一工作轉交給華盛頓大學的專職教員。“他們的講解更加清晰,” 比希利亞表示。 接下來的幾周里,學生們學習如何調整自己的程序來適應 Google 計算機,并雄心勃勃地設計開發網絡規模的項目,這些項目涵蓋了從維基百科的編輯分類到互聯網垃圾郵件的鑒別處理等各個方面。2007 年的整個春天,有關這門課程的消息越傳越遠,其他大學的相關院系也開始要求參與“Google 101”計劃。很多人迫切渴望了解“云”的相關知識和計算能力,特別是在科研方面的計算。實際上在每個領域,從各種傳感器、分析設備以及先進的測量工具產生的大量新數據浩如煙海,讓科學家們大傷腦筋。這些數據可能用于開發新藥品和新療法、制造新的清潔能源、甚至預測地震,然而絕大多數科學家缺少設備來存儲和篩檢這些“數據寶藏”。“我們真是被淹沒在了數據里,” 美國國家科學基金會的助理主任周以真 (Jeannette Wing)表示。

  IBM 的慷慨

  對 Google 計算能力的巨大需求倒是把比希利亞難住了。能完成第一批計算機集群的采購安裝已經算是很幸運了,可是他能像這樣一次又一次、最終在每個計算機學院都裝上一個微型的 Google “云”嗎?這當然不現實。為了把“Google 101”計劃擴展到全球各地的大學,各參與方必須要接入到共享的資源中。因此比希利亞需要一個更大的“云”集群。隨著 IBM 董事長彭明盛突訪 Google 大廈,幸運之神降臨了。一位 IBM 的研究員表示,這天成了“Google 的彭明盛日”。那是一個冬日,如果要在 Google 園區里來場沙灘排球可能會有點冷,不過彭明盛中午在 Google 的餐廳體驗到了傳說中的免費大餐。 隨后,他和他的團隊與施米特以及包括比希利亞在內的十幾名 Google 工程師座談交流,他們在白板上寫寫畫畫、討論著“云 計算”。IBM 一直希望利用“云”系統來為企業客戶提供數據和服務。與此同時,在彭明盛的領導下,IBM 已經成為 Linux 系統等開源軟件的領先倡導者。這可是藍色巨人在軟件戰役中的重點,尤其是在對抗微軟的戰斗中。如果 Google 和 IBM 在“云”上合作,它們可能共創這種基于 Google 標準(包括 Hadoop 版本)的“云計算”的未來。

  當然,Google 已在這個項目上先行一步,即比希利亞的“Google 101”計劃。就在會面的當天,比希利亞小小的實踐演變成由兩家技術巨頭公司的首席執行官共同支持的一項重大計劃。當彭明盛那天下午離開 Google 時,比希利亞和 IBM 公司的丹尼斯·全就被指派組建 Google-IBM 的聯合大學“云”的原型。在接下來的 3 個月中,他們在 Google 總部并肩作戰。 (比希利亞說,從那時起“云”計劃從“20%時間”變成了他的全職工作。) 他們的主要工作是把 IBM 的商用軟件和 Google 的服務器進行整合,并裝配大量包括 Hadoop 在內的開源程序。2007 年 2 月,他們在加州山景城向高層領導、同時通過視頻向位于紐約阿蒙克的 IBM 總部人員首次展示項目原型。丹尼斯·全用手機從“云”集群中下載數據,讓在場人員贊嘆不已。(比希利亞說,雖然與核心項目關系不大,但這的確是場很精彩的演出。)

  “Google 101”計劃通過了。這一計劃是:首先將“云計算”用一年時間擴展到全美的多家大學,之后在全球部署。各所大學將會繼續開發“云”,創建工具和應用程序,同時培養出大批的計算機科學家來繼續建設和管理“云”。那些開發者應該能在 Google 這樣的網絡公司找到工作。施米特喜歡把這些數據中心比作極其昂貴的粒子回旋加速器。“物理界只有幾臺粒子加速器,” 他說,“每一臺都十分重要,因為你如果是個頂尖的物理學家,你需要在有粒子加速器運行的實驗室工作。那才是創造歷史的地方,那才是誕生發明的地方。所以我想,假如你把‘云’當作由小型計算機群組成的超級計算機,那么從科學觀點講,我們擁有最能吸引人才的那種計算機。”

  隨著商用和科學數據量日益壯大,數據計算能力轉變成一 種戰略資源、一種資本。“從某種意義上說,” 雅虎研究主管普拉巴卡·拉加萬表示,“世界上不過有 5 臺真正的計算機。” 他意指 Google、雅虎、微軟、IBM 和亞馬遜這幾家公司。他表示,除此之外,沒有哪家公司有實力把“電流”轉化為數據計算能力。毫無疑問,各種商業模式都會進化。Google 及其對手能與客戶合作、或通過交換計算能力來取得數據的訪問權。它們可以在“云”中引入合作伙伴進行次級項目的開發,比如公司在 2007 年 11 月宣布的清潔能源計劃。行業分析家表示, 隨著大型數據中心電費開支每年以 2000 萬美元的速度上升, 也只有 Google 有足夠的智力資源和服務器容量來承擔重任, 以圖在尋找創新能源方面取得突破。

  用于研究的“云”會是什么樣子?微軟負責外部研究的副總裁 Tony Hey 介紹,他們把“云”建成大型的虛擬實驗室, 應用新一代管理程序配以適當人工來管理數據,分級別開放給研究人員。他說,授權用戶將開發出新工具、補充新數據,并與各地同事廣泛共享。據他預測,在這些新的實驗室中,“你可以通過分析從別人那里匯集來的數據贏取諾貝爾獎”。位于加州 Almaden 的 IBM 研究運營部門負責人馬克·迪安表示,短短幾年內,商用和科學用途的結合將產生“云”網絡,對此我們怎么想象都不過分。“與這個相比,” 他說,“現在的網絡微不足道。我們將會嘲笑現在的網絡實在太小。” 然而,如果這個“太小”的網絡對于 Google 帝國發展都已經足夠大了,那么沒人能預測巨型的“云”網絡可以提供什么樣的機會。2007 年 11 月的一天,比希利亞剛剛從中國回到美國,還沒來得及倒時差。他在中國的幾所大學介紹了“Google 101”的計劃。他的時間表排得滿滿當當,不僅要和 IBM 共同建立“云”集群,還需要處理華盛頓大學、加利福尼亞大學伯克利分校、斯坦福大學、麻省理工學院、卡內基-梅隆大學以及馬里蘭大學等 6 所高校“云”計劃啟動的相關事宜。此時,他把一位攝像師請到會議室,線纜和燈光占滿了整張桌子。他將錄制一段有關“云”教學的宣傳片,這段視頻或許會選擇在 YouTube 網站上發布。

  埃里克·施米特走了進來。52 歲的他幾乎比比希利亞年長一倍,與愛徒清瘦的體格相比,他顯得強壯不少。比希利亞把他引到攝像機面前并解釋這個宣傳計劃。他們會錄制采訪中的音頻,再拍幾個施米特的單人正面鏡頭。比希利亞把這些鏡頭稱為“B 級膠片”。施米特同意并坐下來。他想到了更好的主意,他告訴攝像師拍下全景而省略單人鏡頭。的確,他和比希利亞太忙了,怎么有時間擺姿勢拍攝?

7
0
 
標簽:
 
 

文章列表

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 大師兄 的頭像
    大師兄

    IT工程師數位筆記本

    大師兄 發表在 痞客邦 留言(0) 人氣()