大道小說網 第二百二十四章:you 文 / 紫雨涵
. 「好消息啊,老闆。」一見面任正飛就對著張國棟毫無形象的大喊大叫,如果不是看著張國棟那戒備的眼神,說不定還想衝上來給他一個熱情的擁抱,張國棟有些好奇,從部隊裡面出來的任總可是很沉穩的啊。
「從此以後我們又多了一項在全世界吸血的工具了,盛田昭夫剛剛親自打電話來向我們通報了此事,明天將是我們的cd-i標準正式推廣的日子,目前已經有三十幾家企業加入了我們的壓縮聯盟。」從zip格式獲得大量利潤的任正飛當然知道標準的好處了,所以聽到索尼的消息後還是會忍不住高興,不過心裡還是有點感慨,不知道什麼時候中國人能夠獨立的申請一項國際標準就好了,現在卻不得不與小日本合作,想想西方國家對社會主義國家的防治,他又忍不住搖搖頭,看來老闆上次說要加大對創新公司的投入是非常正確的。
「哦,這的確是個不錯的消息,不過我也有個好消息要和你分享,世界上第一個搜索引擎已經由我們中國人首先發明出來了,昨天龔定雨他們已經去登記了專利號了,發明人是我們中國的一個留學生,很難得的他的國籍還是中國。」相比於必然的收穫,張國棟顯然對這個偶然的成果更加滿意,以前他都已經忘記歷史上1990年,加拿大麥吉爾大學(universityofmcgill)計算機學院的師生開發出archie。當時,萬維網還沒有出現,人們通過ftp來共享交流資源。archie能定期搜集並分析ftp服務器上的文件名信息。提供查找分別在各個ftp主機中的文件。用戶必須輸入精確地文件名進行搜索,archie告訴用戶哪個ftp服務器能下載該文件。雖然archie搜集的信息資源不是網頁(html文件),但和搜索引擎的基本工作方式是一樣的:自動搜集信息資源、建立索引、提供檢索服務。所以,archie被公認為現代搜索引擎的鼻祖。
然而現在由於龍騰的貢獻,萬維網已經出現,網絡上最大最多的資源也是html網頁,而留學美國斯坦福大學的趙維均在博士攻讀階段,發現同學們非常喜歡去彼此地個人網站去湊熱鬧。但是有的同學在看了一個很漂亮的網頁後想介紹給別人時不得不繁瑣的記下該站得網址,要知道網址要鏈到某個具體網頁的時候有可能會非常地長,所以他忍不住想到,能不能做一個工具將網絡上所有的網頁都抓取下來,然後存在自己的服務器中。當人們輸入一定的關鍵將某個具體的資源返還給人們呢。大學地研究還不像公司,公司開發一款產品往往會進行大量的市場
調查,然後還要考慮是否盈利,而大學生做產品往往是靈光一閃。趙維均也是這樣。做這個產品他沒有告訴任何人,經過長達四個多月地編程實現。趙維均得到了一款比較滿意的產品。隨後他前去美國專利局進行註冊,產品名yout。可能注定著世界上要多一家偉大的公司,那天龔定雨和幾個公司的技術專家也去專利局去申請兩項專利,由於總公司和香港分公司專利都在不斷增加,給了美國分公司很大的壓力,所以龔定雨是為了擺個姿態。就一起去了,結果趙維均正好排在他們後面。得知龔定雨竟然是中國龍騰公司的人。趙維均非常佩服,畢竟他用地很多計算機產品都是龍騰生產的。可以說龍騰是整個中國人地驕傲。
而龔定雨也不愧擁有鬼神之智,竟然一眼就瞧出了趙維均手上專利的價值。隨後就隆重邀請趙維均加盟了,能加盟自己心目中地大公司,趙維均其實也非常滿意,他博士也快畢業了,只剩下最後論文答辯,本來他最近就一直在猶豫要加入哪個公司。不過當他聽說龍騰還有一個創業投資基金後,他就覺的有點心動了,開始龔定雨見他婉拒還以為是給地條件不夠吸引人,所以咬咬牙一再的提高籌碼,搞得那兩個技術人員都是臉一陣陣**。不過當他得知趙維均是想自己創業時,失落的心情又好了一點點。
和archie不同,由於有了互聯網,趙維均的yout擁有世界上第一個spider程序。spider指自動抓取網頁內容的機器人robots,是搜索引擎用來訪問inter|com|上網頁的自動程序。spiders根據html的語法和格式,對讀取的頁面進行代碼過濾,收入相關的文字內容。爬蟲從一個或若干初始網頁的url開始,獲得初始網頁上的url,在抓取網頁的過程中,不斷從當前頁面上抽取新的url放入隊列,直到滿足系統的一定停止條件。有被爬蟲抓取的網頁將會被系統存貯,進行一定的分析、過濾,並建立索引,以便之後的查詢和檢索;對於聚焦爬蟲來說,這一過程所得到的分析結果還可能對以後的抓取過程給出反饋和指導。
可以說yout已經具備了後世搜索引擎的一些特徵了,雖然還比較毛糙,在切詞計算詞之間距離的方面做得還不是那麼完善,但是作為世界上第一個誕生的網頁搜索器,yout仍然具備光輝的前景。沒能將這一項目握在自己手上的張國棟還有些遺憾,不過旋即又開心起來,畢竟這第一的榮譽好歹也是中國人自己的了,於是張國棟馬上自己炮製了一份pagerank算法的論文寄給了英國自然雜誌。
歷史上pagerank(網頁級別),取自google的創始人larrypage。它是google排名運算法則(排名公式)的一部分,是google用於用來標識網頁地等級/重要性的一種方法。是google用來衡量一個網站的好壞的唯一標準。在揉合了諸如title標識和key|com|k來調整結果,使那些更具「等級/重要性」的網頁在搜索結果中另網站排名獲得提升,從而提高搜索結果的相關性和質量。
級別從1到10級,10級為滿分。pr值越高說明該網頁越受歡迎(越重要)。例如:一個pr值為1的網站表明這個網站不太具有流行度,而pr值為7到10則表明這個網站非常受歡迎(或者說極其重要)。一般pr值達到4,就算是一個不錯的網站了。google把自己地網站的pr值定到10,這說明google這個網站說這個網站非常重要。
pagerank是google算法的重要內容。2001年9月被授予美國專利,專利人是googl創始人之一拉裡·佩奇(larrypage)。因此,pagerank裡的page不是指網頁,而是指佩奇,即這個等級方法是以佩奇來命名地。而現在張國棟毫不懷疑自己的這篇論文能夠引起學術界的關注。畢竟作為hits並舉的鏈接分析算法,在hits還沒有出現之前能夠有效的對網頁做出基本公平地排名還是非常重要的。這兩年隨著互聯網地興起已經有越來越多的專家學者將自己的注意力轉移到這上面來了。
反正自己叫它pagerank別人也只會以為是頁面排序的意思。本來龍騰也可以做一個搜索引擎的,畢竟以龍騰在軟件方面的實力和權威性,做出來地搜索引擎可能比yout更加先進,但是張國棟卻並不準備讓龍騰在每一個產業上都有所突出。畢竟太過於龐大的公司可能在西方有些事情不方便做。目前地yout還只能夠搜索英文,也就是只開發了英文版本。其它語言都還沒有做,但是這畢竟是一個公司由小到大的過程,不能什麼事情都替人家做了,那樣就沒什麼不知道是鑒於張國棟地威名還是怎麼的,畢竟現在張國棟隨著zip格式和cd-i兩項壓縮標準已經成為了世界上唯一一個不是phd地壓縮權威,所以對於他的文章自然雜誌自然非常重視。很快就給予了刊登,而且還加上了重點推薦。pagerank算法已經發表。馬上引起了學術界方面的討論。張國棟也趁此機會為pageran申請了專利,雖然還沒有批下來。不過申請的是國際專利,不怕別人再搞鬼。
有了pagerank算法在手。張國棟讓龔定雨去和趙維均談判,也不知道楊柳這個丫頭哪裡得知的消息,反正對於張國棟看好的生意她都要插上一腳,結果就變成了兩股資金對同一個公司注資的事情。最後龍騰以技術加資金入股佔了49%的股份,楊家用資金入股佔了30%的股份,趙維均這個公司的創始人佔了21%的股份,他也比較滿意了,畢竟以公司目前3000萬的投資來看,他白撿600多萬,還有什麼不滿意的呢。
就在yout成立之後的第三天,加拿大的三位同學就發表了archie,很險,差一點世界第一個搜索引擎的稱呼就被拿走,張國棟也是暗乎僥倖,當然,archie肯定沒有yout的生ftp基本上都要密碼,搜索的內容比較狹隘。雖然龍騰不會進入通用搜索引擎,但是垂直搜索張國棟還是不願意放過,畢竟再怎麼說yout也不可能佔領整個世界的市場。所以隨著張國棟一聲令下,整個龍騰的軟件組又動了起來。(未完待續,如欲知後事如何,請登陸|com|bsp;。