
字詞轉換是中文維基的一項自動轉換,目的是通過電腦程式自動消除繁簡、地區詞等不同用字模式的差異,以達到閱讀方便。
字詞轉換包括全局轉換和手動轉換,本說明所使用的標題轉換和全文轉換技術,都屬於手動轉換。
| 此條目可能需要進行清理,以符合維基百科的品質標準。(2008年3月19日) 請盡量協助改善這篇條目,詳細信息請參見討論頁。 |
| 網址 | www.google.com list of domain names |
|---|---|
| 營利性質 | yes |
| 網站類型 | 搜尋引擎 |
| 持有者 | Google公司 |
| 創始者 | 拉里·佩奇和謝爾蓋·布林 |
Google是由Google公司推出的一個網際網路搜尋引擎,它是網際網路上最大、影響最廣泛的搜尋引擎的首位。Google每日透過不同的服務,處理來自世界各地超過2億次的查詢。
除了搜尋網頁外,Google亦提供搜尋圖像、新聞組、新聞網頁、影片的服務。2005年6月,Google已儲存超過80億的網頁,1億3千萬張圖片,以及超過1億的新聞組訊息 - 總計大概10億4千萬個項目。它也緩存了編入索引中的絕大多數網頁的內容。
因為Google的名聲,「Google」一個事物做動詞表示的是「在Google上尋找某事」。它還有廣義的「搜尋網路」的意思。Google官方並不鼓勵這種濫用他們公司名字的習慣,因為它可能會導致Google變成一個通用商標名。
目錄 |
| 本條目屬於網路搜尋引擎系列 |
| 網路搜尋引擎 |
| 元搜尋引擎 |
| 知名搜尋引擎 |
| Google 谷歌 |
| Yahoo! 雅虎! |
| Live Search |
| 中文搜尋引擎 |
| 蕃薯藤 |
| 百度 |
| 新浪 |
| PChome Online |
| 其他搜尋引擎 |
| AltaVista |
| Exalead |
| Mooter |
| Alexa Internet |
| 其他連接 |
Google於全球數個地方,僱用伺服器中心來存放較低成本的普通電腦,運行Red Hat Linux作業系統來回應搜尋要求和索引網頁。這個於伺服器中心建立的「伺服器園地」以Shared nothing architecture(分佈式資料庫結構) 建造。索引是由程序Googlebot執行,它會定期地請求訪問已知的索引建立新頁面。頁面更新愈快,Googlebot訪問亦會愈多。再通過在這些已索引網頁上的連結來發現新頁面,並加入到資料庫。索引資料庫和網頁緩存大小是以兆位元組(terabyte)來衡量的。Google發展了一套檔案系統名為Google 檔案系統 ,儲存這些資料。
Google使用的這些機器的精確大小和位於何處至今未知;Google官方刻意含糊其詞。在John Hennessy和David A. Patterson所著的《計算機結構:走進大數》中,推測Google的伺服器場中群集計算機群形成的「搜尋場」在2000年大約應該有6000個處理器,12000個普通IDE硬碟(即每個機器2個硬碟1個處理器),他們位於四個地方:二個在 矽谷和二個在 維吉尼亞。每個都以OC 48的線路(2488 Mbit/s,參見頻寬)連接著網際網路並且有一個OC 12(622 Mbit/s)線路連接著其他3個Google分站點。這些連接使用思科12000路由器(Gateway),用二個Foundry Networks BigIron 8000的乙太網交換器分流成4 x 1 Gbit/s的線路連接到64個伺服器夾,裡面前後各是40台電腦和1台惠普乙太網交換機,所以一個架子共有80個機器和2個惠普交換機。
Google在2004年4月發布的IPO S-1表單後,大財政公司的英特網開發單位副總裁Tristan Louis估計了現在的伺服器場包含下列各項[1]:
依照這一估計,Google伺服器場組成了全球最強大的超級計算機,每秒運行速度至少三倍于地球模擬器。
Google使用一種名為PageRank的演算法,配合搜尋字串來排名網頁,PageRank是以公司創辦人拉里·佩奇命名。PageRank演算法根據加權係數,推斷該其他連結到網頁的價值來處理。PageRank如此取得由人所建立的連結,與及與人關聯的重要性。先前的排名搜尋方法,採用了許多搜尋器,以搜尋的關鍵詞和何時搜尋來排名頁面,或有多相關地關聯該搜尋。 另外,Google亦採用其他秘密準則,決定排名網頁的結果。
Google不止索引和緩衝HTML檔案,亦索引13種其他檔案類型,例如PDF、Word文件、Excel試算表,以及純文字檔案。除了文本文件,其他文件的是先轉換為HTML版本後緩存的。 所以借助Google可以不需要有這些文件的相應程序就可以看見這些非網頁文件,如Word或是Excel。
Google創新的搜尋技術和典雅的用戶界面設計使Google從第一代搜尋引擎中脫穎而出。Google並非只使用關鍵詞或代理搜尋技術,它將自身建立在高級 PageRank™ (網頁級別)技術基礎之上。這項專利技術可確保始終將最重要的搜尋結果首先呈現給用戶。網頁級別可對網頁的重要性進行客觀的分析。用於計算網頁級別的公式包含5億個變數和20多億個項。網頁級別利用巨大的網路連結結構對網頁進行組織整理。當從網頁A連結到網頁B時,Google就認為「網頁A投了網頁B一票」。Google還對投票的網頁進行分析。Google複雜的自動搜尋方法和結構設計被認為可以避免任何人為感情因素提供公正的搜尋結果。隨著搜尋引擎優化(SEO)和各種針對PageRank的交換連結的行為的流行,Google的PageRank?及公正性也越來越受到人們的質疑。
使用者能自定義搜尋引擎。他們能設定一個預設語言或使用 "SafeSearch" 過濾技術,設定在每頁上被顯示的結果多少。Google受爭議的放置永久cookie在用戶的機器上以儲存這些信息,這使他們能夠了解過去用戶的搜尋內容。任何一次搜尋請求(只有頭10個關鍵字被查詢),每次最多查詢頭1000個結果(以每一頁最多100個結果的方式顯示)。
儘管它有極大的索引數目,仍然有相當多數量的資料庫的數據只能是從網站訪問到,而不是藉由連接。這所謂的深網暫時不能被Google資料庫所覆蓋,舉例來說包含了圖書館的目錄,官方的法定(政府)公文,電話簿等。
(關於 PageRank™ 的介紹,參見Google的 Why Use Google 頁)
Google跳舞是一種經常被討論的現象,Google跳舞指的是Google月底大量更新資料庫和演算法的幾天時間,因為可以發現,這幾天對Google搜尋關鍵字如www.yahoo.com得到的結果數是不一樣的.
在跳舞期間,一個站點的等級可能在短時間里戲劇般的改變,而且不同的Google伺服器(舉例來說,www.google.com,www2.google.com,www3.google.com,www.google.co.uk,www.google.com.tw等)可能為相同的關鍵字提供不同的結果。跳舞似乎當是googlebot機器人抓取網頁期間隨即發生的。快速更新的網站,高級別的網頁和新聞網站是最經常被檢查的,雖然新聞不一定如此。小的調節在每月里持續進行以確定網頁級別。在一些情況下,可能需要二到三個月讓新建頁面出現在搜尋結果里。 從2003年的夏季開始,每月的搜尋,索引和等級更新被不間斷的持續更新所取代。這種改變大大減少了Google搜尋結果的不穩定性。2003年11月15日,Google似乎進行了有史以來最重要的一次演算法升級,後來被稱為「佛羅里達更新」。在這次更新中,幾乎所有商業領域的關鍵詞都受到了影響,尤其是一些熱門的關鍵詞,Google搜尋的結果頁完全變了個樣兒,很多頭一天還排在首位的網站被遠遠甩到了500名之後。
Google目前的主要挑戰之一是,它的演算法和結果越是得到網路使用者的信賴,商業網站為了利益而暗中破壞結果的風險就越戲劇般的增加。一些搜尋引擎優化公司已經開始嘗試使用各種不同的技巧提升Google網頁評級,以使他們客戶的網站更多的被搜尋到。Google已經設法減少了一些已知的使用這種方法的網站的Google頁面評級。
由於Google實際上已經成為最流行的搜尋引擎之一,很多網站管理員十分熱衷於跟蹤他們網站在Google上的左側排名,並試圖解釋他們排名變化的原因。現在已有不少網站提供排名Google搜尋引擎優化(Search Engine Optimization,SEO)服務,如在一些高流量的討論區內刻意加入商業網站的連結,從而使該網站在Google的排名提高。這種「發明」雖然的確有一定成效,但這種收取客戶金錢,在第三者的討論區上大賣廣告,一方面對討論區的讀者造成困擾,也侵害了討論區的商業利益;這種做法也明顯違反了商業道德。
還有一種被普遍採用的技術是很多網站使用一個相同的關鍵字連接到某一個特定的網站,以使用戶在Google搜尋這個關鍵字的時候,這個網站的排名會出現在結果的較前面。這種方法被稱為Google炸彈。現在Google演算法更新的頻率非常快,據猜測,現在演算法公式中涉及的變數有300多個,PageRank™在整個Google演算法中的影響力已經下降到20%左右,最終平衡的演算法中最重要的變數所占的比例不會超過10%,單純靠技術手段提升排名的網站已經禁不住時間的考驗。
Google發布了一系列的文章以指導站長們提升他們網站的頁面評級。
In addition to its tool for searching webpages, Google also provides services for searching images, Usenet newsgroups, news websites, videos, searching by locality, maps, and items for sale online. In 2006, Google has indexed over 25 billion web pages, 1.3 billion images, and over one billion Usenet messages.[citation needed] It also caches much of the content that it indexes. Google operates other tools and services including Google News, Google Suggest, Google Product Search, Google Maps, Google Co-op and Google Desktop Search.
There are also products available from Google that are not directly search-related. Gmail, for example, is a webmail application, but still include search features; Google Browser Sync does not offer any search facilities, although it aims to organize your browsing time.
|
檢 • 論 • 編 • 歷
|
|
|---|---|
| 董事會主席兼執行總長:埃里克·施密特 · 董事兼技術總裁:謝爾蓋·布林 · 董事兼產品總裁:拉里·佩奇 · 首席財務官:喬治·雷耶斯 其他董事:保羅·歐德寧 · 約翰·亨尼斯 · 阿瑟·萊文森 · 安·馬瑟 · 約翰·杜爾 · 拉姆·希拉姆 · 雪莉·蒂格曼 |
|
| 廣告 | AdSense · Advertising Professionals · AdWords · 分析 · Base · Checkout · Click-to-Call · DoubleClick · Trends |
| 通訊 | Answers · Apps · 日曆 · Dodgeball · Gmail · GrandCentral · 網上論壇 · Talk · Joga Bonito · Orkut · Picasa Web Albums · Reader · Translate |
| 電腦應用程式 | Android · App Engine ·Browser Sync · Chrome ·Code · Co-op · 桌面 · 地球 · Gears · Gmail Mobile · Hello · Keyhole ML · OpenSocial · 軟體集 · Picasa · 拼音輸入法 · SketchUp · Talk · 工具列 · Updater · Video Player · Web Accelerator · Gmail Store |
| 出版 | Alerts · Bookmarks · Blogger · 文件 · FeedBurner · iGoogle · Jaiku · Knol · Library Project · Mashup Editor · 筆記本 · Page Creator · Sites · Video Marketplace · YouTube |
| 搜尋(PageRank,Sitemaps) | 圖書 · Code · 桌面 · 財經 · GOOG-411 · 圖片 · 地圖 · 新聞 · 專利 · Products/Froogle · 學術 · Street View · Usenet · 視訊 · 網頁 |
| 參看 | 子公司 · Google炸彈 · Google審查 · 批評 · 谷歌 · Google.org · Googleplex · Google歷史 · Google玩笑(英文) · 手氣不錯 · 實驗室 ·標識 · 節慶標識 · Platform · 產品列表 · Summer of Code · WiFi |
| 術語及概念 | Google 經濟體系 · Google (動詞) |
| 技術 | MapReduce · Google檔案系統 · PageRank |
Why are we here?
All text is available under the terms of the GNU Free Documentation License
This page is cache of Wikipedia. History