Google の PageRank

2005年、昨年 IT 界隈のキーワードとしては Google、iPod、ブログ、RSS、AJAX を挙られると思うが、 「Google」 と 「ブログ」 を理解する前に、 「なぜ Google で検索すると見つけたい情報が検索されるのか?」 という疑問から入らねばならない。それには Google の PageRank について理解する必要がある。ここではその PageRank の仕組みを簡単に説明しよう。

Google の PageRank とは、Google が個々のウェブサイトに付ける 「格付け」 だと考えてよい。格付けは、実際には 「(0~10 などの)数値」 である( 0~10 ではなく、実際はもっともっと細かく分類されているらしいが)。この格付けの方法は Google 独自のものだがそれを PageRank と言っている。この PageRank は大まかに言うと、「ページの内容ではなく世のすべてのウェブサイトのリンク関係で格付けしてしまおう」 という試みである。格付けするとどうなるか?格付けの高いページは、Google で検索したときにより上位の検索結果として表れる。従来の検索エンジン(たとえば Yahoo!、MSN、Infoseek など)は、ページの 「内容」 に着目して(機械的に)ウェブサイトの重要性を決定したのに比べて Google のそれはまったく新しいアプローチであった。

実際には、Google ではあるページへのリンクを 「投票」 とみな している。他のサイトからのリンクが多ければ多いほどそのサイトは有用なのであろうという理屈である。ここで 「そんなものはお互い協力し合って相互リンク貼りまくればいいのではないか?」 という疑問がすぐに思い浮かぶが、Google では、リンクを貼っているサイトの格付けも考慮に入れることによってこの問題を解決している。つまり、いくらリンクを相互に貼ってもお互いのサイトに価値がなければ Google には 「負け組同士のリンクがたくさん貼られている」 とみなされてしまうのである。Yahoo! などのすでに価値を持ったサイトからリンクが自分のサイトに対して貼られていることは、Google の PageRank を上げる上で非常に重要なことだが、Yahoo! からリンクが貼られることは相当そのサイトの内容がよくなければならないから、簡単なことではなく、結果的に PageRank を簡単に上げることは(たとえ企業であっても)難しいのである。

実際に PageRank を調べる(あくまでも目安; Google は本当の PageRank を公開していない)ページを作ってみたので、試しに以下のページにアクセスして、お気に入りのサイトの URL を入れてみて欲しい(入力欄は、下記リンク先ページの終わりにある)。ここで表示される数値は 0~10 であり、10 が最も高い数値である。

この PageRank の技術は、Google が Google たるゆえの根幹をなす技術である。Google の世界ではとにかく 「リンクされることによってそのサイトの価値が決まる」 と考えて欲しい。

Trackback URL for this post: https://econo.twinkle.cc/trackback/14
Posted on 2006-01-08 by yas |