Googleインデックスとsitemapの話


金曜日, 7月 31st, 2009

Googleインデックスとsitemapの話


前回の投稿でGoogleインデックスから特定のページが消滅して焦った話を書いたので、
若干関連事項も書いておきます。

Googleインデックス(検索結果への表示)のアルゴリズムはブラックボックスで、当然
公開もされていないので、基準が不明である。逆に、そういうものにアレコレ悩んで振り
回されるのも無駄なのだな、ということも分かった。
Googleのインデックス登録は、増えたり、減ったり、また増えたり…と、予測不能な動きを
する。実際、このブログのインデックス登録数も、本来のURL数より大分少ない。
ちょっとづつ増えたかと思うと、また減ったりしている。それに対して一喜一憂
してもしょうがない、と思うようになった。

とはいえ、内部的な要因が原因でインデックス登録から消滅することもあるので、ある程度の
分析や心構えは必要かと。

この辺りについては、以下ページのお話が大変参考になった。
Google で検索されなくなる(インデックス化されたページ数が減少する)原因
Google のインデックスに登録されるページ数を増やす

ちなみに登録されているインデックス数は、Google Webマスターツールでsitemap送信を
実行すれば表示されるようになり、確認できる。Googleの検索ボックスにsite:URLを
打ち込んでも確認できるが、その数は Webマスターツールで表示されるのとは一致
していないことがある。

それについても、どこかで「前者はなんちゃらで後者はなんちゃらだから一致していないのだ」
と書いてあったのだが…、忘れた。
とにかく何かしら理屈があるようが、これも特に深く考えることではないだろう。

[sitemap.xmlについて]
Google インデックス登録対策として、Webマスターツールからsitemapを送信するとよい
と聞き、遅まきながらsitemapを導入した。

sitemapはサイトマップなのだが、いわゆる人間用ではなく、robot用。
robot(クローラー、またはスパイダー)は巡回の度にすべてのページを拾うわけではなく、
ちょっとなめては帰る、という動きをする。
検索エンジンによってその動きも違ってくるけど、深い階層のページなどは、そこに
たどり着く前に立ち去ってしまったりするので、すべてのページのリンクが存在する
sitemapを作成しておけば、robotにも拾われやすくなる、という理屈。
robot用に適しているのはxml形式(txt形式でも一応可)なので、html形式で送信すると
エラーになってしまう(もちろん、「人」が利用するための一般的なサイトマップも
あったほうがいい。ブログという性質上、ここでは作ってないが)。
xml形式のsitemapを作成してくれるツールやサイトはいくつかあるので、利用すると
よいだろう。

ここでは以下のWordPress用のプラグインを導入した。
XML Sitemap Generator for WordPress 3.1.4

導入はいつも通り、ダウンロード、フォルダごとアップロード、プラグインを有効。
初回にsitemap作成する時は、えらい時間がかかった。なにせ半年分なので…。
途中でハングアップしてしまったが、rebuildしたらどうにか出来上がった様子。

あとは、新規に投稿するたびに自動的にsitemapも更新されて、そのタイミングでGoogle
にも通知してくれる。
あとは、ブログサービス独自にsitemap作成の機能があったりするようだし、以下サイトでは
URLを打ち込むだけでxml形式のsitemapを速攻で作成してくれる。
http://www.xml-sitemaps.com/

出来上がったsitemap.xmlをダウンロード。サイトのトップディレクトリにアップロード
してから、Webマスターツールからsitemap送信すればよい。
sitemap送信にどれだけ効果があるのかは、今のところ未知数。
サイトや大事なページがGoogleインデックスから突然消滅したら打撃が大きいけれど、
そうでない限りは登録しなくてもいいよくらいのページもあるので、あまり気にしない
ことにした。
やっておいて損はない、くらいに構えておいたほうがいいかな、と。

しかし。情報を検索するユーザの立場からすると?
さっきまでそこにあった情報が、再度検索をかけたら出てこなくなった、ってことに
なる。

情報を探していると、気になるページは無数にあって、いちいちブックマークに追加
したりURLを控えるのも面倒で、つい、また同じキーワードで検索すればいいや、なんて
考えてた。でもインデックスから一時的にせよ消えてしまう可能性があるということが
分かってから、それはやめて、URLは控えるようにした。

いつでも「Google先生に聞いてみよう!」が有効とは限らないんですよ〜

関連記事
Googleのインデックスからページが消えた!?
Googleインデックスの動きは不明瞭だけど

Bookmark this on Google Bookmarks