robots.txtを設置する

Google の検索をみると、表示する URL が「web.level-k.jp/page/3」のようなアドレスになっていることがある。なにこれ? WordPress の仕様は勉強不足でよくわからない。現在、トップページは新規投稿が掲載される設定になっているので、記事を投稿するたびにトップページの表示は変わるのだが、それを「page」あたりで管理しているような気はするが。でも、これだと知りたい情報を的確に探してもらえるか疑問だし、同じ情報を複数の URL で表示させるのも SEO 的によろしくないのではないかと思う。せめて、トップページへのリンクであればいいのだが。

というわけで、「/page/」の階層を検索結果に表示しないようにブロックしてみようと思う。固定のページをブロックするならメタタグを使えばいいのだろうが、この「/page/」は自動生成されたものなので、robots.txt でブロックしてみる。

自分で作ることもできるが、Google ウェブマスターツールを使えば簡単。
「運用ツール>robots.txt を生成」で追加ルール( /page/ はブロック )を加え、ファイルをダウンロードする。ダウンロードした robots.txt をサイトの最上位ディレクトリに置く。

テキストの内容は、

User-Agent: * (全てのロボットを対象に)
Disallow: /page/ (/page/ をブロック)
Allow: / (全て許可)

とした。
Disallow: /page/ の次に Allow: / を持ってくると、せっかく指定した Disallow が無効になってしまうような気がしないでもないが、どうなんだろう?
Google ウェブマスターツールの「運用ツール>robots.txt を解析」でテストすると、 http://web.level-k.jp/ は許可され、 http://web.level-k.jp/page/3 はブロックされた。問題なさそうなので、このまま様子をみることにする。

アクセスアップの道のり

2008年
10月21日
web.level-k.jp「web製作に関するあれこれ」をWordPressで作成。まだ検索エンジンがこないように設定。

10月27日 GoogleとYahoo!に登録。Google Analyticsの設定をする。Google AdSenseAmazonでアフィリエイトの開始。このタイミングで一般公開する。

10月29日 Google XML Sitemapsプラグインを用いてXMLのSitemapを作り、Googleウェブマスターツールで申告する。

11月03日 googleとYahoo!には登録したがアクセスが全くないので、複数の検索エンジンに登録してみる。プラグインAll in One SEO Packを使って、metaタグ「title」「Description」「Keywords」を指定する。

11月04日 複数の検索エンジンのうち、「ネットアイランド」から1アクセスあった。はじめての訪問者。MSN Live Search URLに登録する。

11月05日 昨日に続き「ネットアイランド」から1アクセスあった。Yahoo!にまだインデックスされていない。今まで仕事でサイトを数え切れないほど制作してきたが、SEOに関してほとんど気にしなくてもランクがそこそこいっていたのは恵まれていたということだ。知人等に告知すればそれなりにアクセスはあるだろうが、アクセスの実験ということもあるし、内容的にも専門外の人が読んで面白いものでもないので、しばらくこのままで様子をみる。最後の手段として、ブログアクセスランキングに登録、ということも考えている。

11月08日 ここまでトータルのアクセス数は「3」…。ロボットがうまくクロールできていないような気がする。Googleのウェブマスター ツールで確認すると、インデックスには登録されているし、Googlebotも正常にアクセスしているようだが、潜在的な問題として、サイトのページすべてを把握されていないようだ。sitemap.xml作って送信してあるのに。site:web.level-k.jpで調べると12件登録されているから、完全に無視されているわけではないようだが。改めて内容など再チェックしてみよう。

…続く