やっと Yahoo! にインデックスされた

なんの期待もなしに YAHOO! サイトエクスプローラーを覘いてみると、2か所インデックスされていた。10月27日に登録したので、1か月強かかったことになる。もう、永遠にインデックスされないかと思っていたよ。インデックスされたのは、web.level-k.jp web.level-k.jp/sitemap.xml。サイト名で Yahoo! 検索したらちゃんと表示された。で、freshEYE は Yahoo! と同じロボットなんだな、おそらく。同じタイミングで検索に引っかかるようになったし、検索結果も Yahoo! と全く同じ。

Yahoo! に登録されたからというわけではないだろうが、ブラウザのツールバーで表示している Google PageRank が今まで「PageRank の情報を利用できません」となっていたのが、「(0/10)」になった。

Top Level Categories

カテゴリーメニューからリンクをたどる時だけ、URL に「/category/」が挿入されてしまう。その「/category/」を取ってくれるプラグイン。同じページを手順によってURL が異なってしまうのを防ぐことができる。使い方は、これをプラグインフォルダにいれるだけ。それで、「/category/」が表示されなくなる。

【現在利用中】

  • Top Level Categories Fixプラグイン
    Top Level Categories プラグイン使用時に、パーマリンク設定を「/%category%/%postname%/」などのように設定した場合にページナビゲーション(Pagination)やサブカテゴリが正しく機能しなくなる不具合を修正するプラグイン。今のところ不具合がないようなので利用していない。

Yahoo! に登録されないのは…

Google ではインデックスされているのに、いつまでたっても Yahoo! で検索できない。YAHOO! サイトエクスプローラーでチェックをしても、サイト認証はされているものの全くインデックスされていない。そこで改めて見直してみると、フィード URL の指定を間違えていた。今までは web.level-k.jp を指定していたのだが、考えてみたらフィード URL なのでサイトマップを送信しなくてはいけなかったのだ。さっそく web.level-k.jp/sitemap.xml に指定しなおして送信してみる。これでインデックスされるようになればいいのだが。

robots.txtを設置する

Google の検索をみると、表示する URL が「web.level-k.jp/page/3」のようなアドレスになっていることがある。なにこれ? WordPress の仕様は勉強不足でよくわからない。現在、トップページは新規投稿が掲載される設定になっているので、記事を投稿するたびにトップページの表示は変わるのだが、それを「page」あたりで管理しているような気はするが。でも、これだと知りたい情報を的確に探してもらえるか疑問だし、同じ情報を複数の URL で表示させるのも SEO 的によろしくないのではないかと思う。せめて、トップページへのリンクであればいいのだが。

というわけで、「/page/」の階層を検索結果に表示しないようにブロックしてみようと思う。固定のページをブロックするならメタタグを使えばいいのだろうが、この「/page/」は自動生成されたものなので、robots.txt でブロックしてみる。

自分で作ることもできるが、Google ウェブマスターツールを使えば簡単。
「運用ツール>robots.txt を生成」で追加ルール( /page/ はブロック )を加え、ファイルをダウンロードする。ダウンロードした robots.txt をサイトの最上位ディレクトリに置く。

テキストの内容は、

User-Agent: * (全てのロボットを対象に)
Disallow: /page/ (/page/ をブロック)
Allow: / (全て許可)

とした。
Disallow: /page/ の次に Allow: / を持ってくると、せっかく指定した Disallow が無効になってしまうような気がしないでもないが、どうなんだろう?
Google ウェブマスターツールの「運用ツール>robots.txt を解析」でテストすると、 http://web.level-k.jp/ は許可され、 http://web.level-k.jp/page/3 はブロックされた。問題なさそうなので、このまま様子をみることにする。