自分の HP がグーグル八分になっていた
大学内に作ってあった 私のページ がある日突然、Google のインデックスから削除されていた。
2008/01/24 にサイトの内容を一部変更したので、単なる Google Dance による順位変動か、もしくはキャッシュやインデックスの書き換えによる一時的な消失だろうと思ったら、数日たっても変わらないので、これは変だと思い始めた。
さっそく、 Google ウェブマスターツール で調査した。それによると、2008/01/23 にクロールしたとき、HTTP ステータスコードの 403 Forbidden (禁止) を受け取ってから、クロールするのをやめてしまったようだ。
403 エラーの原因を探っていたら、やはり、ファイルサーバの障害 だった。通常、サーバがダウンしていたらタイムアウトするはず。しかしこの場合は、ファイルサーバがダウンしていて、そのリバースプロキシ (?) である stu.cc サーバが生きていたため、ステータスコードを出力していたようだ。
誤って 403 Forbidden を吐いた後の始末は大変、ということを知りつつ、とりあえず、サイトの登録 / 削除 から再登録を行っておく。結果は後ほど追記する。
追記 (2008.02.17)
検索結果に復活しました。対処法はこちら。
HTTP 403 を誤出力して Google の検索結果から削除された時の対処法 | BlueSky Lab.

