おっと、これはミスでなく、本記事のタイトルです。
ブログ用でHTML+CSSのtipsなどを紹介するときよく「この文章はダミーです」という文章を流し込みます。それを外部ネットワークのクライアントなどに見せるため、本番サーバにアップしちゃったままにすると…
Google「この文章はダミーです」での検索結果
約 6,670 件のヒット!
「この文章はダミー」にすると、約 183,000 件のヒット…。
別にこの文章で検索する人は多くないですが、こうして晒してみると、大手コーポレイトサイトとかもヒットすることもあって、あんまり良いものとはいえません。
インデックスされないために
- metaタグにロボット用のタグをいれる
- robots.txtでロボット用の記述を書く
User-Agent : * Disallow : /test/
※「http://aaa.co.jp/test」ディレクトリにダミーページがあるときに、ルート階層にこのファイルをアップ
前者は単体ページの場合、後者はディレクトリ以下の多くのページのインデックスを避けたい場合に使えます。
基本的に、Google Webmaster Toolsのようにサイトマップを登録してインデックスをおこなうサービスを使っていない、またはインデックスされているサイトからリンクを張らない限りは、ダミーのページが表に出ることはありません。
こうした対処というのはあくまで「念のため」みたいなものなので、もしも不要なデータであればサーバ上からダミーページを削除することをおすすめします。