昨日、日記をトップページにも表示するようにしたわけだけど、今さっきGoogleで検索してみるとトップページの内容がすでにキャッシュに入っている模様。これまでもGoogleではトップページの情報は結構頻繁に収集されるけど各コンテンツのページはめったに収集されないみたいだったし。
とはいっても、Googleのキャッシュの内容は結構不安定で、いったん新しくキャッシュされたかと思ってもしばらくするとまた古いキャッシュ内容に戻ったりする。おそらくデータベース管理のアルゴリズムや、サーバーの切り替えを行っているためではないかと。
トップページの内容だけがよく反映されるのは、PageRankが他のページより高いためでしょう。PageRankなどによって巡回頻度を調節しているのかと。更新頻度がクローラーの巡回頻度に影響しているかは分からないけど。
それにしても、書いた情報がすぐに検索されるようになるというのはかなり強力な気がする。いろんな意味で。
今回はたまたまキャッシュの更新日と重なっただけという可能性も。
昨日設置した携帯版日記のURL構造について。
携帯端末(主に携帯電話が対象)では、一度に受信できるデータ量に制限があったりするので、URL構造も工夫が必要になってくる。
携帯版日記では、最初は日毎にURLを作るのではなく、各セクションごとに作ろうかと考えたけれど、いままでで1日に書いた量を見返してみると1日ごとのURLでも大丈夫そうだったのでそうすることにした。その方がファイルとも1対1で対応していてシンプルだし。また、1月ごとのURL(yyyymm.html)では各日へのインデックスを表示することに。そしてディレクトリ名だけ(diary/)の場合は各月へのインデックスを表示するようにした。
URL 内容
diary/ 各月へのインデックス
yyyymm.html 各日へのインデックス
yyyymmdd.html その日の日記(全文)
月数が多くなってきたら、各年のURL(yyyy.html)を作ってその年の各月へのインデックス用にすればよさそう。
こういうふうにしたけれど、ディレクトリ名だけのURL(diary/)を各月(各年)へのインデックスとして使っているので、最新の日記へのリンクは別のページに用意することに。これはいまのところは携帯版のトップページからSSIで呼び出して行っているけれど、ディレクトリ名だけのURLに最新の日記へのリンクを付けるのがURLの構造的には理想的かも。
理想的版
URL 内容
diary/ 各年へのインデックス&最新の日記へのリンク
yyyy.html 各月へのインデックス
yyyymm.html 各日へのインデックス
yyyymmdd.html その日の日記
というふうに。また、
理想的版その2
URL
diary/
yyyy/
mm/
dd.html
のようなのもいいかもしれない。
PC用のページだったら1ページのデータ量をそれほど気にしなくていいので、yyyymmdd以外は省略もできるのだけどね。