Random Life Blog

日々のあれこれ

はてなブログのサイトマップがいつの間にか変わっていた

スポンサーリンク

はてなブログのサイトマップが変わっていた

はてなブログサイトマップが変わっていた

みなさん、こんばんは。

Googleサーチコンソールで相変わらずはてなサイトマップは「取得できませんでした」が多いなぁと眺めていたらなんだかいつもと違う文字列が並んでいました。

はてなブログサイトマップが変わったようです。

サイトマップインデックスに変更はないようですが、サイトマップインデックスに含まれるサイトマップが大幅に変わっていました。

これまで記事数単位でのサイトマップが月単位のサイトマップに置き換わっているようです。

 

これまでのはてなブログサイトマップ

randamlife.hatenablog.com

はてなブログサイトマップインデックスはブログのURLの末尾に

/sitemap.xml

/sitemap_index.xml

を追加したURLとなります。

サイトマップインデックスの中にはサイトマップがいくつかあり、

記事数によって、

/sitemap.xml?page=1

/sitemap.xml?page=2

/sitemap.xml?page=3

/sitemap.xml?page=4

と増えていきます。

例えば、「/sitemap.xml?page=1」にはだいたい1記事目から100記事目までが格納されていて、「/sitemap.xml?page=2」には101記事目から200記事目までが格納されている感じでした。

 

今現在、サイトマップインデックス

/sitemap.xml

/sitemap_index.xml

の中身を見てみると、「/sitemap.xml?page=1」などの表記はなく、新たなサイトマップが記述されています。

 

新しいはてなブログサイトマップ

サイトマップインデックスに変更はありませんので、インデックスに関してはそのままでいいと思います。

変わったのはサイトマップインデックスに格納されているサイトマップです。

どんなサイトマップに変わったのかは以下の画像で。

f:id:samada:20200510200944p:plain


一番上には、

/sitemap_common.xml

というサイトマップになっていました。

この中に格納されているのは、ブログのトップページのURLとaboutページ(/about)の2つです。

次に連なっているのが、西暦と月をあらわすサイトマップです。

例えば、

/sitemap_periodical.xml?year=2020&month=5

このような文字列のサイトマップです。

開いてみると、このサイトマップは2020年5月の記事のURLが格納されているようです。

同様に、

/sitemap_periodical.xml?year=2020&month=4

/sitemap_periodical.xml?year=2020&month=3

/sitemap_periodical.xml?year=2020&month=2

/sitemap_periodical.xml?year=2020&month=1

/sitemap_periodical.xml?year=2019&month=12

という感じで、ブログを始めた西暦と月のサイトマップから直近の西暦と月のサイトマップに変更になったようです。

 

サーチコンソールに登録すべきサイトマップは?

これまでは、

サイトマップインデックス

/sitemap.xml

/sitemap_index.xml

をまず登録して、内包するサイトマップ

/sitemap.xml?page=1

/sitemap.xml?page=2

/sitemap.xml?page=3

/sitemap.xml?page=4

などを登録していましたが、サイトマップの変更でどれを登録したらよいのかわからなくなりました。

これまでのように、内包するサイトマップを登録すべきかはちょっと躊躇してしまいます。

サイトマップが西暦と月(月ごと)に変更になり、ブログを継続した月日が長ければ長いほど、より多くのサイトマップを登録しなければならないことになります。

現状では、サイトマップインデックスのみの登録でいいのではないかとも思います。

 

 登録すべきサイトマップ

サイトマップインデックス

/sitemap.xml

/sitemap_index.xml

上の2つのサイトマップインデックスだけをとりあえず登録しておけばよいかと思います。

私のブログで、サーチコンソールで新しいサイトマップを認識していたのは「/sitemap.xml」のほうで、「/sitemap_index.xml」のほうはまだ「/sitemap.xml?page=1」を認識しているようでした。

 

終わりに

f:id:samada:20200510200920p:plain

サイトマップの仕様が変わっても、相変わらずサーチコンソールでは「取得できませんでした」ですね。

どうせなら、しっかり反映されるような仕様変更にしてほしかったです。

今後、正常に読み込まれることになるとは思いますが、現時点ではいつもどおりのはてなブログサイトマップといった感じですね。