Google 検索オフィスアワー 2021.3.25

3月25日にGoogle検索オフィスアワーが開催されました。Googleの金谷さんとあんなさんが回答した内容のまとめです。

3月25日にGoogle検索オフィスアワーが開催されました。

今回は、事例を用いたcanonicalの正しい使い方や、誤解しがちな重複コンテンツの正しい理解についてと、盛り沢山の内容です。

インデックスが削除され続けている

Q今年に入ってURLがインデックスから削除され続けています。大量のカバレッジエラーを出していた古いURLの削除や、.htaccessのリダイレクト修正などを行ったがお手上げ状態です。何か対策はあるのでしょうか?
Aモバイルのクローラーがクロールが出来てない状態で、インデックスされた url がどんどん削除されていっている。サーバーの設定状態と、Search Consoleのクロールの統計情報でエラーの状況を見て対応してほしい。

インデックス登録はあるがsite:コマンドの検索に出ない

QSearch Consoleに登録した数が、site:コマンドのインデックス数も同じでしたが1週間後:siteコマンドでの数が減少していた。site:コマンドで表示されないページは何か問題があるのでしょうか?
A site:のコマンドは、サイトがインデックスされているかどうかを確認するぐらいには使えるが、それ以上の使い方をするのはあまり適切ではない。もしsite:コマンドに表示されないページの流入数が少ない場合、ページを改善するとよい。
site:とは?
site:コマンドは、site:コマンドはインデックス数を確認できるコマンドです。例えばサイトURLがexample.comの場合、Googleで、「:site:example.com」と打ち込んで検索すると、example.comでインデックスされた数が表示されます。

カバレッジのエラー・除外が急増した

Q1月中旬からカバレッジのエラーと除外が急増。サイト側の改修はしていないが、クローラーの仕様が変わったのでしょうか?問題・改善点などお教えください。
Aこのサイトの場合、URLにパラメーターがどんどん付与される仕組みの為、URLの構造に改善の余地がある。この場合、Search ConsoleのURLパラメータツールを使って、重複の処理をするか、canonicalを使うなどを検討し、ファセットナビゲーションの記事も参考に改善するのがいい。
ファセットナビゲーションとは?
ファセットナビゲーションとは、旅行サイトやECサイトであるような、「検索条件をサイト側で用意しておき、ユーザーはそれを選択するだけで検索結果を表示できる仕組み」です。オフィスアワーで紹介のあった記事はこちらのファセットナビゲーションのベストプラクティスと5つのワーストプラクティスで見れます。

日英多言語サイトでカバレッジエラーが多い

QSearch Consoleでサイトのほとんどのページでカバレッジエラーとなっている。「送信されたURLにnoidexタグが追加されています」というエラーになっているが、実際にはソース内にnoindexは見当たらず、robots.txtはない。また、ライブテスト表示すると、拒否理由が「ソフト404」になってしまう。
A現在はだいぶ改善されているのではないかと思う。半分くらいの想像であるが、日本語と英語のページが1:1の比率で対応してなく、日本語しか存在しないURLに英語でアクセスした際、トップページにリダイレクトされてしまうため、ソフト404になってしまったのではないか。noindexについては、実際にnoindexが入っていなくても、Googleがindexする予定がないものを振り分けている為ではないか。
Q 「送信されたURLにnoidexタグが追加されています」というエラーになっているが、実際にはソース内にnoindexは見当たらず、robots.txtはない また、ライブテスト表示すると、拒否理由が「ソフト404」となる
A現在はだいぶ改善されているのではないかと思う。半分くらいの想像であるが、日本語と英語のページが1:1の比率で対応してなく、日本語しか存在しないURLに英語でアクセスした際、トップページにリダイレクトされてしまうため、ソフト404になってしまったのではないか。noindexについては、実際にnoindexが入っていなくても、Googleがindexする予定がないものを振り分けている為ではないか。
改めて多言語化についてはGoogleが推奨している仕様と、推奨していない使用を見て対応するといい。実際、クッキーなどでリダイレクトするとクローラーがクロールできなくなることがある。

関係のないドメインからの重複コンテンツ

Q Search ConsoleのURL検査ツールを使用したところ「重複しています。送信されたURLが正規URLとして選択されていません」と表示され、正規URLには当サイトと全く関係ない別のドメインが記されている。なぜこのような現象が起きているのか教えてください。
A現在は解消されているようですが、当時ハッキングされたサイトに、同内容のコンテンツがありハッキングされたサイトのほうを優先的に選んでいた現象だと思う。
ハッキングの疑いがあるなと思う場合には、ハッキングのスパムレポートからレポートを送るとよい

重複コンテンツと判断される基準

Q同じ記事を2つのサイトに掲載するにあたり重複コンテンツとなり、ペナルティの対象になるのでしょうか?
A重複コンテンツはペナルティの対象にはならない。
重複により正規ページとみなされなかった場合、別のページが選ばれた結果、検索結果に表示されないことはある。
サイト全体の評価に影響があったとしても、恐れるほどのものではない。
ただし、広告収入を得ることがサイトの目的であって、コピーを量産しているような場合はペナルティの対象になる可能性がすごく高まる。
Qペナルティにならなかったとしても、サイトの評価が下がるのでしょうか?
A対策についてはnoindexも1つだが、canonicalを使用するか、別の方の読者に向けた表現で何か引用しながら解説するような記事にすることで、重複にはならず、それぞれの読者が読みやすい形で提供できるのではないか

外部メディアにサブディレクトリを貸すリスク

Q他社にサブディレクトリを貸して記事メディアの運営を行わせるようなことは不適切か?
また、記事メディアの評価が落ちると間接的に同ドメインへの悪影響がないかどうかも不安なので、このような施策に対する見解を聞かせてください。
A Googleは、ユーザーのためにならないコンテンツが不当に上位表示している場合、アルゴリズムを改善して、順位が適切になるよう改善していくだろうなと思います。
このようなケースでは、うまくいっているケースは少なく、うまくいっていないケースがほとんどではない。また、こういった施策で何かうまくいっているサイトに対してストレスを感じている人たちがいる中で、このような施策をとることがブランドとしてどうかという視点で考えてみるといいと思います。

2022年1月追記

大手のメディアや企業サイトが、サブディレクトリやサブドメインをまるごとアフィリエイトに貸す手法が、2021年から横行してきています。

その警笛について、SEOの専門家辻正浩さんの記事が参考になるので、チェックしてみてください。

多言語サイトでの正規化を行う

Qhreflangを設定している多言語サイトでの正規化はどのようにcanonicalの設定を行えばいいでしょうか?
A通常、canonicalを設定することは不要ですが、何らかの理由で必要であれば自身の言語ページへcanonical設定し、別々のURLを用いている場合はDesktop版へcanonicalすればよい
この質問で紹介された記事
それぞれの設定の見本について、こちらの記事の図表が紹介されていました。アノテーションをどのように向けているかということがわかりやすく書いています。
参考 Internationalizationamp dev

サイトマップの正規化は必要かどうか

Q Search Consoleに同じ内容でパラメーターが付いて同じ内容が表示されているのですが、こちらをパラメータなしに正規化する必要はありますでしょうか?
A特に必要はないと思いますが、気になるようであればrobots.txtでクロールを制御していただくといいかなと思います。

正規URLが正しく認識されない

Q複数ページ構成の記事を、URLのパラメーターを変えて配信しており、記事トップとページネーションされた記事ページが存在する状態で、記事1ページ目が googleに認識されず、2ページ目以降は問題なく認識されています。
一定期間を経てURLパラメータツールで改善したものの、また認識されない状態に戻ってしまいました。
Aトップページと記事の1ページ目が同じコンテンツにしか見えず、重複としてどちらかのページが正規ページとして扱われているのではないか

公式ページの情報は最新かどうか

Q2013年に書かれた公式ページの記事「rel=canonical 属性に関する5つのよくある間違い」にある「間違い1: 複数ページにまたがるコンテンツの1ページ目を rel=canonical のリンク先とする」の記述に関して現在は異なっているなどありませんか?
Aページネイションは廃止など、一部に古い情報はありますが、全体として古くない情報なので大丈夫です。

検索アナリティクスの一部データ表示の基準

Q検索アナリティクス(旧名称。現在は検索パフィーマンスレポート)で、キーワードやURLの絞り込みを行うと一部データしか表示されなくなります。ランダムサンプリングか、何らかの基準で切り捨てのどちらかでしょうか?切り捨ての場合基準を教えてください。また、上記のサンプリング・切り捨てについて、指定した期間の合算か、1日の合算のどちらになりますか?
Aどういった基準で算出しているかは、ヘルプに掲載している以上のことはお伝えできない。

URLパラメータツールはまだ機能しているかどうか

QURLパラメータツールはまだ機能しているでしょうか?
Aはい、機能しています。

アイテム数の多いECサイトのURL制御

QECサイトの一覧ページでサイズや値段を絞り込みによってパラメータつきのURLが生成される場合、クロールを最適化したほうがいいのでしょうか?
最適化の方法としては、1.robots.txtでブロックする。2.canonicalする。の2つ。
Adisallowすると何度もクロールされてしまう可能性があるので、2.canonicalがいい。2つの視点が必要で、URLパラメータツールやcanonicalを使い、「クロールされる余計なページを増やさない」「インデックスシグナルを統合する」ことが大切。

商品の構造化データに関する仕様確認

Q構造化データにネストすべき商品のレビューは1件でいいのか、複数行うべきなのか
A構造化データに関する一般的なガイドラインに記載しているとおり、表示されるレビューを全て含める必要があります。

PDFもCWVの評価対象になるかどうか

QSearch ConsoleのCWV(コアウェブバイタル)レポートの類似URLにPDFファイルが含まれていたが、PDFも評価対象になるでしょうか? PDFのCLS(Cumulative Layout Shift)はどのような対処をすれば良いのでしょうか?
ACWVは、ファイルタイプの制約はありませんが、対象デバイスはモバイルのみであることに注意して頂けたらいいかなと思います。PDFページをいくつか確認したが、CWVの数値に特に問題はなさそうです。※CLSは質問の意図が不明とのことで回答がありませんでした。
CLSとは?
CLSは、ユーザーが意図せぬレイアウトのずれがどれぐらい発生したかを、Google独自の「レイアウトシフトスコア」で表す数値で、値が小さいほどUXが良い指標です。※例えば、記事を読み始めたら、画像や広告が少し遅れて出現し、本文が下にずれてストレスを感じる。

埋め込みページはあるがなしと警告される

Q動画はあるのに「コンテンツの不一致:埋め込み動画なし」と警告が出ているページがあり、対応が分かりません。
Aこのメッセージは警告なので、検索結果にはAMPページが表示されているため現時点では気にしなくていい。
ただし、このケースではAMPページと非AMPページとのペアリングが適切にできていないので、将来的には構成を見直すことをお勧めします。
「Google 固有のAMPの問題」ページより抜粋
正規のウェブページに埋め込まれている動画が、対応する AMP バージョンに埋め込まれていません。通常、正規のウェブページにある重要なコンテンツ リソースはすべて、対応する AMP バージョンに含めることをおすすめします。注: 動画は URL で検出されるため、同じ動画を 2 つの異なる URL で参照している場合は、この警告が表示されます。

Article構造化データimageプロパティの詳細

Q AMPページ内に、amp-imgタグで掲載していない画像を、Article構造化データのimageプロパティに記述することは問題があるかどうか分かりません。article構造化データのimageプロパティのガイドラインを読んでも判断がつかないので教えてください。
A質問の意図がよくわからなかったので、一般的な回答としては「記事に直接属するマークアップされた画像のみを指定する必要があります」は、記事内に存在する画像を構造化データに記述することを示します。「全てのページに画像を少なくとも1つ含める必要があります」はArticle構造化データのimageプロパティのことを指します。
これらは、AMPページの画像に関するガイドラインに記述されているので、よく読んでいただければ多分意味がわかるんじゃないかと思う。

Q&AとFAQリッチリザルトレポートの変更

Qデータアノマリズインサーチコンソール(Data anomalies in Search Console)に記載されているルートレベル(root level)とは何でしょうか?変更前はルートレベルだけが検証対象だったのに対して、変更後はルートレベルの下も検証対象になっています。
A書籍に関する構造化データのページを見ていただくとそうわかりやすいかもしれない。
書籍の構造化データにおける作品(最上位エンティティ)とエディション(下位レベルのエンティティ)のように、これまでは最上位(roo)しか見ていなかったものを、下位(rootの下)レベルも見るようになったのではないかと思います。
参考 書籍Google検索セントラル

よくある質問リッチリザルトの実装

Qよくある質問ページを実装しリッチリザルトで表示されました。ですがHTMLタグを含んだ構造化を行った際、HTMLタグ部分だけ表示されません。エスケープ処理はしており、リッチリザルトテストツールでは正常に表示されていますが、HTMLタグ部分だけ表示されないので、表示させる方法があれば教えてください。
A実際に確認したところ、テストツールでも表示されていなかったので、見直してもらいたい。
仕様などについてどうなっているかというのは確認中で、何かこちらについてお伝え出来ることがあれば伝えます。

ガイドライン違反リンクのGoogleの対処

Qジョン・ミューラーのツイートにあった「ガイドラインの違反者リンクに対しては現在無効化する方針でペナルティも与えることは通常ない」為、うまく順位が上がればしめたものですが、もう少し詳しく説明してもらえるでしょうか?
Aリンクスパムは自動または手動のスパム対策の対象になっています。 ジョン・ミューラーのツイートについては、ガイドライン違反リンクを利用しているサイトが上位表示されていたとしても、そのリンクを無効化している、というニュアンス。
有料リンクを買っても得することはなく、リンクに関して手動対策とかされないのであれば買った人が得するじゃないかみたいなことは全然ないので安心してください。
参考 リンクプログラムGoogle検索セントラル

Adsenseの規約違反かどうか

Qテレビをスクリーンショットして違法アップロードをしているブログが、6年間Adsenceで広告収入を得ています。
テレビ局が許可したわけでもなく紛れもない著作権侵害の違法行為なので、通常であればこうしたサイトは審査にも通らないと思いますが、Adsenceの規約違反でないとされているのでしょうか?
Aこの質問は自然検索についてではなく、Adsenceのポリシー違反してるかどうかというのは分からないので、Adsenseチームのポリシー違反についての窓口に報告してほしい。
著作権者ではあればDMCAを行ったり、サイトのオーナーに直接お話をされると良いかなと思います。

フィードバックは何のため?

QGoogle 検索も、いろんなところからフィードバック送信をできますが送ったところで半年・1年経過しても改善されたことがなく、送ったところでガス抜き用途でしかないのでしょうか?
A 「Google 検索結果の品質向上に協力する」のヘルプには、「お送りいただいたフィードバックが検索結果でのページランキングに影響することはありません」という記述があります。 ランキングの変更に影響することに期待して送ってもらうものではありません。
例えばGoogleのスパム対策をする人たちと、ポリシーを作る人たちなど細部に分かれたチームがおり、全くそれぞれ別々のチームでフィードバックを活用しています。 誰か一つの意見の意見を取り入れて改善に使うことはなく、いただくフィードバックは膨大な量のため、定量的に判断しています。ランキングに対する不満は無数にあるので、優先順位をつけて対応してます。
僕らは、良い形で影響があるような形で改善を行っているので、フィードバックは送らないと全く知りようがなく、複数届いていれば気づきやすくなることもあるのでお気軽にすごく多くお送りいただけるといいかなと思います。

今回のGoogleオフィスアワー振り返り

今回のGoogleオフィスアワーを見て、改めて再確認できたのは「重複コンテンツはペナルティにはならない」の部分でしょうか。

これは、過去のオフィスアワーでも何回か言及されているようです。

「重複コンテンツはペナルティになる説」を過去に聞きその通りだと思っていましたが、「重複コンテンツはペナルティ(手動による対策)にはならない」のを、今回ちゃんと知ることができたオフィスアワーでした。

中の人
中の人

重複コンテンツのペナルティ、恐るに足らず!(震え声)。ですが、色々怖いので紹介のあったこの記事を見て学びますw

最後に金谷さんとあんなさんより、動画の高評価とチャンネル登録をお願いしますとのことで、動画を見た際は、忘れずに高評価とチャンネル登録をしましょう。

YouTube

この記事でご紹介の「Google 検索オフィスアワー 2021.3.25」の動画はこちらから見れます。

3月25日にGoogle検索オフィスアワーが開催されました。Googleの金谷さんとあんなさんが回答した内容のまとめです。