Googleの検索ランキングの情報が流出した件について


ごきげんよう、アマカラです。本日は、Google検索のランキングシステムの情報が流出したということで、その件についてまとめたいと思います。
この情報はSparkToroのRand Fishkin氏、iPullRankのMike Kimg氏により公表されたもので、流出した情報は本物である可能性が高いと述べています。
Google検索のアルゴリズムが流出したわけではなく、Google検索のAPIについての詳細な内部文章が流出しました。今回の流出の規模は過去にないほど大きく、非常に大きな影響を及ぼす可能性が高いです。
今回、2500ページを超える文書、14000件以上の属性が漏洩してしまったのですが、一番重要なポイントは過去にGoogleが検索ランキングシステムについて言及していた内容と、流出した文章の間で相違があるように見えてしまっている点です。
これまで、Googleのランキングシステムが具体的にどのような内容であるのかは外部からはわからず、Webサイト運用者、SEO担当者は推測、情報を得ながら試行錯誤の上で他のサイトより検索順位を上げる取りくみを多くの時間と費用をかけて行ってきました。
検索順位を上げるために最も重要となる情報は実際にGoogleのランキングシステムを作っているGoogleからの公式なコメントや発言、情報です。
Googleが公開する発言や文章は真実であるはずだと受け止められ、情報共有されています。もし今回流出した情報が正確な情報であれば、大きな衝撃です。
今回流出した文書について注意が必要なのが、この文書の情報が100%正しいとは限らない、この情報に基づいてランキングシステムを運用しているとは限らない、他にも文書がある可能性があるということです。
また、初めはこの流出に関するGoogleからのコメントはされていませんでしたが、Search Engine Landの取材により、Googleの広報担当者からのコメントが発表されました。

「文脈から外れた、古い、または不完全な情報に基づいて検索について不正確な推測をしないように注意します。検索の仕組みやシステムが重視する要素の種類について広範な情報を共有し、検索結果の完全性を操作から保護するよう努めています。」

Google responds to leak: Documentation lacks context



流出した文書の内容

ドメイン権威

サイトの権威指標はウェブサイトの品質と関連性を評価するための重要なものです。これは特定のトピックに対してサイトの権威と信頼性を判断するために役立ち、検索ランキングに影響があります。流出した文書内に書かれていた属性の中で、「siteAuthority」という記述があり、ドメイン・サイトの権威を参照するパラメータは存在しないと公表していたGoogleの発言と矛盾するような属性ではないかと言われています。

サンドボックスの存在

これまでGoogleは新しくできたWebサイトをサンドボックスに属させているという噂を否定してきました。しかし今回の文書の流出で1「sandbox fresh spam」という機能が存在していることが判明しました。これは新しいWebサイトが検索結果で上位表示させることを一時的に留めるための機能です。
また、サイトが存在している期間を判断するための「hostAge」というパラメータが存在することが確認されています。
これは新しいWebサイトが悪質なスパムサイトであるにも関わらず上位表示されてしまうことを防ぐためのストッパーの役割を果たしていると推測されています。このサンドボックスの存在により、新しくできたばかりのサイトは上位に表示されづらく、ある程度の期間、高品質で信頼できるサイトであるのか監視されている可能性があります。

ブラウザからの情報利用

Googleはランキングのブラウザのいかなる種類のデータも使用しないという声明を発表していましたが、Chromeから取得した情報について言及しているページが存在しており、Chromeのデータを保持していることが確認されています。Googleでは「NavBoost」というランキング要素を使用していることが明らかになっており、ユーザー行動のクリックデータに基づいた要素であるだろうと言われています。これは質の高いクリック、より多くのクリックがランキングを上昇させる要因の一つであることを示しています。具体的な指標として

  • badClicks(質の低いクリック)
  • goodClicks(質の高いクリック)
  • lastLongestClicks(検索結果が表示されて最後にクリックして最も長く滞在したページ)
  • unsquashedClicks(特定の条件下で調整されていないクリックデータ)

というものがあることが判明しています。

まとめ

今回のGoogleの内部文章の流出により、非常に大きな影響がありましたが、サイトのどこかを大幅に変える必要があるほどの内容ではないようです。
ユーザーにとって有益な情報を提供するサイトを作りつつ、実験的にテクニカルSEOの取組をしていけば良いのかなと思いました。
弊社ではSEO対策に力を入れたホームページ作成・運用を行っております。是非お気軽にご相談ください。