巨大なGoogle検索ドキュメントリークは、ランキングアルゴリズムの内部の仕組みを明らかにします

リークされたGoogleドキュメントのTowoveは、Google検索内の前例のない外観を提供し、Googleがコンテンツをランク付けするために使用する最も重要な要素のいくつかを明らかにしました。

どうしたの。 Googleの内部コンテンツAPIウェアハウスからのものであると思われる数千のドキュメントは、3月13日にYoshi-Code-Botと呼ばれる自動ボットによってGitHubでリリースされました。これらの文書は、今月初めにSparktoroの共同設立者であるRand Fishkinと共有されました。

Fishkinから学んだことと、Ipullrank CEOのMichael Kingから学んだことを読んでください。彼はドキュメントをレビューして分析しました（そして、すぐに検索エンジンの土地のさらなる分析を提供する計画）。

なぜ私たちが気にするのか。 Googleのランキングアルゴリズムがどのように機能するかを垣間見ることができました。これは、それが何を意味するのかを理解できるSEOにとって非常に貴重です。 2023年、私たちはリークを介してヤンデックスの検索ランキング要因を前例のない見方をしました。これはその年の最大の物語の1つでした。

このGoogleドキュメントリーク？ SEOとGoogle検索の歴史の中で最大の物語の1つになるでしょう。

内容。 FishkinとKingのおかげで、これが内部文書について知っていることです。

現在： ドキュメントは、この情報が3月の時点で正確であることを示しています。
ランキング機能： 2,596モジュールは、14,014の属性を持つAPIドキュメントで表されます。
重み： ドキュメントでは、ランキング機能のいずれかがどのように重み付けされているかを指定していませんでした。
Twiddlers： これらは、「ドキュメントの情報検索スコアを調整したり、ドキュメントのランキングを変更したりすることができる再ランク関数です。
デモット： コンテンツは、次のようなさまざまな理由で降格することができます。
- リンクはターゲットサイトと一致しません。
- SERP信号は、ユーザーの不満を示します。
- 製品レビュー。
- 位置。
- 正確な一致ドメイン。
- ポルノ
履歴を変える： Googleは、これまでにインデックス作成したすべてのページのすべてのバージョンのコピーを明らかに保持しているようです。つまり、Googleはこれまでにページに加えたすべての変更を「覚えている」ことができます。ただし、Googleはリンクを分析するときにURLの最後の20の変更のみを使用します。

リンクは重要です。 衝撃的です、私は知っています。リンクの多様性と関連性は依然として重要です、とドキュメントは示しています。そして、Pagerankは、Googleのランキング機能内でまだ非常に生きています。 WebサイトのホームページのPagerankは、すべてのドキュメントに対して考慮されます。

これは、Googleの広報担当者が「トップ3のランキングファクター」ではないリンクや、ランキングではそれほど重要ではないリンクについて嘘をついていることを証明していません。 2つのことが一度に当てはまることがあります。繰り返しますが、これらの機能のどれがどのように重み付けされているかはわかりません。

クリックが成功しました。 これは衝撃的ではありませんが、うまくランク付けしたい場合は、ドキュメントに基づいて、優れたコンテンツとユーザーエクスペリエンスを作成し続ける必要があります。 Googleは、さまざまな測定値を使用しています バッドクリック、 グッドクリック、 LastLongestClicks そして クエロシュクリック。

また、より長いドキュメントが切り取られる場合がありますが、コンテンツの短縮は独創性に基づいてスコア（0-512）を取得します。スコアは、健康やニュースなど、あなたの人生のコンテンツにも与えられます。

それはどういう意味ですか？キングによると：

「（y）ouはもっと運転する必要があります成功より広いクエリのセットを使用してクリックし、ランク付けを続けたい場合は、より多くのリンクの多様性を獲得します。概念的には、非常に強力なコンテンツがそれを行うので、それは理にかなっています。より適格なトラフィックをより良いユーザーエクスペリエンスに駆り立てることに焦点を当てると、ページがランク付けするに値する信号をGoogleに送信します。」

米国対Googleの反トラストトライアルの文書と証言により、Googleはランキングでクリックを使用していることが確認されました。私たちの報道から詳細をご覧ください：

7つのGoogle検索ランキングドキュメントを反トラスト試験展示
GoogleのPandu Nayakによると、Googleの検索とランキングの仕組み

ブランドの問題。 フィッシュキンの大きな持ち帰り？ブランドは何よりも重要です：

「オーガニックの検索ランキングとトラフィックを大幅に改善しようとするマーケティング担当者に普遍的なアドバイスがあった場合、「Google検索以外の顕著な、人気のある、よく認識されたブランドを構築してください。」」

エンティティが重要です。 著者の生活。 Googleは、コンテンツに関連する著者情報を保存し、エンティティがドキュメントの著者であるかどうかを判断しようとします。

SiteAuthority： Googleは「SiteAuthority」と呼ばれるものを使用しています。

Googleは、パンダの更新が開始された後、このようなことが2011年に存在したことを教えてくれました。
しかし、Googleはそれ以来、長年にわたってウェブサイトの権限のスコアを持つことを拒否しました。

クロムデータ。 呼ばれるモジュール Chromeintotal GoogleがランキングにChromeブラウザのデータを使用していることを示します。

ホワイトリスト。 いくつかのモジュールは、Googleのホワイトリストに選挙と共同体に関連する特定のドメインを示しています – IselectionAuthority そして iscovidlocalauthority。 Google（およびBing）には、「特定のアルゴリズムがWebサイトに不注意に影響を与える」場合、Google（およびBing）には「例外リスト」があることを知っていましたが。

小さなサイト。 別の機能はです smallpersonalsite – 小さな個人サイトまたはブログ用。キングは、GoogleがTwiddlerを介してそのようなサイトを後押しまたはデモットできると推測しました。しかし、それは未解決の質問のままです。繰り返しますが、これらの機能がどれだけ重み付けされているかはわかりません。

その他の興味深い発見。 Googleの内部文書によると：

新鮮さの問題 – グーグルは署名の日付を見ています（bylinedate）、url（syntacticdate）およびページのコンテンツ（semanticdate）。
ドキュメントがWebサイトのコアトピックであるかどうかを判断するには、Googleがページとサイトをベクトル化するには、ページの埋め込みを比較します（SiterAdius）サイトの埋め込み（sitefocusscore）。
Googleはドメイン登録情報を保存します（登録info）。
ページタイトルはまだ重要です。 Googleには呼ばれる機能があります titlematchscore これは、ページタイトルがクエリとどれだけうまく一致するかを測定すると考えられています。
Googleは、ドキュメント内の用語の平均加重フォントサイズを測定します（Avg Termweight）およびアンカーテキスト。