OpenAI / ChatGPT には Web キャッシュがあります

OpenAI の ChatGPT Web 検索機能は、Web キャッシュ、つまり以前にクロールされた Web ページのオフラインでローカルに保存されたバージョンを提供します。すべての検索エンジンは、Web ページのキャッシュされたバージョンを保存しているため、これは驚くべきことではありません (たとえそれが私たちに表示されなかったとしても)。

Amy Rigby 氏はこの件について LinkedIn に投稿し、「SEO/AEO の専門家は何ヶ月もの間、OpenAI が Web ページの “隠れたキャッシュ インデックス” を構築していると主張してきました (H/T James Berry 氏と Jérôme Salomon 氏)。OpenAI はこのヘルプ記事でそれを確認しただけでしょうか。」と書いています。

これはそのヘルプ ドキュメントで、「オフライン Web 検索は、対象となる ChatGPT ワークスペースの Web 検索構成です。これにより、ChatGPT は、各リクエスト時にライブ Web 検索を使用する代わりに、OpenAI のインデックス付けされキャッシュされた Web コンテンツを使用できるようになります。」と書かれていることがわかります。

キャッシュについて言及している行は次のとおりです。

  • これにより、ChatGPT は各リクエスト時にライブ Web 検索を使用する代わりに、OpenAI のインデックス付けおよびキャッシュされた Web コンテンツを使用できるようになります。
  • オフライン Web 検索が有効になっている場合、ChatGPT は OpenAI のインデックス付けおよびキャッシュされた Web コンテンツを Web 検索に使用します。
  • これは、ChatGPT が OpenAI インデックスまたはキャッシュですでに利用可能なページから情報を返すことができることを意味します。
  • ページまたは URL がインデックスまたはキャッシュで利用できない場合、ChatGPT はオフライン Web 検索を通じてそれを取得できません。
  • キャッシュまたはインデックス付きの Web アクセスがデフォルトで有効になっている、規制されたワークスペース構成を使用します。
  • 特定のページは、サイト、クロール アクセス、キャッシュ、人気、その他の技術的要因に応じて、異なるスケジュールで更新される場合があります。
  • ユーザーが ChatGPT に特定の URL を使用するように要求した場合、オフライン Web 検索は、そのページがインデックスまたはキャッシュで利用可能な場合にのみその URL を使用できます。
  • オフライン Web 検索の結果には、ページがインデックス付けまたはキャッシュされた正確な時間が含まれない場合があります。
  • リクエスト時にライブ外部 Web 検索を使用するのではなく、Web 検索を OpenAI のインデックス付けおよびキャッシュされた Web コンテンツに制限します。
  • オフライン Web 検索ではすべてのリスクが排除されるわけではありません。インデックス付けまたはキャッシュされた Web コンテンツには、不正確な情報、不完全な情報、古い情報、または悪意のある指示が含まれている可能性があります。
  • オフライン Web 検索が広範なセキュリティ モードなしで有効になっている場合、検索では OpenAI のインデックス付けおよびキャッシュされた Web コンテンツが使用されるという理由だけで、ほとんどの ChatGPT 機能が変更されるべきではありません。
  • オフライン Web 検索が有効になっている場合、ユーザーは、ChatGPT は引き続き Web を検索できますが、結果はリクエスト時にライブの外部検索プロバイダーではなく、OpenAI のインデックス付けされキャッシュされた Web コンテンツから取得されることに気づくかもしれません。
  • オフライン Web 検索では、インデックス付けされキャッシュされたコンテンツが使用されます。
  • ChatGPT はページがいつキャッシュされたかを表示できますか?いつもではありません。ワークフローに信頼できるタイムスタンプが必要な場合は、アップロードされたソース素材、公式文書、または別の承認された記録ソース プロセスを使用してください。

この表を使用して、オフライン Web 検索がワークフローに適しているかどうかを判断します。

Chatgpt キャッシュ チャート