Microsoftは9月22日(現地時間)、Microsoft Bing Blog「 Announcing new options for webmasters to control usage of their content in Bing Chat」において、Webサイトの管理者がBingチャットでのコンテンツ使用を制御するための新しいオプションを発表した。
このオプションを使用することで、自社のサイトのコンテンツが意図せずにBingチャットのバックグラウンドにあるAIの学習に利用され、回答として表示されることを防げるようになる。
Microsoftが利用するのは、メタ情報としてHTMLに埋め込まれるNOACHIVEタグおよびNOCACHEタグである。NOACHIVEタグは、検索エンジンにキャッシュを残さないよう指示するための情報としてすでに広く使われている。通常は、次のようなmetaタグをHTMLに記述しておくことで、検索エンジンへのキャッシュを避けることができる。
<meta name=”robots” content=”noarchive”>
Microsoftでは、このNOACHIVEタグと、新たに定義するNOCACHEタグを、AIの学習およびBingチャットの回答にも反映させるという。具体的には、これらの値は次のように扱われる。
- NOACHIVEタグおよびNOCACHEタグがないコンテンツはAIモデルの学習に使用され、Bingチャットの回答に含まれる可能性がある
- NOCACHEタグが付けられたコンテンツは、URL、タイトル、およびスニペットのみがAIモデルの学習に使用される可能性がある。Bingチャットの回答にも、URL/スニペット/タイトルのみが表示される
- NOARCHIVEタグが付けられたコンテンツは、AIモデルの学習には使用されず、Bingチャットの回答にも含まれない
- コンテンツにNOCACHEタグとNOARCHIVEタグの両方がある場合、NOCACHEとして扱われる
最後の挙動は、既存のNOARCHIVEタグを含むコンテンツの扱いに影響を与えないための処置だと考えられる。現状、多くのWebサイトがNOARCHIVEタグを使用しているため、MicrosoftではそれらのWebサイトの管理者に対して、Bingチャットを活用するために次のようにNOCACHE値を追加することを推奨している。
<meta name="robots" content="noarchive, nocache">
また、Bingに対してのみ明示的にNOCACHEであることを通知するために、次のようにbingbotを対象としてNOCACHEタグを埋め込む方法もある。
<meta name="robots" content="noarchive"> <meta name="bingbot" content="nocache">
自分のコンテンツが生成AIに利用されることを制御したい製作者にとって、このようなオプションが増えるのは喜ばしいことである。Microsoftは、今後もパブリッシャーやWebエコシステムとのコミュニケーションを継続していくという。