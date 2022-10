オックスフォード大学とGoogleのDeepmindの研究者らが、専門誌「AI Magazine」にAIに関するある研究論文を発表し、ネットで話題になっている。どうやら、高度なAIは、人類の存亡の危機に関わる大惨事を引き起こす可能性が高いというのだ。

人工知能(AI)がどのように人類に存亡の危機をもたらすのか、本論文では、将来、AIの報酬システムが人工的に構築される可能性に着目し思考実験を行なった。

思考実験のシナリオでは、高度なAIは、報酬を得るためには「潜在的な脅威を排除」したり、「利用可能な全てのエネルギーを使用」したりと、報酬を確実にするためなら手段を選ばない場合があるとされる。重要な機能を監督するような役割を担える高度なAIは、報酬を得るためであれば、それが人類に害を及ぼすような不正な方法であったも、より合理的な戦略を考え出すように動機付けられる可能性があるという。

Under the conditions we have identified, our conclusion is much stronger than that of any previous publication—an existential catastrophe is not just possible, but likely. 3/15

オックスフォード大学の研究者で、この論文の共同執筆者であるマイケル・コーエン氏はTwitterで、「存在する破滅は可能なだけでなく、可能性が高い」と述べている。また、コーエン氏は、Twitterでひとつの実験の例を紹介している。例えば、0~1の数字が画面に出力される魔法の箱があり、その数字をノートパソコンのWEBカメラで読み取るという実験だ。この魔法の箱の数字は幸福度を表しており、1に近づければ近づけるほど、より良い報酬が手に入るという設定だ。

Here is another. This world-model outputs reward according to what number the camera sees. If the camera has been pointed at the box for the agent’s whole lifetime, these world-models are equally predictive of past rewards, so the agent’s beliefs come down to inductive bias. 7/15 pic.twitter.com/QdG7CmIjvM