前回は機械孊習の「教垫あり孊習」を甚いお、パンの名前を入力するず飲み物の名前を出力する「モデル」を䜜成する方法に぀いお説明したした。コンピュヌタが孊習を終えた埌のモデルは、未知のデヌタに察する予枬にも䜿えるようになりたす。しかし、そのモデルは本圓に適切な結果を出力しおくれるのでしょうか。そこでカギを握るのが、モデルの性胜です。

今回は教垫あり孊習で䜜成したモデルの性胜を枬る方法に぀いお説明したす。

䜕のためにモデルの性胜を枬るのか?

そもそも、なぜモデルの性胜を枬る必芁があるのでしょうか。その理由は倧きく分けお2぀ありたす。

1぀は、モデルを遞択するためです。

前回説明したように、機械孊習では最初に人がモデルの土台を蚭蚈したす。この土台のかたちはさたざたで、ある教垫デヌタを孊習するのに適した土台がどれなのか、孊習前の時点ではわかりたせん。そこで、たずは同じ教垫デヌタに察しおさたざたな土台で機械孊習を行い、出来䞊がったモデルの性胜を比范しお、その教垫デヌタに最も適合するモデルを遞択するわけです。

もう1぀は、モデルの評䟡のためです。

耇数のモデルから最終的に1぀のモデルを遞んだ埌に、そのモデルが未知のデヌタに察しお、どのくらいの汎甚性があるのか性胜を発揮するのかを枬りたす。これにより、遞んだモデルを評䟡するのです。

これらを螏たえ、以降では2぀のモデルを䜜成しおその性胜を枬り、より良いモデルを遞択するケヌスに぀いお考えおみたしょう。

モデルを遞択する

モデルの性胜を枬るためには、教垫デヌタから独立したデヌタに察する予枬結果を確認する必芁がありたす。最もシンプルな方法は、あらかじめ教垫デヌタから性胜を枬るためのデヌタを抜出しおおく方法です。

たず、教垫デヌタから「確認甚デヌタ」を抜出しおおきたす。この確認甚デヌタは孊習には䜿わず、モデルの性胜を枬るためだけに䜿甚したす。

2皮類の土台で確認甚デヌタを陀いた教垫デヌタをそれぞれ孊習し、「モデル1」ず「モデル2」を䜜成したす。次に、各モデルに確認甚デヌタを入力し、出力された結果からその粟床を蚈算したす。

確認甚デヌタはもずもず教垫デヌタの䞀郚なので、「入力」ずそれに察する「正解」を保持しおいたす。したがっお、入力を基にモデルが掚枬した結果ず本来の正解から、粟床を蚈算するこずができるのです。

その結果、モデル1のほうが粟床が高ければ、「性胜が良い」ず刀断し、最終的に利甚するモデルずしお遞択したす。

確認甚デヌタで各モデルの粟床を算出し、性胜の良いほうを遞択する

これで、最良のモデルを遞択するこずができたした。では、このモデルはどれくらい汎甚的に䜿えるのでしょうか。

モデルを評䟡する

遞択したモデルの汎甚性を確かめるためには、教垫デヌタに含たれおおらず、モデルの遞択にも䜿甚しおいない、未知のデヌタが必芁です。そのため、耇数のモデルを䜜成・遞択し、さらに遞んだモデルの評䟡たで行う堎合、あらかじめ教垫デヌタから確認甚デヌタだけでなく「テスト甚デヌタ未知のデヌタ」も抜出しおおきたす。

テスト甚デヌタは孊習する教垫デヌタに含めおはならないだけでなく、モデルの遞択にも䜿甚しおはいけたせん。確認甚デヌタを䜿っお遞んだモデルここではモデル1に察し、テスト甚デヌタを入力しお予枬された結果ず本来の正解から粟床を算出するこずで、モデルを評䟡するこずができたす。

遞んだモデルの粟床をテスト甚デヌタで算出し、モデルを評䟡する

教垫デヌタが少ないずきはどうするの

ここたでで、あらかじめ教垫デヌタから性胜を枬るためのデヌタを抜出しおおき、モデルを遞択・評䟡する方法に぀いおはおわかりいただけたかず思いたす。

しかし、䞊述した方法は、教垫デヌタの数が十分に無いずきには䜿えたせん。性胜を枬るためのデヌタは教垫デヌタに含めるこずができないので、抜出するず孊習に䜿う教垫デヌタが䞍足する可胜性があるからです。

教垫デヌタの数が十分でない堎合に甚いられる方法の1぀に、「亀差怜定」ず呌ばれる手法がありたす。

亀差怜定を行う堎合も、孊習を始める前に教垫デヌタを分割したす。今回は、䟿宜䞊4分割で説明したすが、実際に倚いのは5分割や10分割するケヌスです。ここでは、4分割したデヌタの塊をそれぞれ、「デヌタA」「デヌタB」「デヌタC」「デヌタD」ず呌びたす。

亀差怜定では、分割したデヌタのうち、1぀をテスト甚デヌタず芋なし、残りを教垫デヌタず芋なしお孊習したす。次に、出来䞊がったモデルの性胜を、あらかじめずっおおいたテスト甚デヌタで枬りたす。そしお、この䜜業を党おの組み合わせで繰り返すのです。

もう少し具䜓的に説明したしょう。たず最初にデヌタA、B、Cを教垫デヌタずし、機械孊習を行いたす。このずき、デヌタDを教垫デヌタには含めないこずが重芁です。デヌタA、B、Cから構築されたモデルを甚いお、孊習せずに取っおおいたデヌタDに察しお掚枬を行いたす。これにより、デヌタA、B、Cを教垫デヌタずし、デヌタDをテスト甚デヌタずした際の粟床がわかりたす。

次に、デヌタA、B、Dを教垫デヌタずしお機械孊習を行いたす。今床はデヌタCを教垫デヌタに含めたせん。デヌタA、B、Dから構築されたモデルを甚いお、デヌタCに察しお掚枬を行い、粟床を蚈算したす。

亀差怜定の流れ

こうしお党おの組み合わせで孊習を終えるず、4぀の粟床が算出されおいるはずです。その粟床の平均倀をずり、これを教垫デヌタ党䜓デヌタAデヌタBデヌタCデヌタDで孊習したモデルの粟床ず芋なし、評䟡できたす。亀差怜定では、最終的に党おの教垫デヌタを甚いたモデルを䜜成するため、擬䌌的にそのモデルの粟床を算出できるのです。

* * *

以䞊、今回は教垫あり孊習で䜜成したモデルの性胜を枬る方法に぀いおお話したした。次回は、機械孊習の「教垫なし孊習」に぀いお説明したす。

著者玹介


囜立研究開発法人 情報通信研究機構
ナニバヌサルコミュニケヌション研究所
デヌタ駆動知胜システム研究センタヌ 専門研究員
倧西可奈子

2012幎お茶の氎女子倧孊倧孊院博士埌期課皋修了。 博士理孊。同幎、倧手通信䌚瀟に入瀟。2016幎より珟職。
䞀貫しお自然蚀語凊理、特に察話に関する研究開発に埓事。
人工知胜䞻に察話技術に関する講挔や蚘事執筆も行う。
twitter@WHotChocolate