今回のテーマは「テキストマイニング」である。

実はこのテーマの前に2つほどテーマを提示されていたが、1ミリたりとも分からなかったので無視した。

テキストマイニング: 大量のテキストデータから、「隠れた」情報や特長、傾向、相関関係を探し出す技術。自由記述されたデータ(定性情報)をもとに行うデータマイニング(マクロミル・デジタルマーケティング用語より)

おそらく、これだけではさっぱりわからないと思うので例を出そう。

まず、このコラムをまとめた文庫「もっと負ける技術」を買って、読まずに燃やしてまた買う。その次に、私が「猫工船」という漫画を連載している週刊スピリッツという雑誌を買う。雑誌が売れても私には一銭も入らないので、これは燃やさなくてもいい。それから、雑誌の巻末あたりにある読者アンケートを切り取る。この時、いつものノリで燃やしてしまわないように注意が必要だ。

そして「一番おもしろかった作品は」の質問に「猫工船」の番号を記入し、「ご自由にご意見をお書きください」の欄に「猫工船、読んでないけどおもしろかった」と書いて、ポストにダンクする。これで任務完了だ。

雑誌を1ページも読まないことがコツである。他の作品を読んでしまっては、「一番おもしろかった」の欄には他の作品の番号を書きたくなるだろうし、まかり間違って猫工船を読んでしまっては、とても自由欄に「猫工船がおもしろかった」とは書けなくなる。私の漫画は読んでない状態が一番ベストかつおもしろいのである。

「ご自由なご意見」をデータ化

この時点で意識の高いビジネスパーソンとしての仕事は終わりなので、このコラムもこれ以上読まなくていいし、テキストマイニングの意味など知らなくていいのだが、一応言っておくと、つまりこの「ご自由にご意見をお書きください」に書かれていることを、集計、データ化するのがテキストマイニングである。

従来も○×や番号ぐらいなら自動集計できていただろうが、自由欄に書かれた「今週の表紙グラビアの娘と結婚したいのですがどうしたらよいですか」等の、文字通りフリーダム過ぎる意見を自動集計、データ化するには膨大な時間とコストがかかっていた。それを可能にしたのがテキストマイニングという技術である。もちろん、集計するだけでなく、傾向を読み取ったり、そこに隠された情報さえも見つけ出したりしてくるらしい。

畳一万畳分の思いのたけを分析

例えば、「オタク女」という括りだけで集めた1万人にA4大の白紙を1枚渡して「自分の好きなキャラクター、カップリング、萌えるシチュエーション、なんでも自由に書いてください」と言ったら、まず「こんな紙一枚に書ききれるか」と1万人中1万人がキレて辺り一面血の海になるので、各人に畳一畳分のスペースを与えて、思いのたけを書いてもらったとする。

それをテキストマイニングすると、そこから「○○」や「××」というキャラクター名を拾いだし、「今オタク女子の間では○○というキャラクターが人気」と読み取るのである。また、そのアンケートから回答者が、腐女子なのか、あるいは夢豚かなどの属性も読み取り、「××は腐女子には人気だが夢豚にはそうでもない」などの分析もしてくれる。

さらに、キャラクター名などが直接書かれていなくても、「バブみを感じる」「オギャりたい」「ドチャシコ大戦争」など特徴的な地獄ワードを拾いだし、今オタク女子が求めているキャラクター像なども割り出すことが可能なのだ。

この時点でテキストマイニングシステムが自爆を選ばないか心配になってくるが、「明言していなくても、そこに隠された真意まで読み取ってくれるようになった」というわけである。

実に画期的なシステムである。だが、今まで書いてきた私の文章をテキストマイニングすると言われたら断固拒否だし、システムの爆破も辞さない。何故なら、テキストマイニングが「真意を読み取る」と言っても、「ここには触れられたくないだろうから、『そっとしておこう』」と判断できるところまでは行っていないはずだからだ。

よって、私の文章を読み取ったら、「同じことを何回も書いているので、こいつは二週間で前書いたことを忘れる」とか、「『である』『つまり』多すぎ」など、わかられたくないところまでわかられてしまうに決まっている。

文章の傾向だけならまだいいが「こいつは下ネタを多用し、あたかもそういった話題に対してフランクなのだと見せかけて、自分の恋愛やセクシャルなことには一切触れていない。そこに大きなコンプレックスがあると考えられる」などと深層心理まで読まれたら、その場で自爆するしかない。

「彼が私のことわかってくれない、最悪」という女の愚痴はよく聞くが、だからと言って、短所を的確に指摘したら猛ビンタが飛んでくる。つまり「私のわかってほしいところだけわかってくれない男は最悪」なのだ。

我々は大なり小なり、他人に対して「わかってほしい」「察して欲しい」と思っているものだが、「ここだけはわかられたくない、そっとしておいてほしい」と思っている部分もある。

テキストマイニングでその部分をあぶりだすことはできるかもしれないが、そこに言及するか触れないでおくかは、やはり人間の采配である。


<作者プロフィール>
カレー沢薫
漫画家・コラムニスト。1982年生まれ。会社員として働きながら二足のわらじで執筆活動を行う。デビュー作「クレムリン」(2009年)以降、「国家の猫ムラヤマ」、「バイトのコーメイくん」、「アンモラル・カスタマイズZ」(いずれも2012年)、「ニコニコはんしょくアクマ」(2013年)、「やわらかい。課長起田総司」(2015年)、「ねこもくわない」(2016年)。コラム集「負ける技術」(2014年、文庫版2015年)、Web連載漫画「ヤリへん」(2015年~)など切れ味鋭い作品を次々と生み出す。本連載を文庫化した「もっと負ける技術 カレー沢薫の日常と退廃」は、講談社文庫より絶賛発売中。

「兼業まんがクリエイター・カレー沢薫の日常と退廃」、次回は2016年10月18日(火)掲載予定です。