ここ数年、世界中でサイバー攻撃が激化している背景として、新種のマルウェアが日々大量に発生していること、マルウェア自体がより高度化していることが挙げられる。一方、従来型のシグネチャ方式やサンドボックスでの対策には限界がきているといわれている。そうしたなか、新しいテクノロジーとして注目を浴びているのがAI(人工知能)を利用した検知、防御システムだ。なかでもディープラーニング(深層学習)を活用したセキュリティ対策は、進化が止まらないサイバー攻撃に対抗するための切り札として最近注目を集めている。そこで本連載では、この「ディープラーニング×セキュリティ」にフォーカスし、その特徴や強みが"5分で"理解できるようにしたい。

5分でわかる! ディープラーニング×セキュリティ
第2回記事「世界初のディープラーニング×セキュリティ製品はここが凄い! 」は こちら

ブームと冬の時代を繰り返したAIの歴史

第1回となる今回は、「ディープラーニング×セキュリティ」について正しく理解するための前提として、「AI」と「エンドポイントセキュリティ」それぞれの歴史を簡単に振り返ってみよう。

まずは、セキュリティに限らずあらゆる分野でいま話題のAIだが、実はAIの研究の歴史は意外と古く、1950年代から続いている。しかしこの間にはブームと冬の時代が交互に繰り返されており、「第三次AIブーム」と呼ばれ脚光を浴びているのが現在だ。

では、第一次AIブームがいつ頃だったのかといえば、1950年代後半~1960年代とほとんどコンピューター黎明期といってよい時代にまで遡る。この頃コンピューターによる「推論」や「探索」が可能となり、特定の問題に対して解を提示できるようになったことがブームを引き起こしたのだ。しかし当時のAIでは、単純な問題を扱うことはできても、現実社会における複雑な課題を解くことはできないことが明らかになり、人々の熱は冷め冬の時代を迎えたのである。

実は、ディープラーニングで用いられている人間の脳神経を参考にした「ニューラルネットワーク」に基づいた理論は、この時代から存在していた。やはりAIにしても、人の学習プロセスを模写するのが一番効率がよいという考えから理論が形成されたのだ。しかしながら、当時のコンピューターの処理能力をはじめさまざまな制約により、当時実用レベルに達することはなかった。

続く第二次AIブームは1980年代に起こった。これは十分な情報を扱えるようになったAIが実用可能な水準に達したことが背景にあった。この頃、エキスパートシステムと呼ばれる専門分野での推論を得意とするAIが様々な分野で誕生した。とりわけ日本では、AI型コンピューターの実現を目指し、政府による「第五世代コンピュータ」プロジェクトが推進された。しかし、当時のコンピューターは必要な情報を自分で集め、蓄積することはできなかったため、膨大な情報を学習させるには限界があった。そのため特定の領域に限定してAIが活用されただけで、1995年頃から再び冬の時代を迎えてしまう。

そして2000年代から現在まで続いているのが第三次AIブームだ。ブームのきっかけは、「ビッグデータ」を用いることで「機械学習」が実用化されたことにある。機械学習により、AIが学習を繰り返しながら精度を向上させていくというアプローチが可能となったのだ。

さらに、この機械学習から発展したのが現在のAIブームの主役ともいうべき「ディープラーニング」である。深層学習や特徴表現学習とも呼ばれるディープラーニングは、人間の手でデータの特徴点(目の付けどころ)を抽出しなければいけなかった従来の機械学習に対し、ビッグデータをもとに特徴点を自動的に見つけ、繰り返し学習することができる点に最大の特長がある。先述したニューラルネットワークで構成されるディープラーニングの知能は、ビッグデータを処理し、分析したデータを深くそして非常に正確に理解することができるのだ。こうした特性からディープラーニングは、音声・画像処理や自動運転、医療での検査の診断、そしてサイバーセキュリティなど、さまざまな分野で技術革新をもたらしているのである。

時代とともに強化されてきたエンドポイントセキュリティ

今度はエンドポイントセキュリティの進化の歴史を辿っていこう。

  • シグネチャ
    マルウェア検知における旧来の技術であり、アンチウイルスエンジンがファイル内のコンテンツを既知のマルウェアシグネチャと比較することで検知するという仕組みとなる。このため未知のマルウェアについてはシグネチャに反映されるまで数ヶ月を要すこともあり、昨今のように新規のマルウェアが次々と出回る状況では検知が困難となり感染を阻止できなくなっている。

  • ヒューリスティック
    主に既知のマルウェアコードに使われる振る舞いの特徴をもとにマルウェアを検知する技術の総称であり、シグネチャベースの検知と一緒に使われるケースが多い。

  • 振る舞い検知
    マルウェアの動作時の振る舞いフィンガープリントを解析して検知する。このため、悪意のある動作が行われないとマルウェアを検知することができない。

  • サンドボックス
    振る舞い検知の進化系であり、プログラムを仮想環境で実行してその動作を解析して検知する。効果的な手法ではあるものの、機器への負荷が大きいことからエンドポイント対策には向いていない。さらに、最近のマルウェアのなかにはサンドボックスでの動作を避けるようなタイプも現れている。

  • 機械学習
    専門家がマルウェアを解析して定義した特徴に基づいて、ファイルを悪意のあるものと安全なものに分類する。機械学習を行うには、人の手によりファイルの各構造的特徴を最小単位に分解しなければならない。

  • ディープラーニング
    前述した脳の学習能力をモデリングして学習させる手法であり、外からの補助を必要とせずに、あらゆる種類のデータから自律的に学習を進めることができる。サイバーセキュリティの世界にディープラーニングを取り入れることで、マルウェア全般、とりわけ未知のゼロデイ脅威の検知率が着実に改善されることとなった。

ディープラーニングを活用した実戦的なエンドポイントセキュリティ

AIとエンドポイントセキュリティの歴史を振り返ったことで、「ディープラーニング×セキュリティ」の本質が少し見えてきたのではないだろうか。機械学習とディープラーニングとの最大の違いは、未知のデータに対して正解することができる能力である「汎化性能」にある。人手により特徴点を教えなければならない機械学習に対して、自分でいくつものファイルを読み込んで学習を繰り返していくディープラーニングのほうが、汎化性能ははるかに高いのだ。つまり、マルウェア検知においても、ディープラーニングはより実戦的な手法となるのである。

ニューラルネットワークを用いたディープラーニングを世界で初めてセキュリティに取り入れたのが「Deep Instinct」である。「Deep Instinct」は、被害が発生する前に脅威を検知するNGEPP(Next Generation Endpoint Protection)製品であり、リサーチラボで何百万のマルウェアをディープラーニングテクノロジーによって繰り返し学習した予測モジュール「D-Brain」を利用することで、未知のマルウェアに対しても実行される前にリアルタイムで検知し、ブロックすることが可能なのだ。

次回以降は、「Deep Instinct」が実現する「ディープラーニング×セキュリティ」の具体的な仕組みと効果について解説していきたい。

5分でわかる! ディープラーニング×セキュリティ
第2回記事「世界初のディープラーニング×セキュリティ製品はここが凄い! 」は こちら

[PR]提供: アズジェント