【連載】
それではさっそく、パノラマ画像の作成に用いる入力画像が2枚の場合の処理手順を考えていきましょう。すなわちソース画像とターゲット画像の2枚の入力画像を撮影する場合です。ソース画像をターゲット画像に合うように位置合わせ移動をしてパノラマ画像の生成を行うには、主に以下の4つの処理を行います。
入力画像が3枚以上の場合は、(1)の処理においてどの画像とどの画像のペアがそれぞれ重なり合うのかを決定する処理が新たに必要になります。また、(2)~(4)の処理では2枚だけではなく用いたすべての画像を用いて、最適な各画像の移動量、変形量、合成量を決定する必要が出てきます。このときStructure from Motionの時にも紹介した「バンドル調整」という各画像のパラメータの全体での最適化処理を行います。
今回は理解を楽にするため、そのような3枚以上の入力画像の時に必要な処理の説明は省略させていただき、「基本的な2枚の入力画像からのパノラマ画像生成処理」である、上記(1)~(4)の詳細のみをみていくことにします。
(1)の局所特徴量記述子による点対応の抽出では、パノラマ画像の張り合わせでは最初の処理として、Scale invariant feature transform(SIFT)に代表される「局所特徴量記述子」を各画像上でそれぞれ検出し、それらが(別の画像に写っているものの)実世界上においては同じ1点の3次元座標を共に示しているという「対応関係」を求める操作を行います。この対応関係を用いることで、ソース画像とターゲット画像の間にカメラ位置がどれだけ移動したかを計算することができます。ここでは1枚の画像から複数のSIFTを抽出する方法と、その抽出したSIFT同士の画像間での対応関係の作り方を紹介します。
以下の図は、2枚の画像からそれぞれ個別にSIFT特徴量を検出した結果と、それらの特徴点の中から対応する点同士を関係づけて、RANSACというアルゴリズムにより画像間の位置合わせを行った様子を示しています。
「局所特徴量」とは、画像内のある局所的な領域が回転もしくはスケール変化(拡大縮小)しても、安定して同じような局所領域に特徴量を算出(検出)してくる事ができる特徴量です。この性質により、異なる画像間で似たような特徴を持つ場所を安定的に検出してきて、それらの対応関係を作ってレジストレーションや位置合わせ、ステレオ計算にパターン認識などが非常に安定的に行えるようになることから、局所特徴量はコンピュータビジョンの様々なアルゴリズムにおいて活用されています。
局所特徴量の代表格・元祖であるSIFTは、スケール不変特徴量変換(Scale invariant feature transform)の略で、画像に映る対象のスケールが変わっても安定的に同じ性質を持つ局所的な領域を検出してくれる特徴量算出アルゴリズムです。導入部で紹介したAutoStitchの論文の研究チームのDavid Lowe教授により発明された技術です(特許取得済み)。
SIFTの計算には、以下の2つの処理を行います。
実際には他にも細かい処理を行うのですが、全体の処理手順を理解しやすくするためにそれらの説明は今回は割愛します。
| ビールの"のど越し"感にはホップの香りが重要 - サッポロビールが発見 [09:00 5/18] |
| Linux Mint 15登場迫る [08:00 5/18] |
| 米Google、量子コンピュータ施設を開設 - 機械学習の研究に活用 [05:50 5/18] |
| 産総研など、夏季と冬季で太陽光を自動調節する省エネ調光シートを開発 [19:37 5/17] |
| 4連続の大規模な太陽フレア発生 [19:08 5/17] |
|
レプジョー「208GTi・208XY」画像ギャラリー ─ 208人気を加速させるスポーティ仕様を同時リリース [16:03 5/19] ライフ |
|
家電通 今後期待するのは電子レンジで“ゆでる・煮る”機能 [16:01 5/19] エンタメ |
|
中国大物官僚の汚職を日本人の元愛人女性が告発との説が浮上 [16:00 5/19] エンタメ |
|
国連機関「昆虫食は栄養あって美味、理想的な食料」に物申す [16:00 5/19] エンタメ |
|
中畑DeNA シーズン途中の外国人投手補強に二の足踏むデータ [16:00 5/19] エンタメ |