志沢雅彦 (ATR人間情報通信研究所), 情報処理学会誌, Vol. 34, No. 8, 1993
本書は、コンピュータビジョンの三次元幾何学を対象とした著者のこれまでの
研究を中心とし、内外の最新の研究成果を含めて一貫した体系にまとめあげた
労作である。特に、近年重要視されているデータの誤差に対する計算結果の信
頼性の理論に重きをおいて数理工学の立場から体系的にまとめた教科書となっ
ている。
コンピョータビジョン(マシンビジョン、ロボットビジョンとも呼ばれる)は、
計算機あるいは機械に、人間と同等あるいは、それを越える視覚機能を与える
ための技術である。本書では、特に、物体の三次元運動・三次元構造、または、
カメラを積んだロボット自身の三次元運動と外界の三次元構造を推定する運動
立体視、複数台のカメラからの異なる視点の物体像の間の対応情報から三次元
構造を復元するステレオ視、多くのエッジ線分が平行あるいは垂直の関係にあ
る人工環境において、一枚の画像から三次元構造を復元する単眼視などの三次
元幾何学的な問題を対象にしい、数学的に厳密な理論と、それにもとづいた実
際の画像のもつ誤差を考慮したロバストなアルゴリズムの実現方法の体系が展
開されている。
以下に、類書にはみられない本書の特徴を列挙する。
-
従来提案されてきた諸手法のよせ集めではなく、これらの多くが著者自身の定
式化によって、完全に書きかえられたうえに、著者のオリジナルが加えられて
いる。また、各章の最後には、多くの演習問題が用意され、巻末には、丁寧な
解答まで付いている。したがって、この分野の膨大な数の原論文を読まなくて
も、理論から実現方法まで本書のみで理解することができる。
-
本書は基本的に、コンピュータビジョンの幾何学的な側面だけに限定し、もう
一つの重要な側面である光学的な部分は扱われていないが、そのおかげで、統
一的な記述が可能になっている。
-
三次元世界のニ次元画像面への投影の数理的性質は、射影幾何学とユークリッ
ド運動(剛体運動)によって厳密に体系付けられる。しかし、数学の教科書に
ある射影幾何学は、抽象数学を展開するための基盤として展開されており、数
学者以外には難解かつ無味乾燥な理論である。本書では、計算上の問題を考慮
して再構成した「計算射影幾何学」を提案し、詳細な実際の計算を通じてこれ
を展開しており、射影幾何学の基本概念が、三次元世界の幾何学的な推論にど
のように役にたつのかが理解できるようになっている。
-
実際の画像には誤差がともなっており、つねに、画像の解像度は有限であると
いう前提にもとづき、それにともなう計算結果の信頼性(共分散行列)を統計
的に評価する統一的かつ理論的なアプローチを行っている。計算結果の信頼性
を評価できることは、いろいろな三次元復元手法の出力結果を時間的空間的に
統合してより高い信頼性をもつ復元を行うセンサ融合やモジュール統合のアプ
ローチには不可欠である。
本書は全体で10章からなる。以下、各章について述べる。
-
第1章では、マシンビジョンの背景と本書の狙いが広く心理学、AI、ビジョ
ンなどの過去および現在の研究の流れの中で解説される。
-
第2章と第3章では、計算射影幾何学が展開される。
-
第4章では、カメラあるいは物体の並進運動およびステレオ視の計算理論が、
計算射影幾何学によって定式化される。
-
第5章では、カメラ中心の三次元回転に関する諸解法が述べられる。
-
第6章と第7章では、一般の三次元剛体運動の理論計算が展開される。
-
第6章で、平面および一般の形状をもった物体の剛体運動の構造を点あるいは
線対応から復元する計算理論が述べられる。
-
第7章では、画像面上の瞬時速度場であるオプティカルフローから、三次元運
動と物体構造を復元するための計算理論が述べられる。
-
第8章では、コニック(平面二次曲線)に関するいろいろな計算理論が述べら
れる。
-
第9章と第10章では、それまでに述べてきたいろいろな幾何学計算において
統計的信頼性を評価し、最適性および不偏性を保証する具体的計算手法が述べ
られる。さらに、統計的仮説検定の方法が、三次元世界の幾何学的構造に関す
るいいろいろな推論に適用される。
以上のように、本書は、コンピュータビジョンの幾何学的な側面について、射
影幾何学、テンソル解析、統計的推定法などの数学的、数理工学的手法を駆使
して、一貫した体系にまとめられた好著である。したがって、本書は、コンピュー
タビジョンの教科書、専門書としてはもちろん、コンピュータビジョンを題材
として応用数学の入門書、副読本としても理工学系の学生に広く薦められる。