本書は著者の研究を中心とした個性的なコンピュータビジョンの専門書である。 本書はコンピュータビジョンが諸技術の寄せ集めと思っている人に、体系的な 理論的な取扱いが可能なことを教えてくれる貴重な、また、この分野の将来を 示唆する重要な文献であろう。
周知のようにパターン認識過程は特徴抽出とパターン分類の二つに大別できる。 このうちパターン分類は統計的決定論の枠組みで定式化され、さまざまな議論 がなされる。これに対して本書でいう``画像理解''、あるいはほぼ同義語であ るコンピュータビジョンの分野では特徴抽出(特に3Dの)を重視するが、従 来その方法はヒューリスティックスに満ちたもので体系化、理論化への努力は 乏しかった。著者は幾何学的変換を不変にする不変量としてパターン特徴を捉 えることによりこの問題に挑戦している。本書ではこの群論的なトーンが全体 を支配し、コンピュータビジョンのさまざまな問題が群論の応用により鮮やか に解決されていく。
第1章は Image Undestanding の定義、3Dシーンから画像面への射影変換カ メラ回転が引き起こす回転群等について述べ、次章への準備としている。本章 ではまた3Dユークリッド幾何学的 Image Understanding に代わる2Dユー クリッド幾何学的アプローチの重要性を指摘している点が興味深い。
第2章では独立した画像特徴はその特徴の持つ性質を不変とする変換群の既約 表現であるとのテーゼが述べられ、それがオプティカルフローの解析とテクス チャからの3次元形状復元問題に応用される。なおこの章で扱われる変換群は 画像上の回転群(2次元回転のなす群 = SO(2))である。
第3章ではカメラが3次元的に回転する場合の変換群(3次元回転のなす群 = SO(3))とその不変量について議論化される。無限小回転、リー群、カシミー ル作用素等の連続群論のツールが準備され、3次元回転群の既約表現がもとめ られる。またその結果はカメラが3次元的に回転する場合のオプティカルフロー の解析に応用される。
第4章では、前章まで仮定されていた線形性の限定を取り除き、画素値を用い て代数的に構成される不変(特徴)量について述べている。それらはカメラ回 転により非線形に変換する特徴量の組であり、この特徴量を使うことにより、 いかに画像がカメラ回転に不変に表現されるかが示される。
第5章では画像を2変数の関数とみて画像の不変特徴をいかに抽出するかを述 べている。SO(3) の既約表現である球面調和関数が導入され、それを基に連続 的な画像から、離散的な線形特徴量の組が導出される。
第6章では3次元回転のさまざまな数学的な表現、オイラ角、Cayley-Klein パラメータ、スピナ、4元数、の相互関係が考察される。また、3次元回転群 の特徴的なトポロジも解説される。
以上第2--6章が第1部を構成する。第7章以降が第2部を構成し、第1部の 知識を利用してさまざまなコンピュータビジョンの問題が解かれる。
第7章では、平面のオプティカルフローが解析され、フローを特徴づけるパラ メータが、いかに線形特徴量から得られるかが示される。この手法は、平面の オプティカルフローの接続条件を解析することにより、多面体物体の3D回復 問題へと応用される。
第8章ではシーン中の多面体の角が直角であるという仮定のもとで、一枚が画 像から多面体の形を求める3D回復問題の解が述べられている。
第9章では物体表面のテクスチャ密度とメトリックテンソルの関係が論じられ、 これを用いてのパラメトリックな曲面に対して一般的な3D回復問題のスキー ムが述べられる。
第10章では3D回復問題を、シーン中の平面から3D物体を構成するための 最適化問題として捉え、線形な方程式を解くことによりこれが実行できること が示される。
以上みてきたように、本書では画像理解の群論的な構造が詳細に論じられてい る。一般のコンピュータビジョン研究者にとって手軽に通読するのは難しいか もしれないが、従来の画像理解技術!に物足りなさを感じるパターン情報処理 研究者に広く薦められるだろう。
さらに評者にとって本書は画像理解の本というより、連続群論、テンソル解析 の副読本として貴重なものに思われる。従来情報関係の研究者にポピュラな連 続群の参考書は多くはない。数学の古典はいくつかあるが、難解であり、具体 的計算で理解できるようには書かれていない。また、テンソル解析にしても具 体的問題についてこれほど詳細な式が展開してある本は少なく、本書の式を書 き写していくだけでテンソル解析はマスター可能に思われる。そのようなわけ で、本書は「コンピョータビジョンで学ぶリー群・テンソル」という題名で数 学・物理・情報系の学生にも薦められるかもしれない。