遠藤利生 (富士通研究所), 情報処理学会誌, Vol. 36, No. 6, 1995

画像処理やコンピュータビジョンの分野においてXYが観察されたとしてXY という量を推定する手法を提案するというタイプの研究は数多く存在する。こ のような問題ごとに解き方を工夫することはもちろん大切なことであるが、そ れらを統合して統一的な視点を提供することもまた劣らず重要であろう。評者 の思い込みかもしれないが、異なる手法間の比較やそれに必要な評価基準を定 める研究はあまりなされていないように思われる。

そんな中で本書は、画像処理やコンピュータビジョンの分野における代表的な 問題を取り上げて、観測データに一定の雑音が存在する場合に、推定結果はど のくらいの誤差を含むかを統一的に論じたものである。これにより、推定誤差 が小さい手法ほど優れた手法であるという評価基準が得られる。著者は、この 評価基準の下で雑音が小さい場合には最尤推定が最適であるという結論を導い ている。取りあげられている問題は多彩で、点列に直線や曲線を当てはめる問 題、ステレオ視による3次元復元問題、動画像からの3次元復元問題、オプティ カルフローの検出方法やその3次元解釈の問題がある。

更に、本書では観測データ自身から観測データに加わる雑音の大きさを見積る ことやそれから得られる推定値の信頼性を評価する方法も述べられている。こ の方法を用いるとたとえば、ロボットがカメラを用いて3次元物体を認識する とき、各観測データに加わった雑音の大きさや、観測データから得られた認識 結果の精度を求めることができる。

これらの問題に対して筆者は統計学を援用しているが、記述は平易で筆者自ら がまえがきで大学2、3年生を対象とすると述べているように、本書の理解に 必要な線形代数学、確率・統計学も一緒に学べるため、特別な予備知識を必要 としない。また、本書では幾何学的な解釈を加えながら線形代数学や確率・統 計学を解説しているので、これらを一通り学んだがどうもイメージが掴みにく いと思われる読者がいらしたら、一読されることをお勧めする。

本書の構成は以下のとおりである。まず、第2章で距離の公理が導入され、第 3章で2次曲線の分類とその標準形が述べられる。第4章では、関数の等高線、 勾配、ヘッセ行列の幾何学的な意味が述べられ、ニュートン法や共役勾配法の 原理が説明される。第5章では2次元正規分布が導入され、第6章では既知の 直線上にあるはずの点が誤差のためその直線上からずれて観測されたときに、 真の位置は直線上のどこであるかを推定する問題を題材にして、最尤推定など の統計的な概念が説明される。この問題においては、最尤推定量が不偏になり、 その分散が任意の不偏推定量の分散の下界を与えるクラメル・ラオの下界と一 致することが証明される。つまり、最尤推定が最適な推定方式になる。線形代 数学、確率・統計学、数値解析学によく親しんでおられる読者の方はこの辺ま で飛ばして読まれてもかまない。

本書後半の第7章では、与えられた観測点列に一つの直線を当てはめる問題を 題材にして、第6章と同様な議論が展開される。そして、観測データに加わる 雑音が十分小さい場合にはやはり最尤推定量の分散がクラメル・ラオの下界と 一致することが証明される。第8章では、当てはめ問題を解く数値計算手法が 説明される。観測データに加わる雑音の分布によって解き方は異なるが、観測 点ごとに分散が異なる場合には単純な反復法では統計的偏りが発生することが 示され、くりこみ法が有効であることが説明される。くりこみ法とは、著者が 開発した反復法であり、反復の各段において統計的偏りを推定してそれを除い ていく方式である。第9章では、同様の計算を逐次的に行う最適フィルタが説 明される。第10章では、最初に述べた画像処理やコンピュータビジョンに現 れる代表的な幾何学的推定問題が取りあげられる。

本書の最後に著者による解説があり、やや専門的な事項が補足されている。評 者の私見ではあるが、この解説で書かれていることを本文にいれてもよかった のではないかと感じた。特に、観測データに加わる雑音があまり小さくないと きには、最尤推定はかならずしも最適とは限らないことは本文に明記して欲し いと感じた。

本書によって、画像処理やコンピュータビジョンの研究に係わる多くの方がこ の分野に関心を持たれることを期待したい。