久野義徳、大田友一、金谷健一、上田博唯、松山隆司、激論：これからのＣＶ、情報処理学会コンピュータビジョンとイメージメディア研究会資料、 96-CVIM-100-3, 1996年5月, より

科学技術としてのコンピュータビジョン
Computer Vision as Science and Engineering
金谷健一
群馬大学工学部情報工学科

「コンピュータビジョン(CV)」とは画像からそこに写っている３次元実世界に関する情報を引き出す技術のことである。入力画像が２次元的な文字や記号やパタンであるときが「パタン認識」であり、数値や記号の論理演算としてさまざまな識別、分類のプログラミング技法が開発された。しかし入力画像が「３次元実世界」となると実世界の物体と画像との対応関係にはさまざまな物理的、光学的、電気的、統計的な要因が関係し、パタン認識と比べて必要な知識が格段に増加する。したがってCVには次の要素が必要である。

CV=(画像)+(プログラミング)+(数理解析)

ここでいう「画像」とは入力装置(ビデオカメラ)や出力装置(ディスプレー)を始め、変換、伝送、記憶、その他すべての画像信号や画像データの処理を含めたものを意味する。「プログラミング」とは数値や記号の処理アルゴリズムだけでなく、参照するデータベースやシステムアーキテクチャまで含んでいる。「数理解析」とは２次元・３次元の幾何学的関係、物理法則、光学的関係、濃淡・色、誤差、精度・信頼性を初め、現象のモデル化とその解析であり、正に CVの核心である。

「画像」と「数理解析」を除いて「プログラミング」の部分を独立させたものが「人工知能」であるともいえる。初期のCVはこの人工知能的プログラミング技術を画像と結合させたものであり、設計者の直観と思い付きからさまざまなルールやストラテジーを試行錯誤的に導入し、システムを試作してはその性能を実験的に確認していた。

その後、実世界の複雑な現象を基本要因に分解し、それぞれを厳密に解析するという科学の方法論が取り入れられるようになり、ようやくCVは思い付きの発明工夫から客観的な科学技術となろうとしている。

今後望まれることは「要素技術の体系化」である。ともすると目的ごとに都合がよさそうに思える技法を工夫してシステムを組み立てることが多いが、目的の異なるシステムでも要素技術として共通するものが多い。それらを取り出し、前提を明確にし、効率、性能、最適性などを理論的に解明することが必要である。

これは従来から行なわれてはいたが、過去のCVの研究では各種の処理を効率的に実効するアルゴリズムやデータ構造の工夫が大きな部分を占めていた。これは利用できる計算機の能力が限られていて、資源を最大限に活用する必要があったからであるが、ともすると効率に目を奪われて、その処理が実世界と画像との関係においてどういう「客観的な意味」を持つのかを十分に考慮しないことが多かった。

例えば「エッジ検出」を「画像の濃淡値から``人間が目で見て物体境界だと思う曲線''を抽出する方法」と主観的にとらえると、脱出不可能な迷路に落ち込む。主観を排し、どういう濃淡パタンに対してどういう曲線を抽出するのかを客観的に定式化しなければならない。そもその「実世界のあるもの(たとえば人物)を検出する手法」などは存在しない。どんな検出手法でも、その手法で検出できない場合がある。追及すべきものは「これこれの条件のもとではこれこれの性質を満たすものを抽出する」というように客観的に定義された手法である。

従来は存在しないまぼろしの手法を追い求めてさまざまな処理を考案しては実験を行ない、主観評価により「``多くの場合''に有効である」などと主張することがよくあった。しかし、たまたま試した実験例に対して80%有効な手法より、30%しか有効でなくても有効である条件とその性質が明示されている手法のほうが科学技術として意味がある。その条件が満たされる場合に使用すればよいし、逆にその条件が満たされるようにコントロールを加えることもできる。

例えば「領域分割」をニューロや分散協調処理を組み合わせた「統合処理」で実現して``多くの場合''に有効であっても、それがどういう条件のもとでどういう性質をもつ領域を出力しているのかを客観的に明示できないものは科学技術と呼ぶことはできない。そのような、実世界と画像との関係に対する客観的な定式化なしに試行錯誤するという「主観主義」を排することが、今後の科学技術としてのCVの発展のためには必要である。

科学技術としてのコンピュータビジョン Computer Vision as Science and Engineering 金谷健一 群馬大学工学部情報工学科

科学技術としてのコンピュータビジョン
Computer Vision as Science and Engineering
金谷健一
群馬大学工学部情報工学科