「電子情報通信学会若手セミナー'96---画像メディア処理の課題---資料集」 (1996年12月, 宮崎), pp. 13--17に掲載

研究テーマは如何にして決めるべきか?
---画像メディア処理の課題---
How to select a research theme?
Tasks of image media processing
金谷健一
群馬大学工学部情報工学科

1. メディア処理に基礎はあるか?

研究は「基礎研究」と「応用研究」とに大別できる、と言えば大方の人は納得 するかも知れない。しかし、この区別はそう簡単ではない。確かに「応用研究」 と言うと、いろいろな文献を参照し、試行錯誤しながら独自の工夫を加え、実 際に試作して性能を評価するというように、イメージとしてわかりやすい。そ れに対して「基礎研究」とは何であろうか。一体メディア処理に基礎研究など 存在するのであろうか。

これは学生、教師を問わず、大学にとって大きな問題である。企業は当然応用 研究に関心を持つであろうが、大学は基礎研究を行なう機関であると位置づけ られている。もし基礎研究が存在しないのなら、大学では何を研究すればよい のであろうか。企業と同じように文献を参照して試作してみればそれでよいの だろうか。大学と企業の役割は同じなのだろうか。

2. 従来の工学vs.情報工学

実はこれは「情報工学」が誕生したときからの問題でもある。それ以前の「機 械工学」、「電気工学」、「電子工学」、「土木工学」、「建築工学」、「化 学工学」、「金属工学」、「航空工学」、「船舶工学」、「原子力工学」など の工学分野は対象や目的が明白であるだけでなく、その手段や指導原理もある 程度限定されている。なぜなら、それらはいづれも力、光、電気、電波、音、 空気、水、分子、原子、電子などの「自然現象」を利用して有益な物やシステ ムを設計しようとする学問であるからであり、その実現は物理法則に完全に支 配され、それに反することは不可能である。

それに対して情報工学は計算機という人工物を用い、論理の組み合わせのみで 有益なシステムを設計しようとする学問であるから、そこにはそれを支配する 物理法則は何もなく、論理的に可能なことは原理的には何でもできるように思 える。そうだとすると、何をするか、何ができるか、は完全に研究者のイマジ ネーションのみに依存し、研究とは「何をイメージするか」ということに尽き ることになる。実際、現在のメディア処理研究はその方向を指向しているよう にも見える。

3. 学問vs.アート

最近、情報処理学会の「コンピュータビジョン研究会」と電子情報通信学会の 「パターン認識・理解研究会」がそれぞれ「コンピュータビジョンとイメージ メディア研究会」、「パターン認識・メディア理解研究会」に改称されたのも その現われのようである。「知能メディア処理」とか「サイバーメディア」と かの掛け声は、計算機能力は高まった、何でもできる、できていないのはまだ していないからだ、というように響く。だから、研究とは誰もイメージしてい ないことをイメージして、試してみることだということになる。

確かにそういうところもある。工学部の他学科では微分方程式、古典力学、電 磁気学、量子力学、流体力学、熱力学などの自然現象を支配する物理法則を十 分に学ばなければ研究に進めない。しかし、情報工学科では数学的な基礎科目 はいろいろあっても、何かに支配されるということがないので、それらをサボっ てもプログラミングさえできれば研究はできるし、学位もとれる。実際、数式 など一つもなく、イマジネーションとプログラムと実行例のみからなる学位論 文をしばしば見かける。歴史的にもMIT(AIラボ、メディアラボ)やゼロッ クス研究所で創出されたイマジネーションが今日のメディア処理を方向づけて いる。

しかし、イマジネーションを実現することは(従来の意味では)学問ではなく、 アート(芸術)である。メディア処理、あるいは広く情報工学はアートなのだ ろうか。メディア処理、あるいは情報工学には学問は存在しないのだろうか。 コンピュータビジョンとイメージメディア研究会やパターン認識・メディア理 解研究会は「研究者のイメージ」や「研究者のビジョン」を発表する場になっ たのだろうか。

4. 制約のモデル化と解析

しかし、従来の工学分野の基礎学問の意味をよく考えると、情報工学と共通の 構造が浮かび上がる。従来分野で古典力学、電磁気学、量子力学、流体力学、 熱力学などのが基礎となるのは、もちろんそれらの分野が自然現象を応用する ことを目的としているからである。しかし、そこにはその自然現象によって応 用が可能になるという側面と、その自然現象のために応用が妨げられるという 2面性がある。

例えば運動物体を任意に加速したり停止させたりできれば都合がよいが、慣性 のためにそれはできない。熱を発生させて、それをすべて仕事に換えるとと都 合がよいが、それは不可能で熱効率の限界がある。摩擦や電気抵抗がなければ 都合がよくても避けられない。このように、自然現象は工学応用に様々な制約 を課している。

そこで、その制約のもとではどこまでが可能か、その制約はどこまでコントロー ルできるか、が研究の対象となる。そのためにはその制約を数学的にモデル化 する必要がある。そこで数学的な解析によって、その制約のもとでの実行限界 やその制約の制御可能な限界を導いたりする。そして、そのような限界を達成 する物やシステムを実現することが技術者の課題となる。これが従来分野にお ける基礎的学問の意義である。

このように従来分野における基礎研究の意味を「制約のモデル化とその解析」 とみなすと、これは自然現象を利用しようとしまいと、すべての工学に共通す ることである。なぜならどんな応用にも必ず何らかの制約があり、もし制約が なければ何も研究する必要がないからである。

実際、自然法則に支配されない情報工学においても、これを単なるプログラミ ング技術ではなく学問としての基礎を与えようと多くの学者が努力した。例え ば、計算機によれば論理的に可能なことは何でもできるといっも、論理的に不 可能なことはできない。そこで何が論理的であり得るのかという問いが「計算 可能性理論」として研究された。

また、論理的に可能でも実行に時間がかかり過ぎると実際的には不可能である。 そこで実行効率の限界は何かという問いから「計算量の理論」が発展した。こ れらは計算一般を対象としているために、その基礎も抽象的になり過ぎるとこ ろがあるが、課題がより具体的になればなるほどその制約も具体化してくる。

5. メディア処理の制約

それではメディア処理に課された制約とは何であろうか。計算効率の問題は計 算処理全体にかかわることであるから、もちろんメディア処理もそれからは逃 れられない。しかし、メディア処理に特有な制約もいろいろある。これを見る には「...であればよいのに」と思うことを列挙してみればよい。

例えば実画像を入力とすれば、画像が完全に理想的であれば可能なことが、解 像度や画像の歪みや誤差のために不完全にしか実行できないことがある。そこ で離散化や量子化や画像の歪みや誤差をモデル化し、解析によって実行限界や 制御可能性を明らかにすることが一つの学問となる。私が画像の誤差をモデル 化して3次元復元の精度限界を導いたのもこの趣旨である。

あるいは、メモリや伝送速度の制約によって処理できる画像データに制約が課 される場合は、データがどこまで圧縮できるか、伝送速度の限界は何かという 問いが生じる。これは一般的には「情報理論」として研究される分野であるが、 データが画像の場合は画像特有の考察が可能である。

制約はこのような物理的なものだけではない。なぜそれができないか/しない かというと、「ややこしいから」、「面白くないから」、「人が喜ばないから」、 などの理由の場合もある。これも一種の制約とみなせる。したがって、人間は どの程度の複雑さまで耐えられるのか、何を面白いと思うか、何を喜ぶのかを 調べることに意味が生じる。ここから、多くの被験者に対して実験して人間の 応答をモデル化し、それに基づいて解析を行なうという基礎研究が生まれる。 これをさらに一般化すると「人間工学」とか「感性工学」とか呼ぶことになる のであろう。

何かをみごとに実現することが研究だ、そうでなければ研究の意味がない、と 企業のように考えたのでは大学で研究はできない。企業のように何かの完成を 迫られているのではないし、何かいいことを急に思いつくこともありそうにも ない。文献を読んで他人がうまくやっていることを知っても、その人がそこま でしかできなかったものをそれ以上によくすることは簡単にはできない。しか し、そこであきらめてはだめである。

まず、何が制約となっているかを考えてみよう。そして、その制約が何とか数 学的にモデル化できないかを考えてみよう。そして単純なモデル化でも、その モデルからは何が可能で何が可能でないかを考えてみよう。

応用目的や前提を少しでも換えれば、その制約もまた変化する。したがって別 のモデルが誕生し、新しい解析結果が得られるであろう。これから逆に、制約 のもとで有効な新しい応用が発見できることもしばしばある。

6. 処理の形式化・抽象化

基礎研究は制約のモデル化と解析以外にも存在する。その一つは形式化・抽象 化である。これは具体的な問題からその本質と思われる部分のみを残して、そ れ以外の部分を捨象し、形式的・抽象的に記述してみることである。そうすれ ば、別々の問題も本質的には同じことをしていることがわかり、それから新し い応用が発見されることも多い。私がオプティカルフローの検出やオプティカ ルフローからの3次元復元を、観測データに拘束条件方程式を当てはめる「当 てはめ問題」として形式化・抽象化した結果、これが平面上の点に直線や楕円 を当てはめる問題と数学的に同一の構造をもつことがわかり、このことから新 しい計算手法が得られたのもその一例である。

文献で読んだ他人の研究を形式化・抽象化してみよう。具体的な手順や操作や 工夫は無視して、本質的に何を行なっているのか考えてみよう。そして、他の 類似の研究と本質的に同一か本質的に異なるのか比較分類してみよう。類似の 研究が見当たらない場合は、形式化・抽象化した構造に異なる具体化ができな いか考えてみよう。そこから新しい応用が発見されることも多い。

7. 評価法の工夫

さらに考えられることは「評価法」である。これは何が望ましいのかを測る尺 度である。その尺度が変われば評価も変わる。実際、工学は科学技術全体の進 歩や社会の変化、生活態度の変化によって望ましさの尺度は絶えず変化する。 したがって、過去に最適であったものは今日では無意味となり、新たな方向が 研究対象になることも多い。

例えば、以前は計算機の実行速度が遅かったため、画像処理では如何に処理を 少くするかが評価対象となった。そのため、パタン認識や画像認識ではいかに 少ない数の特徴量を抽出するかが工夫のしどころであった。しかし現在では、 全画素を計算データとして用いるのに何の問題もないどころか、画像を全画素 からなるベクトルとみなして、その集合の共分散行列とそれに対する固有空間 を計算することにさえ違和感はない。

文献で読んだ他人の研究の評価法を変えてみよう。その著者の評価法によれば その著者の方法が最適であるとしても、評価法を変えればもはやその方法が最 適とは限らない。新しい評価法で最適なものを得るにはどうしたらよいか考え てみよう。そして逆の発想で、新しい評価法が有効となる応用を考えてみよう。 そこから新たな展望が開けることもしばしばある。

例えばオプティカルフロー検出の手法ではその評価は通常は平均精度である。 例えば、真のフローが既知あるいは予測できる画像に対してオプティカルフロー を検出し、真のフローとの差を平均したもので手法が比較されることが多い。 しかし、それが唯一の評価法であろうか。例えば部分的に高精度のフローが得 られればよく、精度のよいフローと精度の悪いフローとが分離する何らかの手 段があるとすれば、ごく一部に精密なフローが得られ、残りはまったく信頼で きないフローが得られる手法のほうが、全体的にほどほどの精度が得られる手 法より優れているともいえる。

これはどちらかというと物理的な測定評価であるが、人間の心理的評価となる と、それこそ千差万別であるから場合や目的に即してさまざまな評価法が考え られる。

8. 大学の研究vs.企業の研究

以上では大学に相応しいメディア処理の「基礎研究」の代表的な方法論として 「制約のモデル化」、「処理の形式化・抽象化」、「評価法の工夫」を挙げた が、いずれも「何かをうまく実現しなければならない、すればよい」という態 度からの発想の転換を要するので、そう簡単ではない。これは一人で研究して いたのではなかなか身につかないものであり、よい指導教官につくことが大切 であるし、また指導教官はそれを修得させるのが役目でもある。

多くの点で企業のほうが大学よりよい研究環境にあるが、この点では大学は企 業と比べて断然優位にある。企業では研究をチームで行なうとはいえ、室長な どの指導者は研究費の調達や報告書の作成などの事務的な仕事をするのが普通 であり、学問的な指導などしないし、そういう役目でもない。そのため、具体 的な研究は個人にまかされていることが多く、どうしても文献を見ては試行錯 誤的に実験してみるという結果主義になりがちである。

9. 基礎研究の評価

一方、基礎研究にはいろいろ問題もある。まず第一に基礎研究が学会で評価さ れにくいことである。これは私自身も何度も経験することでもある。制約のモ デル化に対しては、モデル化してもよいシステムができるわけではないと批判 され、処理の形式化・抽象化に対しては、形式化・抽象化してもよいシステム ができるわけではないと批判され、評価法の工夫に対しては、評価法を工夫し てもよいシステムができるわけではないと批判される。要するに、結果がなけ ればだめ、結果があればよいという結果主義が学会の主流であるためである。

「単にやってみた研究」ではない学問的な基礎づけが必要だということを私は これまて何度も主張し、その趣旨はここに書いたことと同じであるが、絶えず 厳しい批判を受けてきた。その批判は具体的にはいろいろあるが、結局は「そ んなことをしてもよいシステムができるわけではない」ということに尽きる。

このような批判にはそれなりの理由がある。それは基礎研究の評価が難しいこ とにある。それが新しい可能性に道を開く研究なのか、意味の乏しい遊びに過 ぎないのか、見分けるのは容易ではない。特に「形式化・抽象化」は危険が多 く、普通に書けば分かることをわざと分かりにくく書いて自慢したり自己満足 に陥ったりすることも多い。それに対して結果が示されると安心できるので、 単にやってみたらこうなったという研究のほうが受け入れられやすい傾向にあ る。

基礎研究は本来直ちにすぐれた結果を出すものではないが、それが学会に受理 されるため、あるいは研究費を申請したり助成を受けたりする必要上から、よ く誇張した宣伝がなされる。音声認識の識別限界の解析的研究には誰も金を出 さなくても、識別単語数5個のシステムを試作してみせれば研究費の調達に困 らない時代もあった。特に今日では様々の場で研究の意義を強調することが要 求されている。これがまた悪循環を生んで、基礎研究は看板通りの成果になっ ていないと批判される種となる。

10. まとめ

残念ながら、よい基礎研究とよくない基礎研究(と称するもの)とを初期に見 分ける手段は存在しない。それが判別できるのは後になって、例えば5年たっ てからである。研究が次々と進展して初期には想像もできなかったくらいに発 展しているか、5年前から同じことを言っていて一向に進歩が見られないのか、 その違いが現われるであろう。

基礎研究は化学反応における触媒のようなもので、それ自体が成果を産み出す というより、異なる(一見無関係の)研究を結びつけたり、他の研究の進展を 促進したりすることにより大きな意義がある。したがって、基礎研究はそれを 行なう人にもそれを評価する人にも忍耐と先を見通したビジョンとが要求され る。

このような困難に満ちいてる基礎研究であるが、若い研究者にはぜひ挑んでほ しい。論文が出ないと学位が取れないから、ある程度結果主義の研究で論文を 稼ぐのはやむを得ないが、少なくとも大学(院)にいる間にこのような研究を 経験すれば、その難しさを実感するだけでも、将来のプラスは限りなく大きい と思われる。そして、企業とは異なる基礎研究を中心とする大学の研究の独自 性と役割分担・協力体制が確立することを期待している。

これから研究を始めようとする人達が研究テーマを決めるのに、ここに書いた ことが参考になれば幸いである。