これは学生、教師を問わず、大学にとって大きな問題である。企業は当然応用 研究に関心を持つであろうが、大学は基礎研究を行なう機関であると位置づけ られている。もし基礎研究が存在しないのなら、大学では何を研究すればよい のであろうか。企業と同じように文献を参照して試作してみればそれでよいの だろうか。大学と企業の役割は同じなのだろうか。
それに対して情報工学は計算機という人工物を用い、論理の組み合わせのみで 有益なシステムを設計しようとする学問であるから、そこにはそれを支配する 物理法則は何もなく、論理的に可能なことは原理的には何でもできるように思 える。そうだとすると、何をするか、何ができるか、は完全に研究者のイマジ ネーションのみに依存し、研究とは「何をイメージするか」ということに尽き ることになる。実際、現在のメディア処理研究はその方向を指向しているよう にも見える。
確かにそういうところもある。工学部の他学科では微分方程式、古典力学、電 磁気学、量子力学、流体力学、熱力学などの自然現象を支配する物理法則を十 分に学ばなければ研究に進めない。しかし、情報工学科では数学的な基礎科目 はいろいろあっても、何かに支配されるということがないので、それらをサボっ てもプログラミングさえできれば研究はできるし、学位もとれる。実際、数式 など一つもなく、イマジネーションとプログラムと実行例のみからなる学位論 文をしばしば見かける。歴史的にもMIT(AIラボ、メディアラボ)やゼロッ クス研究所で創出されたイマジネーションが今日のメディア処理を方向づけて いる。
しかし、イマジネーションを実現することは(従来の意味では)学問ではなく、 アート(芸術)である。メディア処理、あるいは広く情報工学はアートなのだ ろうか。メディア処理、あるいは情報工学には学問は存在しないのだろうか。 コンピュータビジョンとイメージメディア研究会やパターン認識・メディア理 解研究会は「研究者のイメージ」や「研究者のビジョン」を発表する場になっ たのだろうか。
例えば運動物体を任意に加速したり停止させたりできれば都合がよいが、慣性 のためにそれはできない。熱を発生させて、それをすべて仕事に換えるとと都 合がよいが、それは不可能で熱効率の限界がある。摩擦や電気抵抗がなければ 都合がよくても避けられない。このように、自然現象は工学応用に様々な制約 を課している。
そこで、その制約のもとではどこまでが可能か、その制約はどこまでコントロー ルできるか、が研究の対象となる。そのためにはその制約を数学的にモデル化 する必要がある。そこで数学的な解析によって、その制約のもとでの実行限界 やその制約の制御可能な限界を導いたりする。そして、そのような限界を達成 する物やシステムを実現することが技術者の課題となる。これが従来分野にお ける基礎的学問の意義である。
このように従来分野における基礎研究の意味を「制約のモデル化とその解析」 とみなすと、これは自然現象を利用しようとしまいと、すべての工学に共通す ることである。なぜならどんな応用にも必ず何らかの制約があり、もし制約が なければ何も研究する必要がないからである。
実際、自然法則に支配されない情報工学においても、これを単なるプログラミ ング技術ではなく学問としての基礎を与えようと多くの学者が努力した。例え ば、計算機によれば論理的に可能なことは何でもできるといっも、論理的に不 可能なことはできない。そこで何が論理的であり得るのかという問いが「計算 可能性理論」として研究された。
また、論理的に可能でも実行に時間がかかり過ぎると実際的には不可能である。 そこで実行効率の限界は何かという問いから「計算量の理論」が発展した。こ れらは計算一般を対象としているために、その基礎も抽象的になり過ぎるとこ ろがあるが、課題がより具体的になればなるほどその制約も具体化してくる。
例えば実画像を入力とすれば、画像が完全に理想的であれば可能なことが、解 像度や画像の歪みや誤差のために不完全にしか実行できないことがある。そこ で離散化や量子化や画像の歪みや誤差をモデル化し、解析によって実行限界や 制御可能性を明らかにすることが一つの学問となる。私が画像の誤差をモデル 化して3次元復元の精度限界を導いたのもこの趣旨である。
あるいは、メモリや伝送速度の制約によって処理できる画像データに制約が課 される場合は、データがどこまで圧縮できるか、伝送速度の限界は何かという 問いが生じる。これは一般的には「情報理論」として研究される分野であるが、 データが画像の場合は画像特有の考察が可能である。
制約はこのような物理的なものだけではない。なぜそれができないか/しない かというと、「ややこしいから」、「面白くないから」、「人が喜ばないから」、 などの理由の場合もある。これも一種の制約とみなせる。したがって、人間は どの程度の複雑さまで耐えられるのか、何を面白いと思うか、何を喜ぶのかを 調べることに意味が生じる。ここから、多くの被験者に対して実験して人間の 応答をモデル化し、それに基づいて解析を行なうという基礎研究が生まれる。 これをさらに一般化すると「人間工学」とか「感性工学」とか呼ぶことになる のであろう。
何かをみごとに実現することが研究だ、そうでなければ研究の意味がない、と 企業のように考えたのでは大学で研究はできない。企業のように何かの完成を 迫られているのではないし、何かいいことを急に思いつくこともありそうにも ない。文献を読んで他人がうまくやっていることを知っても、その人がそこま でしかできなかったものをそれ以上によくすることは簡単にはできない。しか し、そこであきらめてはだめである。
まず、何が制約となっているかを考えてみよう。そして、その制約が何とか数 学的にモデル化できないかを考えてみよう。そして単純なモデル化でも、その モデルからは何が可能で何が可能でないかを考えてみよう。
応用目的や前提を少しでも換えれば、その制約もまた変化する。したがって別 のモデルが誕生し、新しい解析結果が得られるであろう。これから逆に、制約 のもとで有効な新しい応用が発見できることもしばしばある。
文献で読んだ他人の研究を形式化・抽象化してみよう。具体的な手順や操作や 工夫は無視して、本質的に何を行なっているのか考えてみよう。そして、他の 類似の研究と本質的に同一か本質的に異なるのか比較分類してみよう。類似の 研究が見当たらない場合は、形式化・抽象化した構造に異なる具体化ができな いか考えてみよう。そこから新しい応用が発見されることも多い。
例えば、以前は計算機の実行速度が遅かったため、画像処理では如何に処理を 少くするかが評価対象となった。そのため、パタン認識や画像認識ではいかに 少ない数の特徴量を抽出するかが工夫のしどころであった。しかし現在では、 全画素を計算データとして用いるのに何の問題もないどころか、画像を全画素 からなるベクトルとみなして、その集合の共分散行列とそれに対する固有空間 を計算することにさえ違和感はない。
文献で読んだ他人の研究の評価法を変えてみよう。その著者の評価法によれば その著者の方法が最適であるとしても、評価法を変えればもはやその方法が最 適とは限らない。新しい評価法で最適なものを得るにはどうしたらよいか考え てみよう。そして逆の発想で、新しい評価法が有効となる応用を考えてみよう。 そこから新たな展望が開けることもしばしばある。
例えばオプティカルフロー検出の手法ではその評価は通常は平均精度である。 例えば、真のフローが既知あるいは予測できる画像に対してオプティカルフロー を検出し、真のフローとの差を平均したもので手法が比較されることが多い。 しかし、それが唯一の評価法であろうか。例えば部分的に高精度のフローが得 られればよく、精度のよいフローと精度の悪いフローとが分離する何らかの手 段があるとすれば、ごく一部に精密なフローが得られ、残りはまったく信頼で きないフローが得られる手法のほうが、全体的にほどほどの精度が得られる手 法より優れているともいえる。
これはどちらかというと物理的な測定評価であるが、人間の心理的評価となる と、それこそ千差万別であるから場合や目的に即してさまざまな評価法が考え られる。
多くの点で企業のほうが大学よりよい研究環境にあるが、この点では大学は企 業と比べて断然優位にある。企業では研究をチームで行なうとはいえ、室長な どの指導者は研究費の調達や報告書の作成などの事務的な仕事をするのが普通 であり、学問的な指導などしないし、そういう役目でもない。そのため、具体 的な研究は個人にまかされていることが多く、どうしても文献を見ては試行錯 誤的に実験してみるという結果主義になりがちである。
「単にやってみた研究」ではない学問的な基礎づけが必要だということを私は これまて何度も主張し、その趣旨はここに書いたことと同じであるが、絶えず 厳しい批判を受けてきた。その批判は具体的にはいろいろあるが、結局は「そ んなことをしてもよいシステムができるわけではない」ということに尽きる。
このような批判にはそれなりの理由がある。それは基礎研究の評価が難しいこ とにある。それが新しい可能性に道を開く研究なのか、意味の乏しい遊びに過 ぎないのか、見分けるのは容易ではない。特に「形式化・抽象化」は危険が多 く、普通に書けば分かることをわざと分かりにくく書いて自慢したり自己満足 に陥ったりすることも多い。それに対して結果が示されると安心できるので、 単にやってみたらこうなったという研究のほうが受け入れられやすい傾向にあ る。
基礎研究は本来直ちにすぐれた結果を出すものではないが、それが学会に受理 されるため、あるいは研究費を申請したり助成を受けたりする必要上から、よ く誇張した宣伝がなされる。音声認識の識別限界の解析的研究には誰も金を出 さなくても、識別単語数5個のシステムを試作してみせれば研究費の調達に困 らない時代もあった。特に今日では様々の場で研究の意義を強調することが要 求されている。これがまた悪循環を生んで、基礎研究は看板通りの成果になっ ていないと批判される種となる。
基礎研究は化学反応における触媒のようなもので、それ自体が成果を産み出す というより、異なる(一見無関係の)研究を結びつけたり、他の研究の進展を 促進したりすることにより大きな意義がある。したがって、基礎研究はそれを 行なう人にもそれを評価する人にも忍耐と先を見通したビジョンとが要求され る。
このような困難に満ちいてる基礎研究であるが、若い研究者にはぜひ挑んでほ しい。論文が出ないと学位が取れないから、ある程度結果主義の研究で論文を 稼ぐのはやむを得ないが、少なくとも大学(院)にいる間にこのような研究を 経験すれば、その難しさを実感するだけでも、将来のプラスは限りなく大きい と思われる。そして、企業とは異なる基礎研究を中心とする大学の研究の独自 性と役割分担・協力体制が確立することを期待している。
これから研究を始めようとする人達が研究テーマを決めるのに、ここに書いた ことが参考になれば幸いである。