Vol.18 No.2 (2003/03) 画像処理・理解・マルチメディア


私のブックマーク

画像処理・理解・マルチメディアのブックマーク

■ はじめに

筆者の出身は画像処理・画像理解の分野であり,博士論文では人工知能的手法を用いた画像認識・理解を扱った.現在でもその興味は変わらないが,最近は,映像メディアの解析,映像メディアの取得,構築,利用に関する研究に力を入れるようになってきた.本稿では,このようなスタンスで,画像解析からマルチメディアまで,有用だと思われるリンクを並べてみた.

■ 画像計測・処理・認識・理解のコミュニティ

□ 国内学会・会議

活発に情報発信が行われており,一つ一つを本稿で紹介する必要はないのだが,多くの研究会や分科会があり,網羅的に調べようとすると手間がかかる.そのため,筆者が関係しているもの,また,良く目にするものをリストアップしてみた.しかし,全てを網羅しているわけではないことに注意されたい.

こうして並べてみると,その数の多さに驚くと共に,情報発信や情報交換をもっと密にまとめることができないのだろうかと疑問を抱く方も多いだろう.発表の場や価値観が多様なことは良いことだが,情報収集が難かしくなっていることは否定できない.それに対し,2年に一回開催されているMIRU(画像の認識・理解シンポジウム)や今年9月に初めて開催されてきたFIT(情報科学技術フォーラム)は電子情報通信学会と情報処理学会が共同で横断的な研究会を開催した例であり,その他にも,研究会の併催が企画されることが多くなってきた.このような体制が今後さらに発展していくことが望まれる.

また,画像関係の研究者のメイリングリストとして, イメージメイリングリスト(image@m.aist.go.jp)がある.国際会議や研究会の情報が随時流れている他,研究内容に関する討論も時々行われるため,興味のある方は登録されると良いだろう.なお,登録のためには以下のようなメイルを送れば良い.

To: image-ctl@m.aist.go.jp
Subject: SUBSCRIBE
subscribe 自分の名 自分の姓

□ 国際学会,国際会議,雑誌など

いつも問題になるのだが,海外の多くの学会,雑誌,国際会議を網羅的に調べることは難しい.特に,新しい国際会議,ワークショップが次々に現れるため,最新の情報を載せたポータルサイトの必要性を感じる.残念ながら,筆者にもそれらを整理することが難しいため,少数をあげるだけにさせて頂きたい.

日本の画像処理・認識関係の研究者が古くから参加し,盛り上げてきたソサエティとして,IAPR (International Association for Pattern Recognition)がある.その最も大きな会議がICPRであり,2002年度は600件以上の発表があった.玉石混淆であるが,この分野の概要を眺めるのには良い会議となっている.

国際的に評価が高い(競争率が高い)国際会議としては,ICCV,CVPR等がある.これらを概観すれば,現在注目を集めているトピックを探ることができるだろう.例えば,90年代はCGモデリングやVRやARのための3次元計測や復元の人気が高かったが,研究の流れが認識や学習の問題に戻ってきつつあるという指摘もある.

雑誌,論文誌としては,以下のようなものが代表的である.多くの図書館で電子的な購読をされているため,それらが利用できる場合には,検索システム等を利用された方が良いだろう.

□ 研究グループ,プロジェクトなど

国内の研究グループの紹介としては,以下のリンク集を紹介する.移り変わりが激しいため,網羅的にリストアップすることは難しいのだが,よく保守されている(奈良先端大/ATRの柴田先生によって作成され,現在は東大の森先生によって保守されている).

海外の研究グループの紹介としては,以下のサイトが役に立つだろう.日本の研究室へのリンクは手薄だが,欧米の主要な研究室が数多くリストアップされている.

□ 画像処理関係のリソース

画像処理のリソースに関して,2,3の有益なリンクを紹介する.まず,これまで公開されてきたサンプル画像,テスト画像へのリンク集として,以下の2つがある.ただし,既に配布を終了したもの,有償のものもあるので,注意されたい.

また,従来から,有償,無償に限らず,数多くの画像処理環境(ライブラリ)が公開されてきた.これらを一つ一つ紹介することは本稿の主旨に合わないため,最近注目を浴びている以下のライブラリを一つだけ紹介する.まだ未成熟の部分が多いが,Windows環境,Linux環境,双方でサポートされているため,今後の展開が期待される.

上記以外にも,多くの画像処理環境(ハードウェア,ソフトウェア)が市販されているが,商用のものについては本稿の範囲外とさせて頂きたい.

■ マルチメディア,ディジタルライブラリ関連

既存の映像・画像メディアのインデキシングや検索,新規データ(メディア)の取得支援(撮影,合成等)等,マルチメディア関連の基礎技術として,画像計測・認識技術や人工知能的手法が盛んに利用されている.

例えば,シーンチェンジの検出,人物・物体の認識,類似シーンの検索などを用いた映像の構造化・検索は,1990年代のホットな話題であった.最近は少し落ち着いた感があるが,内容に基づいたインデキシングを行うMPEG7規格が策定されたこともあり,今後はより実用を目指した研究・開発が行われることになるだろう.

日本では,このような研究を進めるためのテストベッドとして,映像処理評価用映像メディアデータベース(VDB)が作成されている.ニュース,ドラマ,ドキュメンタリー,料理番組を模擬してプロによって製作された映像が収録されており,著作権や肖像権の問題がクリアされているため,映像の一部を論文発表や口頭発表に利用できる.

映像の蓄積・検索は,電子図書館(ディジタルライブラリとも呼ばれる)とも関係が深い.例えば,米国のDLIプロジェクトの一つであるInformediaプロジェクトでは,ニュース映像の蓄積と検索(News on Demand),映像の要約と可視化等を研究テーマとしている.

最近では,マルチメディアの国際会議や論文誌でも映像・画像を扱った研究の比率が大きい.上記の問題に限らず,産業としての映像メディアの利用を視野に入れた研究や個人のための新しいサービスの創成といった研究テーマも多い.

■ おわりに

画像処理・認識の分野での有用なWebサイトの紹介,また,マルチメディア処理の分野でのサイトの簡単な紹介をした.近い将来,メディア,コンテンツの時代が来ると言われているが,それを実現するためには,これら双方の分野が緊密に協力しなければならない.そのためには新しい切り口から画像処理・認識の問題をとらえることも必要であり,人工知能的手法が重要な鍵となるだろう.例えば,映像を知識として大量に蓄積していくための枠組み,映像断片を再利用してわかりやすく知識を伝える問題等々,まだまだ試行錯誤で探っていくことが必要となっている.筆者らは,その一つとして,世の中の出来事を観測して自動的にマルチメディアデータとして蓄積していくための,観測・撮影・編集を自動化する知的なシステムの実現に取り組んでいる.