私のブックマーク
学習
1. はじめに
機械学習の研究は飛躍的な進歩を遂げ、専門化が進んでいる。元々は人間の学習能力を目標に始められた研究分野だが、それどころではなくなってきたようで、全体を一望するのが困難になってきた。しかも、機械学習の一分野である帰納論理プログラミングについて、理科大の溝口文雄教授によるブックマークが昨年9月号で取り上げられていて、機械学習全体をカバーする有力サイトも紹介済だったりする。そこで、大規模で便利なサイトに筆者がたまたま訪れたサイトを織り交ぜながら、紹介したい。また、このコラムで紹介済のブックマークは省くか、違った説明を試みるので、バックナンバーも合わせて参照されたい。
2. ポータルサイト
機械学習について調べ物をするとき、とりあえずなんでもそろっているポータルサイトとしては、MLnet(Machine
Learning network, http://www.mlnet.org)がある。このサイトはヨーロッパのESPRITプロジェクトでサポートされており、必要な情報が網羅されていて、非常に便利だ。たとえば、Community
のコーナーでは、Events(世界中の会議情報)、Groups(研究グループ情報)、Persons(研究者)のリストがあり、登録したい人が自分で入力しておけば、世界中から参照してもらえ、情報交換がスムーズである。Resource
のコーナーでは、データセットやソフトが網羅されている。昔からフリーで入手できたデータも多いが、とにかく一箇所にまとめられているので、自分で整理しておかなくても済むし、人に紹介するのも楽になった。
Links2Goという検索およびディレクトリサービス(http://www.links2go.com/)があるが、機械学習の入り口はhttp://www.links2go.com/topic/Machine_Learningである。関連するキーワードを配置したグラフ構造が現れ、有用なページが簡単にたどれる。汎用のサービスだが、上記アドレスを開くと機械学習関係のサイトがまとまって現れるので、機械学習のポータルとして紹介しても悪くあるまい。これだけ見やすくまとまっているなら、本コラムなど書くのをやめて、上のリンクをたどったほうがいいかもしれない
🙂 ちなみに、人工知能の入り口は、http://www.links2go.com/topic/AI_Researchである。
アメリカでは、カリフォルニア大学アーバイン校(UCI: http://www.ics.uci.edu/~mlearn/)のサイトが学習テスト用のデータセット
http://www.ics.uci.edu/~mlearn/MLRepository.htmlでよく知られている。データセットだけでなくリンク集
http://www.ics.uci.edu/~mlearn/MLOther.htmlも役立つ。
ウィーン大学のWidmerらによる Online Machine Learning Resources http://www.ai.univie.ac.at/oefai/ml/ml-resources.html
はMLnetと違い、人手で主観的に整理されており楽しめる。上述のLinks2Goへのボタンもついている。余談だが、筆者は1991年にWidmer先生の発表を聞いて共鳴し、機械学習と音楽を結びつける研究をスタートした。現在も機械学習により人間の感性を獲得する研究
http://www.nm.cs.titech.ac.jp/lab/papers/index-e.htmlを進めている。
機械学習の応用として、今ホットな分野はデータマイニングであろう。総合的ポータルサイトとして次がある。
http://kdnuggets.com/
http://insight.cse.nau.edu/DataMining.htm
ゲームに興味を持っている会員も多いと思うが、ゲームにおける機械学習技術についてのリンクが次にある。
http://satirist.org/learn-game/
機械学習について日頃難しいと感じている読者でもこのページからなら興味を持てること請け合いである。
3. メーリングリスト
UCIの M. Pazzani により、機械学習のメーリングリストが運営されてきた。Moderated
であり、編集者に掲載希望内容をメールすると、内容を吟味の上次号に掲載してもらえる。過去の記事のアーカイブが、
http://www.ics.uci.edu/~mlearn/MLList.htmlにある。現在は、Wayne
Iba 氏(ISLE http://www.isle.org/ &
スタンフォード大学CSLI http://www-csli.stanford.edu/)が運営しており、ml-request@isle.org
に要求するとメーリングリストに加えてもらえる。ネットワークのトラフィックを減らすため、筆者が日本での再配布を行っている。日本国内で購読する場合は、
m-learning-request@nm.cs.titech.ac.jpにメールすれば、購読方法をお送りする。
上述のMLnetにもメーリングリストがあり、 http://www.mlnet.org/mlnet2/services/mlnet-community.htmlから登録できる。
4. Journal論文のページ
代表的な雑誌 Machine Learning のサイト
http://www.wkap.nl/journalhome.htm/0885-6125
では論文の検索ができ、アブストラクトが読める。Data Mining and Knowledge Discovery
http://www.wkap.nl/journalhome.htm/1384-5810
についても同様である。昨年より機械学習のオンラインジャーナル
http://www.jmlr.org/
が発行されている。まだ掲載論文は少ないが、時々チェックしておくべきであ
る。帰納論理プログラミングや発見の論文については、New Generation
Computing誌
http://www.ohmsha.co.jp/ngc/
にもよく掲載される。
5. 学習手法およびプログラム
決定木およびILPについては9月号を参照。機械学習のライブラリとしては、MLC++
http://www.sgi.com/Technology/mlc/が定番である。C5.0のデモ版などデータマイニングツールの試用版が次からダウンロードできる。
http://www.rulequest.com/
大御所のMichalski教授が推進している多戦略学習の最新情報については、昨年の会議のサイトを参照するといい。
http://www.ncc.up.pt/liacc/ML/Events/MSL00/
機械学習と密接な関係があり、人間の学習を語る際には必ず話題になるのが、アナロジーである。筆者は以前
にアナロジーの特集 http://www.ipsj.or.jp/members//Magazine/Jpn/3405/index.htmlを企画したことがあり、動向が気になっているが、人工
知能学会誌よりも認知科学 http://www.sccs.chukyo-u.ac.jp/jcss/で取り上げられることが多いようである。最近次の日本語のページを見つけた。作成者の興味が素直に現れていて好感が持てた。
http://member.nifty.ne.jp/digitallife/
今流行のSupport Vector Machineについては、プログラムと参考文献が、
http://ais.gmd.de/~thorsten/svm_light/
にあり、研究者の紹介などが、 http://vision.ai.uiuc.edu/mhyang/svm.html
に出ている。
人工知能全体に関するリポジトリだが、 http://www.cs.cmu.edu/afs/cs.cmu.edu/project/ai-repository/ai/html/air.html
は充実している。試しにキーワードMachine Learningで検索すると多数ヒットする。データ本体が集められているのでリンクが切れているという心配がなく使いやすい。内容がCD-ROMとして$60で売られているので、ダウンロードが遅くて困っている方にはいいかもしれない。
6. おわりに
本稿を執筆して、機械学習に限っても膨大な量のサイトがあることがよく分かった。学会誌はこれまでは情報を提供するのが使命だったが、必要な情報を読者のレベルに応じて、精選することがより重要になってきたようである。ブックマークの企画を広げ、解説論文もクリッカブルにして、読者のレベルに応じて概説から専門的情報までもカバーできるようにするのも面白いかもしれない。
謝辞:
研究室のチャン ナム トアン君、五十嵐建平君をはじめ、日頃からWebサイトの情報を提供して下さっている方々に感謝したい。
[沼尾正行(東京工業大学大学院情報理工学研究科計算工学専攻),numao@cs.titech.ac.jp]