私のブックマーク
アクティブマイニング
高間 康史
(東京都立大学 電子システム工学科)
はじめに
近年,顧客情報や遺伝子情報,医療データなど,大規模に蓄積されたデータから何らかの知識,規則性を発見して有効に活用したいという二一ズと,機械学習やニューラルネットワーク,ラフ集合など,人工知能やソフトコンピューティングなどに関連するシーズとなる研究・技術の進展により,データマイニングやアクティブマイニングに関する研究,ビジネスが話題となっています.
ここでは本号 (Vol.17,No.5)
の小特集・論文特集「アクティブマイニング」に関連して,
著者が研究分担者として参加している科学研究補助金特定領域研究 (B)
「情報洪水時代におけるアクティブマイニングの実現」
のプロジェクトで収集したページを中心に,
データマイニングに関するページを紹介します.
関連する情報として,過去
(Vol.16, No.6) の「私のブックマーク」に,テキストマイニング
関連サイトが詳しく紹介されていますので,
あわせてご参照いただくとよいでしょう.
データマイニングー般
まず,データマイニング全般に関するWebページとして,情報量の多いサイト,初心者にもわかりやすいサイトをいくつか紹介します.紙面の都合であまり多くのサイトを紹介することはできませんが,以下に紹介するサイトから辿れば十分な情報を得ることができるでしょう.
- KDnuggets:データマイニング,ウェブマイニング,意思決定支援などの情報が集められており,非常に充実しています.
http://www.kdnuggets.com/ - 日本アイ・ビー・エム(株)東京基礎研究所のデータマイニングに関するページ.研究内容を中心に,データマイニングについてのわかりやすい説明,関連リンクなどがあります.
http://www.trl.ibm.com/projects/s7800/DBmining/ - 初心者にとってわかりやすくまとめられている,その名も「データマイニングの宝箱」.(株)産学共同システム研究所の石川’虞也氏が運営されています.
http://www5.ocn.ne.jp/~shinya91/ - The Data Mine:データマイニングを六つの話題に分けて情報を掲載しています.登録すれば,サイトの編集(情報の追加など)を行うこともできるようです.
http://www.the-data-mine.com/ - マーケターのためのデータマイニング講座((株)@ITのホームページに掲載されている連載記事).上記のようなポータルサイトではありませんが,ビジネス課題主導の観点から,CRMとデータマイニングの関係などについて,実例も交えてわかりやすく解説されています.
http://www.atmarkit.co.jp/fitbiz/serial/datamining/01/01.html
次に,データマイニングに関連する国際会議やオンラインジャーナル(会員外はアブストラクトのみ)などのサイトです.
- DS (Intemational Confrence on Discovery Science)
http://www.i.kyushu-u.ac.jp/ds2001/
(Washingon D.C., November 25-28,2001)
http://www.dfki.de/~lange/ds2002.html
(Lubeck,November 24-26,2002) - PAKDD (Pacific-Asia Confrence on Knowledge Discovery and DataMining)
http://arbor.ee.ntu.edu.tw/pakdd02/ (Taipei,May6-8,2002) - PKDD (European Confrence on Principles and Practice of Knowledge Discovery in Databases)
http://ecmlpkdd.cs.helsinki.fi/
(Helsinki,August 19-23,2002) - SIGKDD (ACM Special Interest Group on Knowledge Discovery in Data and Data Mining):
KDD Confrenceを開催しています.
http://www.acm.org/sigkdd/ - VLDB (Very Large Data Base Endowment Inc.):VLDB Confrenceを開催
http://www.vldb.org/
http://www.cs.ust.hk/vldb2002/
(VLDB2002,HongKong,August 20-23,2002) - データマイニング・オリンピック
http://www2.ipcku.kansai-u.ac.jp/~yada/olympic.htm - Discovery Challenge
http://lisp.vse.cz/challenge/ - Data Mining and Knowledge Discovely (Kluwer Academic Publishers)
http://www.digimine.com/usama/datamine/ - IEEE Transaction on Knowledge and Data Engineering (IEEE Computer Society)
http://www.computer.org/tkde/
データマイニングに関するツール,製品なども数え切れないほどあり,網羅することは不可能ですが,Kdnuggetsで行われた,使用ツールについてのアンケート結果(
http://www.dnuggets.com/polls/data_mining_tools_2002_june2.htm
)での上位5ツールについて紹介します.
- SPSS Clementine:
http://www.spss.co.jp/product/ALL/clemen/ - Weka:
http://www.cs.waikato.ac.nz/~ml/weka/index.html - SAS:
http://www.sas.com/offices/asiapacific/japan/index.html - CART/MARS:
http://www.salford-systems.com/index.html - SPSS/AnswerTree:
http://www.spss.co.jp/product/ALL/A_tree/index.htm
アクティブマイニング
アクティブマイニングの詳細については,本号(VoL17,No.5)の小特集・論文特集を参照してください.以下では,科学研究補助金特定領域研究(B)「情報洪水時代におけるアクティブマイニングの実現」のプロジェクトに関連して収集したサイトを列挙します.まず,本プロジェクトのサイトです.各研究グループの研究紹介,各研究者の情報はここから辿ることができます.
- 科学研究補助金「特定領域研究(B)」:「情報洪水時代におけるアクティブマイニングの実現」ホームページ
http://www.ar.sanken.osaka-u.ac.jp/activemining/
本プロジェクトの具体的問題領域の一つとして,医療データからのデータマイニング,知識発見があります.このテーマに関連して,医学情報に関するポータルサイト,データベースに関するサイトを収集しました.
まず,医療従事者向けのポータルサイトを紹介します.
- UMIN(University hospital Medical Information Network):情報提供・検索,情報提供支援,情報交流支援,情報収集支援など.登録者用サービス,会員制ホームページあり
http://www.umin.ac.jp/ - GCLEW.com:医学・医療サイトの紹介・登録.医療従事者向けだけでなく,一般向け情報もあり.国内外医療ニュース提供
http://www.gclew.co.jp/
患者向けのポータルサイトも数多く存在しますが,その中の一つとして,C型慢性肝炎患者のポータルサイトは規模も大きく,情報量も豊富です.
- C型肝炎のホームページ:C型慢性肝炎患者Mrs.Elaine氏のページの翻訳版
http://ns.lancenet.or.jp/heppers/
本プロジェクトに関連する話題として,EBM(Evidence Based Medicine)があるのですが,実践方法などについてのドキュメントとして以下のものが公開されており,代表的な医学情報データベースであるMedlineを中心に詳しく解説されています.
- EBMのためのMedline検索(神奈川歯科大学 森實敏夫教授著)
http://www.medical-tribune.co.jp/benri/ebm/ebm1.htm - 日本大学医学部公衆衛生学教室によるEBMの紹介
http://www.med.nihon-u.ac.jp/department/public_health/ebm/index.html - 杏林大学医学図書館Web通信
http://libweb.kyorin-u.ac.jp/~medlib/web-tsushin/web_info/web_info_index.html
この中で,「図書館員が考えるEBM」(諏訪部直子氏著)に,EBMの利用についてよくまとめられています.
http://libweb.kyorin-u.ac.jp/~medlib/web-tsushin/web_info/ebm1.html
http://libweb.kyorin-u.ac.jp/~medlib/web-tsushin/web_info/ebm2.html
http://libweb.kyorin-u.ac.jp/~medlib/web-tsushin/web_info/ebm3.html
http://libweb.kyorin-u.ac.jp/~medlib/web-tsushin/web_info/ebm4.html
EBMに利用可能な情報源(デタベース,ジャーナル)としては以下のものがあります.
- Cochrane Library: “High quality evidence to inform people providing and receiving care, and those responsible for research, teaching, funding and administration at all levels.” (抜粋)
http://www.update-software.com/Cochrane/default.HTM - BETs (Best Evidence Topics) : “BETs were developed in the Emergency Department of Manchester Royal Infirmary, UK, to provide rapid evidence-based answers to real-life clinical questions, using a systematic approach to reviewing the literature. BETs take into account the shortcomings of much current evidence, allowing physicians to make the best ofwhat there is.” (抜粋)
http://www.bestbets.org/ - ACP Journal Club: “The contents is carefully selected from over 100 clinical journals through reliable application of explicit criteria for scientific merit, followed by assessment of relevance to medical practice by clinical specialists.” (抜粋)
http://www.acpjc.org/ - EMBASE: 「MEDLINEとともに著名な医学データベースで,特に医薬品に関する文献が充実
(
http://www.nifty.com/dialog/index.htmlより抜粋)
http://www.embase.com/about - PubMed:米国立医学図書館 (National Library of Medicine, NLM) による,医学分野における代表的デタベースMEDLINEの全文献を中心に検索可能.NLM内のNational Center for Biotechnology Information (NCBI) が運営
http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed
おわりに
アクティブマイニングプロジェクトにおいて収集したページを中心に紹介しましたので,従来の「私のブックマーク」とは趣がいくぶん異なるものとなりましたが,お役に立てば幸いです.
今回の執筆にあたり,科学研究補助金特定領域研究(B)「情報洪水時代におけるアクティブマイニングの実現」プロジェクトの方々に感謝します.