Vol.23 No.4 (2008/7) オントロジーの構築と利用


私のブックマーク

オントロジーの構築と利用

笹島宗彦(大阪大学産業科学研究所)

国立情報学研究所が提供する論文情報ナビゲータCiNii(サイニイ)[0-1]で検索すると,「オントロジー」を題名に含む論文が2007年(1月~12月)に84件発表されている.また,2008年度の人工知能学会全国大会[0-2]では「オントロジー」をタイトルに含むセッションが5つ,発表プログラムは18を数え,オントロジーという言葉の普及がさらに進んだことを実感している.さらに一般のIT関連情報メディアでも,例えばCNET Japanの記事[0-3]が「ウェブ 3.0」「ウェブ 4.0」という言葉を使って,オントロジーと関わりの深いセマンティック技術の今後の動向を予測している.

 その一方で,学会などの場で「(良い)オントロジーはどうしたら作れるのでしょう?」「こういった案件にオントロジーを利用したいのですが」といった御問い合わせを産官学問わず受けることが増えてきた.以下,オントロジーを構築し利用するときに参考となりそうなURLをいくつか紹介する.

[0-1] CiNii http://ci.nii.ac.jp/
[0-2] JSAI全国大会2008 https://www.ai-gakkai.or.jp/jsai/conf/2008/
[0-3] CNET Japan 「セマンティックの波2008」
    http://japan.cnet.com/column/rwweb/story/0,2000090739,20366436,00.htm

1.オントロジーの全般的な動向を知る

オントロジーの構築と維持には継続的な情報源が必要であり,基礎から応用まで取り揃えたポータルサイトが有用である.国立情報学研究所の武田による解説(私のブックマーク「オントロジー」,vol.15, No.6, (2000)[1-1])で紹介されたポータル”Some Ongoing KBS/Ontology Projects and Groups”[1-2]は,現在あまり更新されていないようであるが,著名なプロジェクトへのリンクがアルファベット順で並べられている他,メーリングリストや国際会議へのリンクもある.

従来,日本語の情報源はばらばらであったため,初学者で,ウェブリソースを利用して手軽にセマンティックウェブ技術を学びたいという方には,神崎正英氏による「メタ情報とセマンティックウェブ」[1-3]を勧めてきた.セマンティックウェブ技術におけるメタデータ,リソース,オントロジーなどの概念を,実例を交えて初学者向けに分かりやすく解説している.ある程度学習が進めば,2008年2月にINTAP(財団法人 情報処理相互運用技術協会)の次世代Web委員会によって公開された「オントロジ関連リンク集」[1-4]が知識源への入り口として有用と思われる.セマンティックウェブやオントロジーに関する研究組織やプロジェクト,公開されているオントロジーへのリンクなどが日本語で簡潔にまとめられている.各リンクには概説が付記されており,オントロジーという言葉の意味そのものからオントロジーやシソーラスに関する利用可能な研究リソース,公開されているオントロジー,代表的な各国のプロジェクトなど.一通り俯瞰できる.

上記のリンク集などで特にセマンティックウェブに関するプロジェクト動向に興味を持たれた方には,W3CのSemantic Web Activity[1-5]が助けとなるであろう.RDFやOWL,SPARQLなどの仕様へのリンクや各種記事,各ワーキンググループへのリンクなどが掲載されている.また,Repository of EASE[1-6]は,欧州で開催されたセマンティックウェブのセミナーや会議に関連するプレゼン資料やビデオアーカイブなどオントロジーを含めたセマンティックウェブ関連の学習教材を提供している.

[1-1] 私のブックマーク「オントロジー」
    https://www.ai-gakkai.or.jp/jsai/journal/mybookmark/15-6.html
[1-2] ”Some Ongoing KBS/Ontology Projects and Groups”
    http://www.cs.utexas.edu/users/mfkb/related.html
[1-3] メタ情報とセマンティックウェブ http://www.kanzaki.com/docs/sw/
[1-4] INTAP 「オントロジ関連リンク集」
    http://www.net.intap.or.jp/INTAP/s-web/portal/index.html#
[1-5] W3C “Semantic Web Activity”http://www.w3.org/2001/sw/
[1-6] Repository of EASE http://rease.semanticweb.org/

2.オントロジーの利用事例を知る

セマンティックウェブにおけるオントロジーの利用事例に関して,W3Cが[2-1]で全般的な情報提供をしている.各事例のリンク先にはそのプロジェクトの概要,動作例,セマンティックウェブ技術との関わりが動作画面例を交えて説明されている.上記のINTAP次世代Web委員会[2-2]も,オントロジーの利用事例を調査資料などと共に紹介している.また,オントロジーの利用事例について過去の主要な国際会議や研究会をサーベイし分析した結果を大阪大学の古崎が[2-3]で公開している.
 最新のオントロジー利用事例は,上記の各ポータルの他,オントロジーに関する国際ワークショップFOMI(International Workshop on Formal Ontologies Meet Industry[2-4]), 国際会議FOIS(International Conference on Formal Ontology in Information Systems[2-5]), EKAW(International Conference on Knowledge Engineering and Knowledge Management[2-6]),K-CAP(International Conference on Knowledge Capture[2-7]),セマンティックウェブ関連の国際会議(ISWC[2-8], ESWC[2-9], ASWC[2-10]),WWW関連の国際会議(WWW[2-11]), の予稿集でサーベイするのがよいであろう.セマンティックウェブ関連の会議ではIn-Use TruckやIndustrial Truckに,最新のアプリケーションに関する投稿がなされている.
 なお,網羅的ではないが,これら会議の大部分に関するその過去情報(開催時サイト,採択率など)や直近のイベント予定を,SemanticWeb.org[2-12]やEventseer.net[2-13]で調べることが出来る.また,メーリングリストseweb-list[2-14]は,SW関係の国際会議情報を配信している.
 国内の研究会では,上述した人工知能学会全国大会の他,人工知能学会のセマンティックウェブとオントロジー研究会[2-15],電子情報通信学会の知能ソフトウェア工学研究会[2-16],Webインテリジェンスとインタラクション研究会[2-16]などで,オントロジーとセマンティックウェブに関連する発表が活発に行われている.また,後述するJCOR(The Japanese Center for Ontological Research)が慶応大学にて開催したFirst Interdisciplinary Ontology Meeting(InterOntology08)[2-18]では,本会議が今後も毎年,継続的に開催されるとのアナウンスがあった.

[2-1] W3C “Semantic Web Case Studies and Use Cases”
    http://www.w3.org/2001/sw/sweo/public/UseCases/
[2-2] INTAP次世代Web委員会 http://www.net.intap.or.jp/INTAP/s-web/
[2-3] オントロジー応用研究事例の分析 http://www.ei.sanken.osaka-u.ac.jp/hozo/onto_apps/
[2-4] FOMI2008(過去開催分へのリンク有り) http://www.fomi2008.di.unito.it/
[2-5] FOIS2008 http://fois08.dfki.de/joomla/ 過去開催分は, http://www.formalontology.org/
[2-6] EKAW2008 http://ekaw2008.inrialpes.fr/ (隔年開催.過去開催分は”EKAW”で検索)
[2-7] K-CAP http://www.k-cap.org/
[2-8] ISWC http://iswc.semanticweb.org/
[2-9] ESWC2008 http://www.eswc2008.org/ (毎年開催.過去開催分URLはhttp://www.eswc.org/)
[2-10] ASWC2008 http://www.aswc2008.org/ (毎年開催.奇数年はISWCと共催.過去開催分URLはhttp://www.aswc.org/ )
[2-11] International WWW Conference http://www.iw3c2.org/conferences/
[2-12] SemanticWeb.org http://semanticweb.org/wiki/Main_Page
[2-13] Eventseer.net http://eventseer.net/search/ (“Ontology”,”Semantic Web”,<会議名>などでSearch)
[2-14] seweb-list (ML) https://lists.sti2.at/mailman/listinfo/seweb-list
[2-15] セマンティックウェブとオントロジー研究会 http://sigswo.org/
[2-16] 知能ソフトウェア工学研究会 http://kbse.comp.ae.keio.ac.jp/kbse/
[2-17] Webインテリジェンスとインタラクション研究会 http://www.ieice.org/~wi2/
[2-18] First Interdisciplinary Ontology Meeting(InterOntology08)
   http://abelard.flet.keio.ac.jp/ontology/index.php?InterOntology08

3.オントロジーを実際に構築する

大阪大学の溝口と古崎の調査[3-1] (調査対象:ESW Wiki SemanticWebTools[3-2],Ontology Tools Servey[3-3],SemWebCentral[3-4],SourceForge.net[3-5],加えてGoogle検索)によれば現在,RDFとOWLを取り扱うオントロジー構築ツールが約150ネット上に公開されている.
 統合開発環境としては,米スタンフォード大学によるProtégé[3-6],IBMのIODT(IBM Integrated Ontology Development Toolkit[3-7]),WSMO(Web Service Modeling Ontology)を用いてウェブサービスの記述を支援するためのWSMO Studio[3-8],商用のデータソース統合向けオントロジー構築ツールキットOntoStudio[3-9],推論器Pellet[3-10]を利用したオントロジーの矛盾検出機能を備えるSWOOP[3-11],ヒューレットパッカード研究所のJavaによるセマンティックウェブアプリケーション開発フレームワークJena[3-12]などが挙げられる.OWLのAPIプロジェクト[3-13]は,OWL Lite, OWL DLとOWL 1.1で記述されたオントロジー上で推論や矛盾検出をするためのインタフェースをJavaで開発するプロジェクトである.
 注目すべき特徴を備えた国産のツールも開発者らによって公開されている.大阪大学産業科学研究所溝口研究室の古崎らによる統合開発環境「法造」[3-14]は,ロール理論に従ったオントロジー構築と分散開発を支援する各種機能を備え,日本語の入門書なども出版されている.法造の技術サポートは(株)エネゲートが[3-15]で行っている.慶応大学山口研究室の森田らによるDODDLE-OWL[3-16]は,EDRやWordNetなど汎用オントロジーを利用したドメインオントロジーの半自動構築を支援するツールで,法律,医療事務など様々なドメインオントロジーの構築支援と,構築されたオントロジーの実業務利用で実績がある.また,国立情報学研究所 武田研究室の小出によるSWCLOS[3-17]は,Lispで記述された世界初のOWL-Full高速処理系である.参考までに前述のPelletを始め他の推論器はOWL-Lite,OWL-DLまでのサポートに留まっている.
 既存の知識源を編集して利用する場合には,本稿で紹介の各種プロジェクトのサイト毎にサンプルのオントロジーがいくつか公開されている他,所謂ライトウェイトオントロジーの研究で知識源として利用されることが多いWordNetとWikipediaについては,それぞれ,プリンストン大学のWordNetプロジェクト[3-18],ドイツの大学を中心に運営されているオープンコミュニティのDBpedia[3-19]のサイトに開発者向け情報などが公開されている.また,Web上に公開されたオントロジーをGoogleのようなインタフェースで検索するエンジンとしてSwoogle[3-20]がある.

[3-1] A List of Ontology Engineering Tools http://www.hozo.jp/OntoTools/
[3-2] ESW Wiki SemanticWebToolshttp://esw.w3.org/topic/SemanticWebTools
[3-3] Ontology Tools Servey http://www.xml.com/pub/a/2004/07/14/onto.html
[3-4] SemWebCentral http://projects.semwebcentral.org/
[3-5] SourceForge.net https://sourceforge.net/
[3-6] Protégé http://protege.stanford.edu/
[3-7] IBM IODT http://www.alphaworks.ibm.com/tech/semanticstk
[3-8] WSMO Studio http://www.wsmostudio.org/index.html
[3-9] OntoStudio http://www.ontoprise.de/content/e1171/e1249/index_eng.html
[3-10] Pellet http://pellet.owldl.com/
[3-11] SWOOP http://www.mindswap.org/2004/SWOOP/ 現在は http://code.google.com/p/swoop/
[3-12] JENA http://jena.sourceforge.net/
[3-13] OWLAPI http://sourceforge.net/projects/owlapi
[3-14] 法造 http://www.hozo.jp/
[3-15](株)エネゲートオントロジー技術サポートサイト http://ontsupport.enegate.jp/ontology/
[3-16] DODDLE-OWL http://doddle-owl.sourceforge.net/ja/
[3-17] SWCLOS http://www-kasm.nii.ac.jp/~koide/SWCLOS2.htm
[3-18] WordNet http://wordnet.princeton.edu/
[3-19] DBpedia http://dbpedia.org/About
[3-20] Swoogle http://swoogle.umbc.edu/

4.オントロジー関連プロジェクトの動向

プロジェクトの動向については上述の武田による「わたしのブックマーク[1-1]」にていくつか紹介されているが,それらのうち現在も活動しているものと,最近のプロジェクトのいくつかについて紹介する.
 米国スタンフォード大学のProtégéプロジェクト[4-1]は引き続き活発に活動を続けている([1-1]の紹介記事からURLが変わっている).本稿執筆時点でProtégéの登録ユーザ数は91,192人であり,2008年4月21日に3.4β版が公開されている.
 Cycプロジェクトで開発されたオントロジーの全体と推論エンジン,ブラウザ,開発向けAPIセットが,OpneCyc.org[4-2]で公開されており,現在も更新されている.本稿執筆時点での最新版(OpenCyc 1.0.2)のリリースノートには,Cycに収録の概念とWordNetの語彙を関連付けたとある.
 DAML(DARPA Agent Markup Language )プロジェクトは2006年に終了しOWLへと発展したが,DAML Ontology Library [4-3]では,DAMLまたはOWLで記述されたオントロジーを公開している.DAMLプロジェクトの成果を用途ごとに分類した利用ガイドが[4-4]にまとめられている.また,DAML+OILの開発に深く関わったMaryland大学のSHOE(Simple HTML Ontology Extensions)プロジェクト[4-5]から発展したセマンティックウェブMINDSWAPプロジェクト[4-6]は,DAMLからOWLへのコンバーター[4-7],前述の推論器Pelletなど様々なソフトを公開している.
 欧州の企業と大学でIT分野でのオントロジー活用をめざし,その一環としてOIL(Ontology Inference Layer)を開発したOn-To-Knowledgeプロジェクト[4-8]は2002年に終了しているが,OntoWebプロジェクト[4-9] (2001-2004),さらにKnowledge Webプロジェクト[4-10]へと引き継がれて,現在も活動が続いている.
 また近年,セマンティックウェブの知識源としてWikipediaを利用する研究やプロジェクトが始まっており,国際会議などでも盛んに発表されている.DBpedia[4-11]は,Wikipediaから構造化された知識を抽出して問題解決に利用する試みである.
 日本国内でも,実用を強く意識したオントロジー開発・利用プロジェクトが各分野で始まっている.バイオの分野では,産業技術総合研究所の生命情報工学研究センター(CBRC)[4-12]が,代謝などのシグナルを伝達するパスウェイに関する各種データベースをオントロジーによって統合するプロジェクトINOH[4-13]を運営している.また,日本語バイオポータルサイト[4-14]がバイオ分野のオントロジーとそのビューワを提供している.
 医療分野では,東京大学病院の臨床医療オントロジー研究ユニット[4-15]が臨床医学オントロジーの構築を目指して2005年にスタートしている.また,東京医科歯科大学田中研究室[4-16]の中谷らがゲノム・プロテオームなど網羅的分子情報(Omics情報)の臨床応用を目指し,臨床オントロジーとOmicsオントロジーを統合したClinical Omics Ontologyの構築に着手している.
 教育の分野では,大阪大学の林らがOMNIBUSプロジェクトにて教授理論のオントロジーと教育シナリオオーサリングツールSmartiesを公開している[4-17].ナノテクノロジーの分野では,東京大学の知識の構造化プラットフォームプロジェクトが,オントロジーを用いたナノ材料の発想・開発支援を目指して行われている[4-18].
 家電の分野では,情報家電基盤サービスフォーラム(SPIA)[4-19]が,ネットワーク家電の安全なリモート管理を目的として情報家電オントロジーを構築し,記述ガイドラインとともに公開している.
 工学の分野では,大阪大学の來村らが機能概念のオントロジー構築とその設計,信頼性解析等のタスクへの応用に取り組むプロジェクト[4-20]を運営している.また著者も,オントロジーに基づくユーザモデル構築とその利用によるモバイルサービス改善に関する研究を進めている[4-21].
 環境問題に取組むサステイナビリティ学の分野でも研究拠点が形成され[4-22],環境問題に関する諸概念を適切に俯瞰するためのツールとしてオントロジーが利用されている.また,慶応大学の福井研究室では,人口・食糧問題など持続可能な社会を脅かす問題に対応すべくデジタルアースプロジェクトに取り組んでおり,その一環であるデジタルアジアプロジェクト[4-23]で,オントロジーを用いてニュース記事から地域情報を抽出するブラウザを開発している.
 オントロジーに関連する事業としては,ITベンチャー企業の(株)サイバーエッヂ[4-24]がオントロジー生成用ソフトのオントロジジェネレータを販売している他,セミナーなども開催している.また,前項で挙げた(株)エネゲートのサイト[4-25]は,オントロジーエディタに関連する開発や利用者向けセミナーなどを開催している.CommonLispのアプリケーション開発環境を提供している米国のフランツ社[4-26]はWebサービス構築向けの開発支援も行っており,例えばLisp言語による高速なRDF処理系としてAllegroGraphを提供している[4-27].

[4-1] Protégé http://protege.stanford.edu/
[4-2] OpenCyc.org http://www.opencyc.org/
[4-3] DAML Ontology Library http://www.daml.org/ontologies/
[4-4] DAML Road map http://www.daml.org/roadmap.html
[4-5] SHOE http://www.cs.umd.edu/projects/plus/SHOE/
[4-6] MINDSWAP http://www.mindswap.org/
[4-7] DAML OWL Converter http://www.mindswap.org/~golbeck/code.shtml
[4-8] On-To-Knowledge http://www.ontoknowledge.org/
[4-9] OntoWeb http://www.ontoweb.org/
[4-10] KnowledgeWeb http://knowledgeweb.semanticweb.org/
[4-11] DBpedia http://dbpedia.org/About
[4-12] CBRC http://www.cbrc.jp/
[4-13] INOH http://www.inoh.org:8083/inohblog/main/
[4-14] 日本語バイオポータル http://www.bioportal.jp/
[4-15] 臨床医療オントロジー研究ユニット http://www.m.u-tokyo.ac.jp/medinfo/ont/
[4-16] 東京医科歯科大学田中研究室 http://bioinfo.tmd.ac.jp/
[4-17] Smarties http://edont.qee.jp/omnibus/doku.php
[4-18] 知識の構造化プラットフォーム http://mandala.t.u-tokyo.ac.jp/index.html
[4-19] 情報家電基盤サービスフォーラム http://net2.intap.or.jp/SPIA/
[4-21] モバイルサービス改善 http://www.ei.sanken.osaka-u.ac.jp/topics/Mobile
[4-22] サステイナビリティ学連携研究機構 http://www.ir3s.u-tokyo.ac.jp/
[4-23] デジタルアジアプロジェクト http://g-web.sfc.keio.ac.jp/digitalasia.html
[4-24] (株)サイバーエッヂ http://www.cyberedge.co.jp/
[4-25] (株)エネゲート http://ontsupport.enegate.jp/ontology/
[4-26]フランツ社日本法人 http://jp.franz.com/
[4-27] AllegroGraph http://jp.franz.com/base/allegrograph.html

5.オントロジーの研究拠点

2000年以降,各地でオントロジー研究の拠点が設立されている.欧州のオントロジー研究拠点ECOR(The European Centre for Ontological Research)[5-1],米国のNCOR(The National Center for Ontological Research)[5-2]に続いて,日本でも慶応大学を拠点とするJCOR(The Japanese Center for Ontological Research) [5-3]が設立された.哲学,論理,AI,オントロジー工学,バイオ,医学,工学,政治学,など,様々な学術分野を跨いだオントロジーに関する研究の推進を担い,学際的な研究シンポジウムを開催している.
 国内の大学では大阪大学の溝口研究室[5-4],慶応大学の山口研究室[5-5],北陸先端科学技術大学院大学の池田研究室[5-6],国立情報学研究所の武田研究室[5-7]などがオントロジー工学とセマンティックウェブに関する研究拠点である.

[5-1]ECOR http://www.ecor.uni-saarland.de/home.html
[5-2] NCOR http://ncor.us/
[5-3] JCOR http://abelard.flet.keio.ac.jp/ontology/
[5-4] 溝口研究室 http://www.ei.sanken.osaka-u.ac.jp/main/index.html
[5-5] 山口研究室 http://www.yamaguti.comp.ae.keio.ac.jp/
[5-6] 池田研究室 http://www.jaist.ac.jp/ks/labs/ikeda/cgi-bin/wiki/wiki.cgi
[5-7] 武田研究室 http://www-kasm.nii.ac.jp/index-j.html

6.オントロジー関連ジャーナル

2005年,IOS Pressから,Applied Ontologyが創刊された[6-1].IOS Pressでの紹介記事にあるように,オントロジーの基礎理論,哲学的考察から特定ドメイン応用,アプリケーションまで,オントロジーに関連するあらゆる論文を広く取り扱う.また,ELSEVIERから出版されているJournal of Web Semantics [6-2]や,Rinton Pressから出版されているJournal of Web Engineering[6-3]も,オントロジーやセマンティックウェブに関連する論文を掲載しているジャーナルである.

[6-1] Applied Ontology http://www.applied-ontology.org/
   IOS Pressでの紹介記事 http://www.iospress.nl/html/15705838.html
[6-2] Journal of Web Semantics http://www.websemanticsjournal.org/
[6-3] Journal of Web Engineering http://www.rintonpress.com/journals/jwe/

謝辞

本稿の執筆に当たっては,大阪大学産業科学研究所の溝口理一郎教授,來村徳信准教授,古崎晃司助教,林雄介助教から非常に有益なコメントを頂いた.ここに記し,感謝の意を表す.