Vol.15 No.3 (2000/05) 理論言語学・自然言語処理


私のブックマーク

理論言語学・自然言語処理

1. はじめに

本報では、理論言語学及び自然言語処理の分野で、著者が愛用する欧米のサイトを紹介したい。自然言語処理は、このコーナーの第1回(vol.14
no.1)で浦本氏が紹介しておられるのでできる限り重複を避け、理論言語学の応用分野としての計算言語学を扱いたい。また、理論言語学と言っても(著者の興味の対象である)統語論・意味論に関連するサイトが中心で、音声については第8回(vol.15
no.2) の小林氏の報告などを参照されたい。

2. 学部・講座情報

日本の大学では独立した言語学部というのはあまりなじみがないが、[2.1]にはアメリカ、カナダの、[2.2]にはヨーロッパの、[2.3][2.4]にはアフリカ、アジア、オートラリア、中近東、南米まで含む言語学部・講座のホームページへのリンクが集められている。それぞれのホームページは各大学によって編集されたもので各大学での研究の特色がよくうかがわれ、研究者の顔写真などなかなか楽しい。特に自然言語処理を研究する講座の情報としては[2.5]のリンク集が挙げられる。

[2.1] http://www.lsadc.org/web2/programsfr.htm

[2.2] http://colibri.let.uu.nl/html/instframes.html

[2.3] http://www.ling.rochester.edu/links/departments.html

[2.4] http://www.emich.edu/~linguist/programs/

[2.5] http://www.cs.columbia.edu/~radev/u/db/acl/html/ACADEMIC/

3. 研究者情報

研究者個人を検索するためのホームページとしてはLSA(Linguistic
Society of America)のメンバーリスト[3.1]、ACL(Association for Computational
Linguistics)のメンバーリスト[3.2]の他、[3.3]にもサイトがあるが、このうち[3.1]の情報は研究者の電子メールアドレスに限られる。

[3.1] http://www.lsadc.org/web2/membfr.htm

[3.2] http://www.cs.columbia.edu/~radev/u/db/acl/html/PEOPLE/

[3.3] http://www.emich.edu/~linguist/personal/personala-c.html

4. メーリングリスト・学会情報

[4.1][4.2]には言語学のいろいろな分野でのメーリングリストのリストが掲載されている。そのうち、言語学全般をカバーする代表的なメーリングリストとしてLinguist[4.3]が挙げられる。講読者からのメールをWeb上で読むことも電子メールで受け取ることもでき、学会情報の提供はもちろんのこと、オンラインであらゆるトピックについて形式にとらわれない議論が戦わされているので、分野におけるタイムリーな関心のあり方がうかがわれて非常に興味深い。学会やワークショップの開催情報に限れば、FoLLI(European
Association for Logic, Language and Information)などがサポートするColibri[4.4](Web、電子メール両方可)、また過去(1965年!)から未来に及ぶ計算言語学関係の学会情報を掲載する[4.5]などがある。

[4.1] http://www.ling.rochester.edu/links/lists.html

[4.2] http://www.emich.edu/~linguist/list-archives.html

[4.3] http://www.emich.edu/~linguist/

[4.4] http://colibri.let.uu.nl/

[4.5] http://www.cs.columbia.edu/~radev/u/db/acl/html/CONFERENCE/

5. 論文・会議録

計算機に関連しない言語学の分野ではWebサイトからダウンロードできる論文は限られているが、[5.1][5.2]で読むことのできる論文、会議録、定期刊行物の抄録も少しはある。それで見つからない場合は、言語学関係の学術出版社のホームページへのリンク集[5.3][5.4]に期待したい。

計算言語学関係の論文、会議録のアーカイブはCoRR(Computing
Research Repository)[5.5]が有名で、CL(Computation and Language)の分野区分を選択して検索、ダウンロードすることができる。おそらく計算機関係で最も守備範囲の広いデータベースと言えるのではないかと思う。ACLやCOLINGの会議録などは上記の[5.1]や、[5.6]からもアクセスできる。

[5.1] http://www.ling.rochester.edu/links/journals.html

[5.2] http://colibri.let.uu.nl/html/papers.html

[5.3] http://www.lsadc.org/web2/publishersfr.htm

[5.4] http://www.ling.rochester.edu/links/books.html

[5.5] http://xxx.lanl.gov/archive/cs/intro.html

[5.6] http://www.ims.uni-stuttgart.de/info/EPapers.html

6. ツール

[6.1]には音声・構文・形態素・意味解析機など自然言語処理における主に研究目的のさまざまなツールの情報が集約されている。しかし、必ずしもこのページから実際にツールをダウンロードできるサイトへとリンクされているわけではない(されていない場合の方が圧倒的に多い)。[6.2]にもさまざまなツールのリストとそこからのリンクが提供されているが、こちらは商品として提供されているツールも多く、注文ページにたどりついてしまったりする。[6.1][6.2]いずれも検索はできない。

純粋に研究目的の構文解析・生成機に限られるが、実際にソースをダウンロードできるサイトとしてConTroll[6.3]、ALE(Attribute-Logic
Engine)[6.4]、CUF(Comprehensive Unification Formalism)[6.5]、Hdrug[6.6]などがある。

やや毛色の変わったデータベースとして、世界の自然言語やIPA(International
Phonetic Alphabet)のフォントへのリンクをあつめたサイトとして[6.7][6.8][6.9]がある。

[6.1] http://www.dfki.de/lt/registry/

[6.2] http://www.sil.org/linguistics/computing.html

[6.3] http://www.sfs.nphil.uni-tuebingen.de/controll/

[6.4] http://www.sfs.nphil.uni-tuebingen.de/~gpenn/ale.html

[6.5] http://www.ims.uni-stuttgart.de/projekte/cuf/

[6.6] http://odur.let.rug.nl/~vannoord/Hdrug/

[6.7] http://www.sil.org/computing/fonts/

[6.8] http://www.lsadc.org/web2/otherlinkfr.htm

[6.9] http://www.jtauber.com/linguistics/phonGIF/

7. その他

一般言語学に関連する情報を集めたリンク集としては[7.1]や[7.2]が、計算言語学では[7.3]や[7.4]が便利だ。上記でもその一部を紹介したが、他にも特定の下位分野に類別された情報、大学以外の研究組織、データベースや辞書、FTPサイトから求人情報までさまざまな情報が集められている。

最後に極端に限定される分野ではあるが、HPSG(Head-Driven
Phrase Structure Grammar)に関連するリンクをいくつか挙げたい。HPSGは研究者によって言語学理論とする見方と自然言語処理のフォーマリズムとする見方があるが、一般的にHPSGホームページと呼ばれるサイト[7.5][7.6]ではその両方をカバーしている。[7.8]にはHPSG関係の論文のデータベースが、[7.9]にはHPSG
Gazetteが掲載されている(電子メールによる購読も可)。

[7.1] http://www.ling.rochester.edu/linglinks.html

[7.2] http://colibri.let.uu.nl/html/

[7.3] http://www.cs.columbia.edu/~radev/u/db/acl/html/

[7.4] http://www.ims.uni-stuttgart.de/info/FTPServer.html

[7.5] http://hpsg.stanford.edu/

[7.6] http://www.ling.ohio-state.edu/hpsg/

[7.7] http://www.dfki.de/lt/HPSG/

[7.8] http://www.sfs.nphil.uni-tuebingen.de/~gazette/

(東京大学言語情報科学専攻 中澤恒子)