【講演概要】

Formal Cultural Ontologyとしての「語義」とその関数プログラミングによる実装 (4) --qualia クラスタリング(1)

緒方 典裕 (大阪大学大学院 言語文化研究科 言語情報科学講座)



以前、Ocaml を使って、Moravcsik, Pustejovsky 等 のaitia schema, qualia を格調・一般化・数学的再定式化するかたちで、Formal Cutural Ontology を定義、実装、格調を行ってきた。Formal Cutural Ontology とは、次のような体系であり、

地域言語・地域文化・民俗誌・民族誌の形式仕様化・比較・ データマイニングなどの形式的研究の基礎となるデータ形式として提案してきた。 そして、「語義」はレコード型の一種としてのqualia 型のオブジェクトとして定義された。
本稿では、より純粋な関数型プログラミング言語 Haskell を使って、 このようなqualia 型のオブジェクトのクラスタリングを、qualia の記述内容に関する Leveshtein 距離に基づいて示し、 その統計プログラミング言語R1でクラスタリングを行う。 Haskell によるLevenshtein 距離の測定プログラムは、 尾上の実装を利用する。
本稿では、東アジア、特に、中国の始祖説話(ancestry tale) に関するqualia を例題として、それらをクラスタリングする。東アジアの始祖説話に関するトッ プダウンな分類理論は、三品、福田, 大林などがあるが、 各始祖説話は多様な側面を持ち、トップダウンな分類には限界があるため、 クラスタリングの応用がこの分野への情報科学的アプローチになるという利点がある。