緒方 典裕 (大阪大学大学院 言語文化研究科 言語情報科学講座)
以前、Ocaml を使って、Moravcsik, Pustejovsky 等 のaitia schema, qualia を格調・一般化・数学的再定式化するかたちで、Formal Cutural Ontology を定義、実装、格調を行ってきた。Formal Cutural Ontology とは、次のような体系であり、
![]()
地域言語・地域文化・民俗誌・民族誌の形式仕様化・比較・ データマイニングなどの形式的研究の基礎となるデータ形式として提案してきた。 そして、「語義」はレコード型の一種としてのqualia 型のオブジェクトとして定義された。
本稿では、より純粋な関数型プログラミング言語 Haskell を使って、 このようなqualia 型のオブジェクトのクラスタリングを、qualia の記述内容に関する Leveshtein 距離に基づいて示し、 その統計プログラミング言語R1でクラスタリングを行う。 Haskell によるLevenshtein 距離の測定プログラムは、 尾上の実装を利用する。
本稿では、東アジア、特に、中国の始祖説話(ancestry tale) に関するqualia を例題として、それらをクラスタリングする。東アジアの始祖説話に関するトッ プダウンな分類理論は、三品、福田, 大林などがあるが、 各始祖説話は多様な側面を持ち、トップダウンな分類には限界があるため、 クラスタリングの応用がこの分野への情報科学的アプローチになるという利点がある。