メーリングリスト詳細 : 2025.10.06 17:53:14
投稿日 2025.10.06 17:53:14
タイトル 非線形科学セミナー: 田中琢真氏 10/9 10:00〜
本文 メーリングリストの皆様

お世話になっております。東京大学 新領域、数理・情報教育研究センター の小林 亮太と申します。

10/9 10:00〜 より 田中琢真 さんにセミナー 「連続性・予測可能性・マタイ効果〜ニューラル言語モデルによる和歌の文化系統解析〜」
をお願いしました。
対面、Zoom どちらでも歓迎いたします。興味のある方はぜひご参加ください。

詳細は以下の通りです。
-----
日時:   10月9日 10時〜
会場:   東京大学 柏キャンパス 基盤練 2F 共通セミナー室 (2C5, 2C7) + オンライン
    オンライン参加登録は こちら
https://u-tokyo-ac-jp.zoom.us/meeting/register/8eXpMymwQMCKD4Sx4XpR6g
タイトル:
    連続性・予測可能性・マタイ効果〜ニューラル言語モデルによる和歌の文化系統解析〜
アブストラクト:
    文化は模倣や試行錯誤で進化する。文化の進化については、
(1)ある時代の文化はその前後の時代の中間か、あるいは全く別か?
(2)将来の文化は予測できるか?
(3)文化の発展の時系列は逆回しと区別できるか?
(4)文化の産物の後世への影響力の判定は時代を通じて一貫しているか?
(5)文化の産物の影響力は偶然に左右されるか?
(6)文化の変化を決定するのは何か?
などの問いが浮かぶ。これらの問いにニューラル言語モデルと古典和歌データベースで答えることを試みた。BERTで歌をベクトル化し、それぞれの歌についてそれよりも古い歌の中で一番近いものを親だとして歌の家系図(系統樹)を作った。この系統樹は本歌取りと有意な一致を示した。
 (1)は、歌が最初の勅撰集『古今和歌集』と最後の勅撰集『新続古今和歌集』のどちらに近いか判定する分類器を作ることで調べた。すると,間の勅撰集はなめらかに移り変わっており、ある時点の文化はその前後の文化の中間だといえた。他方、最初の勅撰集『古今和歌集』と8番目の勅撰集『新古今和歌集』の分類器を作り,9番目以降の勅撰集を判定したところ、外挿はできず、(2)は否定された。系統樹の形から定義できるある量によって正しい時間順序と逆順を区別できるため、(3)は肯定された。この量は歌の作風の多様化・画一化を判別でき、歌は時とともに多様化したことがわかる。(4)に答えるため、系統樹で子が多い歌を影響力が強い歌と判定することにした。ある時代までの歌だけで訓練したニューラル言語モデルによる系統樹と、すべての歌で訓練したニューラル言語モデルによる系統樹を比較すると、この二つの系統樹の歌の子の数には弱い正の相関があることがわかった。(5)はマタイ効果の問題である。勅撰集に選ばれることで,ますます有利になる(名作だとみなされて本歌取りされるようになる)かを調べるため、ある勅撰集に選ばれた歌で、初出は古い歌集であるものを、初出は同じ歌集だがこの勅撰集には選ばれていない歌と比較した。すると、勅撰集以降の子の数は勅撰集に選ばれたものの方が多いことがわかった。(6)に答えるためモデルを構築し、ランダムウォークと自己励起で以上の結果を再現できることを示した。
 本発表はTakuma Tanaka “Mean-reverting self-excitation drives evolution: phylogenetic analysis of a literary genre, waka, with a neural language model” Humanities and Social Sciences Communications 12, 394 (2025) (https://doi.org/10.1057/s41599-025-04714-1 )に基づく。

人工知能学会TOP