○鎌田まみ,小方孝(岩手県立大学): 物語文章における文字表記 ―物語生成システムにおける文字表記調節機構に向けて―
日本語の表記の大きな特徴は,漢字,ひらがな,カタカナ, ローマ字という異なる文字種類が使用されていることである. ある書かれたテクストを見た時,我々はその表記自体から,ある印象を, 内容とは別の独立のものとして,受ける.
例えば、三島由紀夫の「暁の寺」 の中の,バンコックの寺を描写する諸ページや, 輪廻転生について講釈する諸ページは, 漢字の多さと美しさで,内容とは別の美を持っている. 同じ三島由紀夫でも初期の「花ざかりの森」は, 平安物語の感触を真似た,ひらがなの多い見た目を持っている. 大江健三郎の「洪水はわが魂に及び」 では,漢字・ひらがなを基調とする文字表記の中に, 突然カタカナの文章が出現する. 森鴎外の小説で私が印象的だったのは, ローマ字で書かれたドイツ語や英語の単語が時々混じることだった. 以上のように,特に日本語の文学作品においては,文字表記は, それ自体がひとつのレトリックであると言える.
日本語の文字表記を自然言語生成において扱おうとする場合, まず現象的な分析に基づくアプローチが可能であろう. ある特定の対象テクストを決め,その中で,漢字,ひらがな,カタカナ, ローマ字が出現する割合を分析し,それを模倣すれば, 対象テクストと類似した印象をもたらす見た目を実現することが出来ると思われる. さらに精密にするためには, 対象テクストにおける品詞ごとの文字表記の割合を分析し, それを模倣すれば良い. 特定の作家の特定の作品乃至その部分と類似した見た目を持つ, 別のテクストを作り出すことも可能だろう.
文字表記の問題は,テクストにおける純粋に形式的な部分のように見えるが, 文字表記を変えることによって, その単語の意味そのものが変化してしまう場合もある. しかしながら,相当程度形式的な問題であり, 意味の問題を外して,制度・規範・修辞・異化等の問題圏に切り込むには,良い主題に思える.