【記事更新】私のブックマーク「大規模言語モデルと知識グラフ」


私のブックマーク

大規模言語モデルと知識グラフ

江上 周作(産業技術総合研究所)

1.はじめに

 知識グラフ(Knowledge Graph:KG)とは,実世界の知識を蓄積・伝達することを目的とした「データのグラフ」であり,そのノードは関心のあるエンティティを表し,エッジ(リレーション)はそれらの間のさまざまな関係を表す.「データのグラフ」にはいくつかの形式があるが,本記事では〈主語,述語,目的語〉の三つ組(トリプル)で構成されるエッジラベル付き有向グラフを主として扱う.
 大規模言語モデル(Large Language Model:LLM)とKGは相補的な関係にあり,LLMの能力向上のためのKG応用(KG4LLM)やKG構築のためのLLM応用(LLM4KG)の研究が活発化している.LLMとKGの統合に関するロードマップの初出時からすでに2年以上が経過しており,LLMの極めて早い進化速度のなかでは,活発化というには時間が経ち過ぎているかもしれない.しかし,依然として研究現場においてはホットなトピックであり,汎用人工知能(AGI)の開発の文脈でも注目されている.LLMとKGに関する数多くのサーベイ論文が出ているため,すべての領域の網羅的な事例紹介はそちらに委ね,あくまで執筆時点(2025年 10月)における筆者の視点でのブックマークとして,LLMとKGの融合的研究の動向を紹介する.

2.大規模言語モデルを用いた知識グラフの構築

 従来,非構造化テキストデータからKGを構築するためには,機械学習,自然言語処理,クラウドソーシングなどの手法を複雑に組み合わせる必要があり,また,正確性を保証することは困難であった.したがって,最終的には人手による修正を含む,高コストな作業となっていた.LLMの登場以降,LLMの言語理解・生成能力を生かして,KGを構築・拡張する研究が増加している.以下にその例を紹介する.

2・1 テキストの知識グラフ化
2・2 オントロジー構築

 本学会のSWO研究会での議論に則り,KGの定義に含まれるオントロジーの構築についても紹介する.

2・3 知識グラフ補完

 あらゆる事物間の関係を網羅した完全なKGの構築は困難であり,欠損している知識を補完する知識グラフ補完(Knowledge Graph Completion)やリンク予測(Link Prediction)は重要な技術である.知識グラフ補完についてもLLMを用いた手法が登場している.

3.知識グラフの大規模言語モデルへの応用

 LLMが抱えるハルシネーションやドメイン知識不足の課題を克服するため,KGが応用されている.KGをLLMに応用する研究事例を紹介する.

3・1 知識グラフ強化型 LLM

 知識グラフ強化型 LLM(KG-enhanced LLM)は,LLMの事前学習や推論過程にKGを活用することで,より正確で根拠のある応答や高度な推論を実現するアプローチを指す.

3・2 知識グラフ(知識ベース)質問応答

 知識グラフ質問応答(KGQA)または知識ベース質問応答(KBQA)は,自然言語の質問を入力として,KG上のエンティティやデータベース操作結果(集約関数など)を回答するタスクである.

3・3 RAGにおける知識グラフ応用

 ユーザクエリに関連する情報を文書から検索し,コンテキストとしてプロンプトに組み込む Retrieval-Augmented Generation(RAG)にKGを応用する研究を紹介する.

4.その他の知識グラフ

 上記で扱われる一般的なKGとは異なり,特徴的なKGを対象としてLLMを活用した研究についても紹介する.

4・1 時間的知識グラフ

 時間的知識グラフ(Temporal Knowledge Graph:TKG)は,通常の〈主語,述語,目的語〉からなるトリプルに加えてタイムスタンプをもつKGである.ここで,タイムスタンプは単一時点(Time Point)か期間(Time Interval)である.

4・2 マルチモーダル知識グラフ

 マルチモーダル知識グラフ(Multi-Modal KnowledgeGraph:MMKG)はエンティティとして画像や動画などの非記号データを含み,モダリティを超えた知識処理を可能にするリソースとして注目を集めている.

5.サーベイ

 LLMとKGを組み合わせた研究について多数のサーベイ論文や,論文やソフトウェアをまとめたGitHubリポジトリが公開されている.より網羅的な研究紹介についてはそちらをぜひ参考にしていただきたい.

6.おわりに

 本記事では,LLMとKGを組み合わせた研究について,特にKGの構築(LLM4KG)とKGの応用(KG4LLM)の視点からそれぞれ簡潔に紹介した.これからLLMとKGの融合的研究やプロダクト開発に取り組む方にとって,本記事で紹介した研究のいずれかがきっかけとなり,関連分野に参入していただければ幸いである.
 LLMとKGの融合的研究の多くに共通する課題として,KGの構造を情報損失なくLLMに認識させる方法があげられる.本記事で紹介した研究のいくつかは,この課題の解決に取り組むアプローチを提案しているが,現時点で決定的な解決策が確立されているわけではない.今後も引き続き活発に研究が行われ,LLMとKGの融合により,より高度なAIシステムの実現が期待される.

7.謝辞

 貴重な機会を与えてくださった本学会誌編集委員会の皆様に心より感謝申し上げます.