チュートリアル講演1
5月27日(火) 13:40~15:20 A会場(大ホール)
「AIの品質マネジメントについて」

妹尾 義樹 氏
(産業技術総合研究所 知財標準化推進部 標準化オフィサー)

小西 弘一 氏
(産業技術総合研究所 デジタルアーキテクチャ研究センター 総括研究主幹)
AIの品質マネジメントについての課題と、それを解決するための先端の取り組みについて国際標準化の状況や欧州AI法制などの状況を含めて紹介する。特に品質マネジメントの方法論については、産総研が策定した「機械学習品質マネジメントガイドライン」の内容を中心に説明し、さらに最近注目を集めている生成AIについて、品質マネジメント視点での課題と解決への方向性を論ずる。
[ 略歴(妹尾 義樹)]
1986年京都大学工学研究科情報工学専攻卒。博士(工学)。NECの中央研究所に入社後、約30年間スーパーコンピュータ研究開発に従事。その後AI技術を活用した北米でのAnalyticsビジネス開発を指揮。2018年産総研入所後は人工知能研究企画室長、情報標準化室長などを歴任し、AI研究や情報技術に関わる標準化活動を指揮する傍ら、機械学習品質マネジメントについてのNEDOプロジェクトを研究代表として立ち上げる。現在は知財標準化推進部で標準化オフィサーとしてデジタル技術関連の標準化と統括する。
[ 略歴(小西 弘一)]
NECの研究所で30年間、研究と研究マネジメントに従事。分野は、並列処理、CDN、クラウド、データセキュリティ。2021年から産総研で機械学習品質マネジメントの活動に参加。ガイドラインの開発、AI品質に関する講座の運営、企業コミュニティの育成などを通じ、成果の社会実装を推進。
チュートリアル講演2
5月28日(水) 13:40~15:20 A会場(大ホール)
「深層基盤モデルの数理」

鈴木 大慈 氏
(東京大学・大学院情報理工学系研究科・教授/理化学研究所・革新知能統合研究センター・深層学習理論チーム・チームリーダー(兼務))
本講演では,深層基盤モデルの学習能力を理論的に理解するための数理を解説する.深層基盤モデルの開発はスケーリング則に従った大規模化によって進められている一方で,スケーリング則の背後にある学習原理の理論的理解への重要性も増している.生物は変化する環境に適応して適切な行動を選択する必要があることから,生物の知能にとって汎化能力は本質的に重要である.優れた汎化能力を獲得するためには,丸暗記ではない無駄を省いた圧縮された表現を得る必要があり,その意味で表現学習・特徴学習は本質的である.深層学習は深層構造から自然に特徴学習を実現し,それによって汎化に関する様々なアドバンテージを得ることが理論的に示される.このことは,拡散モデルやTransformerにおいて特に重要である.一方で,適切な特徴量が確率的勾配降下法によって獲得できるかは損失関数の非凸性より非自明であるが,その理論保証についても解説する.さらに,特徴学習は,事前学習だけでなくテスト時推論においても重要な意味を持つ.そのことを文脈内学習を例にとって端的に示し,さらにテスト時推論の理論として思考連鎖や強化学習によって学習の効率が上がる原理を紹介する.
[ 略歴 ]
2004年 東京大学 工学部 計数工学科卒業
2009年 東京大学 大学院情報理工学系研究科 数理情報学専攻博士課程修了
2009年~2013年 東京大学大学院情報理工学系研究科 数理情報学専攻 助教
2013年~2017年 東京工業大学 大学院情報理工学研究科 数理・計算科学専攻 准教授
2017年~2024年 東京大学 大学院情報理工学系研究科 数理情報学専攻 准教授
2024年~現在 東京大学 大学院情報理工学系研究科 数理情報学専攻 教授
日本神経回路学会論文賞,ICLR2021 Outstanding Paper Award,文部科学大臣表彰・若手科学者賞,日本統計学会研究業績賞を受賞.
チュートリアル講演3
5月29日(木) 13:40~15:20 A会場(大ホール)
「大規模視覚言語モデルの開発」

鈴木 哲平 氏
(SB Intuitions株式会社)

田中 稔之 氏
(SB Intuitions株式会社)

髙田 拓実 氏
(SB Intuitions株式会社)

品川 政太朗 氏
(SB Intuitions株式会社)
現在,大規模言語モデル(LLM)をはじめとした生成AI技術は以前に増して生活に身近な技術となっている.LLMの発展の中において,その高い認識・理解能力からLLMを様々なモダリティの認識・理解に活用する研究が数多く取り組まれている.特に,視覚情報処理という観点で,大規模視覚言語モデル(VLM)はその多岐にわたる応用から重要な技術となっており,現在までに様々なモデルが開発されている.
本講演では,まずはじめにLLMを基礎としたVLMのトレンドを俯瞰する.その後,VLMの学習データの構築から,学習,評価まで一連の開発のフローを,近年の研究事例やSB Intuitionsが公開しているVLMであるSarashina2-Visionの開発経験から得られた知見や課題を踏まえて紹介する.
[ 略歴(鈴木 哲平)]
2018年慶應義塾大学大学院理工学研究科修士課程修了.同年株式会社デンソーアイティーラボラトリ入社.2022年慶應義塾大学大学院理工学研究科後期博士課程修了.博士(工学).2024年よりSB Intuitions株式会社にてマルチモーダル基盤モデルの研究開発に従事.現在,同社にてマルチモーダル基盤モデルの研究開発チームをリード.
[ 略歴(田中 稔之)]
2019年北陸先端科学技術大学院大学先端科学技術研究科修士課程修了.同年三菱電機マイコン機器ソフトウエア株式会社入社.2022年株式会社本田技術研究所入社.2024年よりSB Intuitions株式会社にてマルチモーダル基盤モデルの研究開発に従事.VLMの学習を担当.
[ 略歴(髙田 拓実)]
2020年東京大学工学部卒業、2022年同大学大学院情報理工学系研究科修士課程修了.同年ソフトバンク株式会社へ入社し2024年10月よりSB Intuitions株式会社にてマルチモーダル基盤モデルの研究開発に従事.VLMのチューニングを担当.
[ 略歴(品川 政太朗)]
2013年東北大学工学部卒業.2015年同大学大学院情報科学研究科修士課程修了.2020年奈良先端科学技術大学院大学博士後期課程修了.博士(工学).2020年同大学助教を経て2024年4月よりSB Intuitions株式会社にてマルチモーダル基盤モデルの研究開発に従事.VLMの評価を担当.
チュートリアル講演4
5月30日(金) 12:00~13:40 A会場(大ホール)
「日本古典文化と生成AI」

北本 朝展 氏
(国立情報学研究所/ROIS-DS人文学オープンデータ共同利用センター)

カラーヌワット タリン 氏
(Sakana AI)
日本古典文化のための生成AIの研究開発について、テキストと画像を対象とした講演者らの取り組みを紹介する。江戸時代以前の日本文化に関しても、デジタル化や構造化を推進する関係者の努力によって、様々なオープンデータが利用できるようになってきた。こうしたデータを活用して過去の文化へのアクセス性を高め、現代の人々との距離を縮めるという目標に対して、生成AIはどのように貢献できるだろうか。講演者らの研究成果を中心に、そのインパクトと課題を議論する。
[ 略歴(北本 朝展)]
東京大学工学系研究科電子工学専攻修了。博士(工学)。現在、国立情報学研究所 コンテンツ科学研究系 教授および情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター センター長。データ駆動型サイエンスのアプローチを人文学や地球環境、防災などの分野で幅広く展開しており、自身が公開する学術研究基盤の利用回数は研究者から市民まで年間約4000万回に達する。また、オープンサイエンスの発展や超学際的研究コラボレーションにも取り組む。
[ 略歴(カラーヌワット タリン)]
早稲田大学大学院文学研究科博士課程修了。ROIS-DS 人文学オープンデータ共同利用センター、国立情報学研究所の特任助教、Google Research Brain Team、Google DeepMindのResearch Scientist を経て、Sakana AIのリサーチサイエンティスト。日本文化に適用する AI の研究開発に従事。2022 年度文部科学省科学技術・学術政策研究所により「ナイスステップな研究者」の 10 人に選定された。