H3-06

06.14(金) 15:10-15:50 展示会場内RoomH

展示会場内セミナー

国内で開発された3つの大規模言語モデルの紹介

提供日本AMD株式会社

ChatGPTが登場して以降、国内外で独自の大規模言語モデルを開発する動きが盛んになっている。本講演では、Fugaku-LLM, Swallow, LLM-jpなどにおける大規模言語モデル開発の状況について紹介する。特に、大規模なモデルの学習を行う上で必要になる分散並列学習手法やフレームワークの最新情報について紹介する。
  • AIインフラ / データセンター
Speaker

(大)東京工業大学

学術国際情報センター
先端研究部門
高性能計算先端応用分野
教授

横田 理央

タイムテーブルに戻る