Google、最大4倍高速なLLM「DiffusionGemma」無償公開
概要
Googleは2026年6月10日、テキスト拡散(text diffusion)手法によりテキスト生成速度を最大4倍高速化できるマルチモーダルLLM「DiffusionGemma」を発表。Apache 2.0ライセンスでHugging Faceで無償公開。速度重視の実験的モデルで、全体的な品質はGemma 4より低い。
詳細
- 総パラメータ数260億、アクティブパラメータ数40億のMoE(エキスパート混合)モデル
- テキスト・画像・動画の混在入力に対応
- NVIDIA H100で1,000トークン/秒以上、RTX 5090で700トークン/秒以上
- トークン逐次生成ではなくブロック並列生成により高速化
- AI画像生成の拡散手法をテキスト生成に応用
- インライン編集・ローカルワークフロー・速度重視用途に適す
参照
- 出典: https://pc.watch.impress.co.jp/docs/news/2116352.html
- はてなブックマーク数: 132