「AIコーディング」がたった5年で急進化したワケ——NTT「tsuzumi 2」開発者が分析(Interop Tokyo 2026)
概要
コーディングに長けた大規模言語モデル(LLM)が登場したのは2021年ごろで、それから5年で競技プログラミングを解けるレベルに急成長した。その背景をNTT人間情報研究所のtsuzumi 2開発者がInterop Tokyo 2026で分析・解説した。
詳細
- LLMのコーディング能力の進化は3段階で整理できる:①ベースモデル(GPT-3相当)→②インストラクションモデル(ChatGPT前身のInstructGPT)→③エージェントモデル
- ベースモデルはGitHubのPythonコード159GBを学習し、これがCodexやCopilotの初期バージョンに使われた
- データ品質改善により学習なしで30点台だったHumanEvalベンチマークが65点超に向上
- オープンソースのStarCoder2のトレーニングデータ「The Stack v2」は32.1TB・619言語に拡大
- 2024年下半期から登場したエージェントモデルがClaude Codeなど実際のAI開発サービスを生んだ
参照
- 出典URL: https://www.itmedia.co.jp/news/articles/2606/18/news038.html
- はてなブックマーク数: 20