「AIコーディング」がたった5年で急進化したワケ——NTT「tsuzumi 2」開発者が分析（Interop Tokyo 2026）

概要

コーディングに長けた大規模言語モデル（LLM）が登場したのは2021年ごろで、それから5年で競技プログラミングを解けるレベルに急成長した。その背景をNTT人間情報研究所のtsuzumi 2開発者がInterop Tokyo 2026で分析・解説した。

LLMのコーディング能力の進化は3段階で整理できる：①ベースモデル（GPT-3相当）→②インストラクションモデル（ChatGPT前身のInstructGPT）→③エージェントモデル
ベースモデルはGitHubのPythonコード159GBを学習し、これがCodexやCopilotの初期バージョンに使われた
データ品質改善により学習なしで30点台だったHumanEvalベンチマークが65点超に向上
オープンソースのStarCoder2のトレーニングデータ「The Stack v2」は32.1TB・619言語に拡大
2024年下半期から登場したエージェントモデルがClaude Codeなど実際のAI開発サービスを生んだ