日本語対応の音声クローンAI「ZONOS2」が登場──トランプ大統領の声でエヴァンゲリオンを語らせるデモも
概要
AI開発企業Zyphraが音声合成AI「ZONOS2」を2026年6月12日に発表した。人物の声や録音状況をリアルタイム再現しつつ任意のセリフを合成する「音声クローン」機能を持ち、日本語もティア1言語として対応。Apache 2.0ライセンスのオープンモデルとして公開されている。
詳細
- 総パラメーター数80億、アクティブパラメーター数9億のMoEモデル。旧モデル比でリアルタイムスループットが4倍に向上
- 学習データ: 旧モデルの約60万時間→ZONOS2では200万時間以上に増加。ノイズや非定型的な発話パターンへの耐性も向上
- テキスト入力をUTF-8の生データとして処理することで日本語・中国語・韓国語などの非ヨーロッパ言語性能を大幅向上
- 言語ティア: ティア1(英語・中国語・日本語)、ティア2(韓国語・ロシア語・フランス語など12言語)、ティア3(スウェーデン語・ヒンディー語など21言語)
- デモ: トランプ大統領の声で碇シンジ/碇ゲンドウについて語らせる音声、オバマ元大統領にガンダム開発計画を語らせる音声など
- ベンチマークスコアより人間にとって自然な音声を優先。参考音声の背景ノイズや不自然な声も再現する設計
- AMD AIチップを活用したZyphra Cloudでも利用可能
参照
- 出典: https://gigazine.net/news/20260615-tts-zonos2-amd-zyphra/
- HuggingFace: https://huggingface.co/Zyphra/ZONOS2
- はてなブックマーク数: 15