コンピュータービジョン分野の国際学会「CVPR2026」で感じた変化——基盤モデル・VLM・動画理解が中心に
概要
Acroquest TechnologyのデータサイエンスチームリーダーがCVPR2026(米コロラド州デンバー開催)に現地参加し、8年ぶりに参加した学会の変化をレポートした。物体検出・画像認識中心から基盤モデル・VLM・動画理解へと大きくテーマが変化していた。
詳細
- 参加者は約12,000人(CVPR2018の6,512人からほぼ倍増)
- 投稿16,092件に対し発表論文4,071件という規模
- テーマ変化:物体検出・画像認識(2018年)→基盤モデル(Foundation Model)、VLM、動画理解、3D、ロボティクス(2026年)
- 日本からの参加者339人(中国・韓国と比較して少ない)
- 注目論文:SoccerMaster(サッカー理解VFM)、AnomalyVFM(ゼロショット異常検知)、VideoSeek(長時間動画エージェント)など
参照
- 出典URL: https://acro-engineer.hatenablog.com/entry/2026/06/18/120000
- はてなブックマーク数: 11