HUOXIU

本日、国産開発のオープンソース版Soraが到着しました!

本日、オープンソースで商用利用可能な初の動画生成モデル「CogVideoX 2B」がリリースされました。国産Soraのオープンソース版であるCogVideoX 2Bのリリースは、AI動画生成分野における大きな進歩を表しています。このモデルはオープンソースであるだけでなく、商用アプリケーションのニーズも満たしており、これは過去6ヶ月間、世界中で不足していたものです。CogVideoX 2Bは、商用グレードの品質と性能を備えながら、比較的低いリソース要件を特徴としています。

まず、CogVideoX 2Bの動画生成能力は驚異的です。最大6秒間、8フレーム/秒、720×480の解像度で動画を生成でき、最大226種類のプロンプトが用意されています。これにより、ユーザーは詳細な説明で動画生成をガイドすることができ、より正確でパーソナライズされた出力が得られます。

第二に、このモデルのリソース要件は比較的低く、より多くの開発者や企業が容易に利用・調整できます。具体的には、CogVideoX 2Bは、FP-16精度での推論に必要なVRAM容量はわずか18GB、微調整に必要なVRAM容量はわずか40GBです。つまり、推論は4090グラフィックスカード1枚で実行でき、微調整はA6000グラフィックスカード1枚で完了できます。このようなリソース要件は参入障壁を大幅に下げ、より多くの開発者や企業がビデオ生成モデルの開発と応用に参加できるようにします。

さらに、CogVideoX 2Bは、実世界のテキスト動画生成タスクにおいて優れた性能を示しました。Pika、Gen-2、Open-Sora V1.2と比較すると、CogVideoX 2Bは様々な指標において他のすべてのデバイスを上回りました。これは、CogVideoX 2Bが商用グレードの品質と性能を備えていることを明確に示しています。

まとめると、CogVideoX 2Bのリリースは、AIビデオ生成分野に新たな可能性をもたらしました。オープンソースであることと商用アプリケーション要件が満たされていることから、より多くの開発者や企業が独自のビデオ生成モデルを自由に開発できるようになり、業界全体における迅速なイテレーションとイノベーションを促進します。同時に、低いリソース要件と優れたパフォーマンスは、非常に魅力的な選択肢となっています。CogVideoX 2Bが今後、さらに革新的なアプリケーションや開発を生み出すことを期待しています。