|
著者: Xiaoyan 編集者:Caiyun 今年の旧正月の7日目、私たちがまだ春節の喜びと忙しさに浸っている間に、OpenAIはすでにひっそりと大きなことを始めており、超爆弾であるSoraをひっそりとリリースしました。 2月16日、OpenAIはテキストベースの動画モデル「Sora」を正式に発表しました。Soraの能力と特性は世界を驚かせるに十分です。テキストコマンドで最大60秒の動画を直接出力できます。この動画は単なる動画ではなく、非常に精細な背景、複雑なマルチアングルショット、そして感情に訴えかけるキャラクター描写を特徴としています。これは、OpenAIがテキストや画像に続き、高度なAI技術を動画分野に展開する先駆者となったことを示しています。 多くの業界関係者は、これがAI分野における大きなブレークスルーであり、マイルストーンであると考えています。予想よりもはるかに早く、劇的に実現したからです。もちろん、コンテンツ制作や映画制作といった業界にとって、SORAは大きなチャンスと大きな課題の両方を提示しています。 ソラとは何でしょうか? では、OpenAI が懸命に開発に取り組んでいる Sora とは一体何なのでしょうか? 簡単に言えば、Sora はテキストから複雑なシーンの 60 秒、1080p のビデオを直接生成し、一貫性と高品質を備えたビデオを作成することができ、現在市場で最高の Pika や Runway を完全に上回っています。 SORA の核心的な競争力は、60 秒の超長時間、単一動画でのマルチアングル撮影、そして読みやすい世界モデルの 3 つの側面にあります。 まず、Soraが60秒という超長時間動画を実現したこと自体が、質的な飛躍的進歩です。業界のAI動画制作会社の多くは、いまだに4秒の短編動画の連続性を維持するのに苦労していますが、Soraは業界の障壁を直接打ち破り、60秒のシングルショット形式を実現し、ワイドショットから顔のクローズアップへのシームレスな移行を実現しました。次に、Soraは1本の動画でマルチアングルショットを実現できます。実際の撮影シナリオでは、マルチカメラシーンの撮影は非常に複雑で、複数のカメラ位置だけでなく、複雑なポストプロダクション編集も必要です。そのため、現在ほとんどのAI動画はシングルショットです。しかし、Soraは被写体の一貫性を維持しながら、60秒の動画内で複数のアングルをスムーズに切り替えることができます。さらに、Soraは読みやすく理解しやすい世界モデルであり、現実世界の理解とシミュレーションの両方を実現します。そのため、Soraによって生成される動画はよりリアルなものになります。 コンテンツ制作の新時代が到来! 周紅毅氏:Sora は AGI 達成に必要な時間を 10 年から 1 年に短縮します... ある意味、OpenAI による Sora のリリースは、同社の技術開発における避けられない段階だ。 OpenAIは2021年初頭と2022年後半に、それぞれ画像生成システム「DALL・E」とチャットボット「ChatGPT」をリリースしました。これにより、AIは徐々に様々な産業における業務支援ツールへと発展し、Soraの研究基盤にもなっています。 DALL·E 3の言い換えキューワード技術を活用することで、視覚モデルの学習データに高度に説明的なアノテーションを生成し、モデルがテキスト指示をより適切に理解できるようになります。これにより、Soraは複数のキャラクター、特定の種類のモーション、被写体と背景の正確な詳細を含む複雑なシーンを生成できます。 SORAの登場は、AI業界全体の発展に大きな影響を与えると広く考えられています。工業情報化部情報通信経済専門委員会委員であり、デジタル経済の専門家である劉興良氏は、「SORAの登場は、コンテンツ制作分野におけるAI技術の新たな時代を告げるものだ」と述べています。 Sora は、複数のキャラクター、さまざまな種類のアクション、背景の詳細をカバーし、ほぼ映画レベルのリアリズムを実現する、約 1 分間の 1080p 高解像度ビデオを生成できます。 Soraの強力な登場について、360グループの創設者兼会長である周紅一氏もソーシャルメディアで見解を共有し、「Soraの出現により、AGIの実現スピードは10年から1年に短縮されました」と述べた。 周紅一氏は、SORAの登場は広告業界、映画予告編、短編動画業界に大きな混乱をもたらす可能性があると述べたが、これはSORAがこれらの業界をすぐに制覇することを意味するわけではない。むしろ、SORAは業界におけるクリエイティブツールとなるだろう。 さらに重要な点は、SORAのリリースにより、中国における大規模モデル開発の現状と国際トップレベルとのギャップが改めて認識されたことです。表面的には中国の大規模モデル開発レベルはGPT-3.5に近づいているように見えますが、実際には4.0に近づくには少なくとも1年半のギャップがあります。これは、今後私たちが取り組むべき方向性であり、注力すべき点です。 私たちは将来どうなるのでしょうか? マクロ的な視点から見ると、Soraの登場は大きな恩恵です。メディア専門家であり、ハーバード・ビジネス・レビューの共同プロデューサー兼編集長でもある何剛氏は、「Soraの登場は、動画撮影と編集における技術的障壁がゼロになったことを意味します。競争の核となるのは、創造性、テキスト、価値観、そしてブランドです。動画制作における技術的障壁はもはや機能しなくなり、これはコンテンツ制作チームやクリエイティブチームにとって朗報です」と述べています。 それでもなお、Soraの登場が多くの業界に大きな影響を与えることは否定できません。多くの人は、Soraを技術的および製品体験の観点から分析することに慣れており、自然界や物理法則をシミュレートすることで、これほどリアルな動画を作成できると考えています。しかし、これらは表面的な理由に過ぎません。Soraの独自の強みは、競合他社とは全く異なる技術的アプローチにあります。 したがって、AIがもたらす影響と課題は潜在的に大きくなります。映画・テレビ番組制作における人間の俳優、監督、その他のクリエイティブな役割に対する需要が直接的に減少し、業界の雇用にも影響を与えるでしょう。さらに、AI技術の進歩に伴い、従来の映画・テレビ番組制作プロセスやビジネスモデルも変革に直面する可能性があります。 さらに、この分野における競争はますます熾烈になるでしょう。この分野には、Amazon、Microsoft、Google、Baidu、Alibabaといったインターネット大手企業が既に多数参入しています。しかし、Soraのリリースにより、OpenAIの業界リードは一気に拡大し、新規参入企業は追い上げに一層の努力を払うことになるでしょう。AI生成動画は今後、飛躍的な進歩を遂げ、爆発的な成長期を迎えるでしょう。 ソラに代表される新たなテクノロジー路線の出現は資本市場に変化をもたらし、同業他社の価値が市場で再評価されることになるだろう。 Lightspeed Indiaのパートナーであるヘマント・モハパトラ氏は、メディアのインタビューで、Soraの登場がすべてを変えるだろうと述べました。例えば、Soraのリリース後、インベントリ動画生成企業の代表格であるAdobeの株価は7%以上下落し、他のAIスタートアップ企業も程度の差はあれ影響を受けました。 ソラの出現は、「この世で唯一不変なものは変化である」という真理を深く認識させました。今、誰もがまさにそのような過渡期にあり、常に更新され、変容し続ける時代です。時間軸を延長することによってのみ、私たちは現在の不確実性を軽減することができるのです。 地面に道があるように、最初は道がなかったとしても、人が歩くにつれて道が生まれます。私たちは変化に積極的に立ち向かい、受け入れなければなりません。そうすることでのみ、変化を乗り越えることができるのです。 |