|
最近、ハリウッドは、わずか数行のテキストを使用して映画の予告編に匹敵する鮮明なビデオを短時間で作成できる驚くべき能力を誇る AI テキスト動画変換モデル「Sora」に大きな熱意を示しています。 その理由は、米国のOpenAIリサーチセンターが最新プロジェクトとして、AIによるテキスト動画モデル「Sora」を発表したからです。(「Sora」は日本語で「空」を意味し、開発者たちは人々の無限の創造的可能性への想像力を刺激するためにこの名前を選びました。) タイラー・ペリーはアトランタのスタジオを拡張するために8億ドルを費やす計画を立てていたが、ソラの素晴らしい能力を目の当たりにし、その計画を一時的に棚上げにした。 先見の明のある起業家として、ペリーはソラの発展に内在する計り知れない可能性を鋭く認識していました。しかし、雇用主、俳優、そして映画プロデューサーとして、彼は警鐘を鳴らしたいとも思っていました。テクノロジーの急速な進歩により、多くの伝統的な仕事が消滅の危機に瀕している可能性があると。 ソラの映像作品は息を呑むほど美しい。あるシーンでは、マンモスが雪の層を抜けてゆっくりと近づいてくる。カメラが建物へとパンダウンすると、雪に覆われた活気あふれる東京の街並みが現れる。別のシーンでは、色鮮やかなサンゴ礁のペーパークラフトの世界が広がり、色とりどりの魚や海洋生物が泳ぎ回っている。 この印象的な 20 秒のビデオ クリップは、OpenAI が慎重に作成した特定のプロンプトからインスピレーションを得たものであることは特筆に値します。 AI コミュニティの映画製作者や開発者は、Sora はかつては実現不可能だった多くのことを現実のものにしてきたツールである生成 AI の分野における大きな飛躍であり重要な進歩であると信じています。 「これは予定より18ヶ月も早いですね」と、Fable StudiosのAIプロデューサー、エドワード・サーチ氏は認めた。「深く感銘を受けています。生成AIによって作成された短編動画や画像を取り巻く熱狂と興奮は薄れつつあり、人々はAIだけで制作された映画を劇場で観られるようになるのはいつになるのか、より現実的に考え始めています。」 ソラは間違いなくゲームチェンジャーであり、業界全体を全く新しい方向へと導いている。「最新の30本のクリップは悪くないが、まだ洗練されていない」とサッチーは述べた。 OpenAI がビデオツールを開発しているという噂は以前からあったが、Sora のリリースは、OpenAI 内の他のチームのメンバーにとっても、多くの人にとって驚きだった。 現在、Soraは一般公開されておらず、レッドチームメンバー(誤情報、ヘイトコンテンツ、偏向コンテンツの専門家)と選ばれたクリエイティブな人々(ビジュアルアーティスト、デザイナー、映画製作者)のみが利用できます。これらの招待された人々は、Soraの悪用による潜在的なリスクを調査し、将来のアプリケーションの正当性とセキュリティを確保することに尽力しています。 映画監督のポール・トリロ氏は、高い評価を得た AI 短編映画「Thank You for Not Answering」で知られており、複数の AI 企業に対してツール開発に関する専門コンサルティング サービスも提供しています。 彼はSoraで生成された動画の品質と機能性に感銘を受けました。しかし、Soraがクリエイターによる完全なカスタマイズとコントロールを可能にするオープンソースアプリケーションになるまでは、業界全体に革命をもたらすかどうかについては中立的な立場をとっており、Soraは単なる「優れたテクノロジー企業による製品デモ」に過ぎないのではないかと示唆しています。 テリーは次のように強調した。「Soraが、断片的な作品から物語として機能するツールへと進化し、観客が物語に完全に没頭できるようになるまでには、まだ長い道のりがあります。映画制作の初心者で、自分のアイデアを検証したいと思いながらもリソースが限られている人にとって、Soraは間違いなく貴重なプラットフォームを提供してくれます。しかし、プロの観点から見ると、Soraには創造プロセスのコントロールが関わってくるため、自分の意図やビジョンを真に実現できるかどうかという点に懸念を抱いています。」 Runway、Meta、Googleといった競合製品のモデルと比較すると、Soraはいくつかの点で優れています。高解像度により、生成された動画のピクセル美は格段に向上し、特に肌の質感、髪の毛、反射、水面、葉といったディテールの表現において、Soraは大きな優位性を発揮します。 さらに、Sora は最長 60 秒のビデオを制作できるため、従来の 3 ~ 8 秒という制限が打ち破られ、応用シナリオと実用性がさらに広がります。 サックス氏は、「これはこれまでで最大の奇跡であり、AI映画が2分間の短編映画に限定されず、徐々に映画やテレビの短編映画の領域へと移行していくことを示しています。かつては物語を伝えるのに3~8秒のショットしか使えませんでしたが、ソラの登場によってその限界は打ち破られ、より複雑な物語を語れる新たな時代が開かれました」と指摘する。 Soraは卓越した生成能力を備えているだけでなく、世界の動きを支配する法則を深く理解しています。他の生成AI動画ツールと比較した場合、Soraの独自性は、より具体的な演出アクションやシミュレートされたカメラワークをプロンプトに追加できる点にあります。 サックス氏によると、SORAの優れた点は、生き生きとした背景キャラクター、リアルな動き、そしてテーマ間のインタラクションとリアクションにあるという。OpenAIが公開した動画には、崖に打ち寄せる波、戯れる動物たち、走行中の電車の窓に映る映像など、SORAのこの分野における強力な能力が鮮やかに表現されている。 トレラウォ氏はまた、Soraが示した「時間的な一貫性」にも驚嘆したと述べました。従来のAI動画ツールは、ショットの最初から最後までのプロセス全体を正確に理解することがしばしば困難で、個々のフレームから推測(または推測)して動きをシミュレートすることしかできません。そのため、動画に「ガムビーレッグス」現象などの小さな欠陥が生じることがよくあります。Soraが生成したある動画では、女性が歩いているときに脚の位置が入れ替わっていましたが、他のモデルは走るなどの動作では滑らかで自然な歩き方をしていました。 「The Bridge」は時間的な一貫性の表現に優れていますが、トレロウ氏はこれはむしろ「錯覚」だと主張しています。OpenAIはSoraを、従来のテキスト動画生成ツールではなく、時空間的な「世界モデル」と表現しています。トレロウ氏は、「生成された動画を真剣に受け止めてもらいたいのであれば、一貫性と制御性を備えていなければなりません。単なる推測に基づくものであってはいけません。Soraは、物事の動きや変化を正確に捉え、提示することで、明確で明確な道筋を持っているという印象を与えます」と考えています。 トレロウ氏が「大きな進歩」と呼ぶもう一つの画期的な進歩は、ソラが手がかりを時間単位で分解する能力です。この動画では、生き物が森を飛び越え、妖精たちが踊るキノコに遭遇します。複雑な手がかりから一連の出来事を理解し、複数の出来事が起こるべき順序を正確に提示するソラの能力は、「実用的なストーリーテリングツールに近づく」とされています。 上記の機能に加え、Soraはシームレスなビデオループとサンプリングの柔軟性も備えています。「シームレスなビデオループ」機能は、モーションパターンを深く理解することで実現し、生成されたビデオは途切れたり途切れたりすることなくスムーズにループします。一方、「サンプリングの柔軟性」はユーザーに大きな利便性を提供し、同じキューを異なる角度、フレーム、アスペクト比で視聴できるため、より豊かで多様な視覚体験を実現します。 さらに、Soraは動画から動画への編集機能を備えており、複数の動画クリップを簡単に繋げることができます。OpenAIは、ドローンがローマコロッセオの上空を飛行し、その後に鮮やかなサンゴ礁の上を蝶が優雅に舞うという鮮明なデモンストレーションを行いました。2つの異なる動画シーンはSoraの編集機能によってシームレスに合成され、驚異的な視覚効果を生み出しています。 ソラの動画では、ほとんどの人の注目が主人公に集中していましたが、トレロウ氏は背景に目を奪われました。人工知能の分野では、「オクルージョン」と呼ばれる、前景の物体が背景の物体を変化させたり消したりしてしまう問題がよく見られます。 OpenAIはSoraがこの分野でまだ改善の余地があることを認めていますが、トレロウ氏はSoraが生成した動画で、人が壁に書かれた文字の前を歩いているにもかかわらず、文字がはっきりと判読可能であることを観察しました。これは、Soraが単なる拡散ベースのモデルではなく、より伝統的な3Dアニメーション環境と特殊効果技術を融合させたハイブリッドモデルであることを示唆しています。 では、ハリウッドは数週間前よりも今の方が、機械に置き換えられることをもっと心配すべきなのでしょうか? 「このような変化は不安をかき立てるが、同時に興奮せずにはいられない」とトレロウ氏は語った。 SORAには依然として重大な欠陥がある。最大の問題はセリフ機能の欠如だ。サッチ氏は、「人工知能は人間の口の動きをシミュレートするのに依然として大きな課題を抱えており、これを実現することが開発の鍵となる。SORAは息を呑むような60秒のショットを作り出すことはできるが、それだけでは一貫性のある映画を作るには不十分だ」と指摘する。 テリー氏はさらに、「Sora のパフォーマンスはブログ記事では印象的かもしれませんが、同じ人物を同じ場所で 10 枚撮影すれば、実際にどれほど優れたパフォーマンスを発揮するかがわかります」と説明しています。 SORAは少々完璧すぎるようにも見える。テリー氏は、「他のAIツールが持つ予測不可能性、幻想性、想像力が欠けているかもしれない」と考えている。OpenAIはツールの悪用を非常に懸念しているため、性行為や暴力を含む用途を防ぐための厳格なパラメータを設定している。そのため、映画製作者たちは特定のシーンをAIに説明する際に苛立ちを覚えている。例えば、AIに「血ではなくケチャップだ」と伝えようとしたが、満足のいく結果が得られなかった。 サックス氏は、「映画製作における新たなヘイズ・コードが誕生しました。人工知能は非常にドラマチックな映画を制作できるかもしれませんが、それが必ずしもAIの発展にとって良いこととは限りません」と指摘した。 AIツールの品質はインターフェースデザインにかかっています。Soraのカスタマイズオプションが限られていたり、操作がスムーズでなかったりすると、映画制作者やホームクリエイターに採用されることはないでしょう。しかし、テリー氏は「これらは一時的な障害であり、将来的にはSoraのクローンが広く普及する可能性がある」と述べています。 テリー氏は、「おそらく2年後には、映画製作者が求める、より高度な制御と詳細を備えたオープンソースのSoraモデルが登場するだろう」と予測した。 ハリウッドは生成AIの活用に熱心ですが、AI生成コンテンツは依然として著作権上の課題に直面しています。Klaris Lawのマネージングパートナーであるエドワード・クラリス氏は、「映画スタジオは慎重に制作を進める必要があります。なぜなら、制作したコンテンツは機械生成とみなされ、著作権保護の対象外となる可能性があるからです」と指摘しています。 同氏は、「実際、パブリックドメインの作品を作成する際に、生成AIをワークフローに組み込むことには一定のリスクが伴う」と述べた。 映画業界はまだ完全に混乱しているわけではないものの、マーケティングの世界はすでに「ソラ」の影響を感じている。ソラの60秒ショートフィルムは、まさにこの広告の好例だ。テリーは「映画業界はこれに警戒すべきだ」と警告する。 ShutterstockとOpenAIの提携により、SoraのモデルのほとんどはOpenAIの素材ライブラリで学習される見込みです。テリー氏は、近い将来、Shutterstockが既存のストック映像だけに頼るのではなく、ユーザーがAI生成動画を作成できるサービスを開始する可能性があると予測しています。 テリー・ロスは、「ソラは業界に新たな才能を引きつけるかもしれないが、真に成功するアーティストとは、伝統的な技術と独自のビジョンを持つ人だ。人々が大きなプレッシャーに耐えることなく、同じように報酬を得られるようになることを願っている」と強く信じている。 「サウスパーク」のエピソードを自動生成できるAIツールを開発した研究チームの一員として、サッチ氏は「私たちは徐々に自動化されたプロデューサーの世界へと移行しており、AIが生成したコンテンツは、実際の人間の関与なしには映画やテレビ業界で注目を集めることは難しいだろう」と考えている。 映画は共同作業の媒体であり、完全に自動化されたコンテンツは共同作業の性質を失ってしまいます。 サックス氏は、「1年前、AI推進派はすべてが変わると主張していましたが、今のところ、大きな変化はありません。シリコンバレーは3年ごとにハリウッドに、すべてを完全に破壊すると宣言していますが、ハリウッドは常に生き残り、繁栄しています」と指摘しています。 |