|
デザインの世界は今、革命の真っ只中にあります。デザイナーはかつて、Adobe Photoshopなどの従来のツールに頼って作品を制作していました。しかし、AIテクノロジーの台頭により、すべてが変わりつつあります。デザイン分野の新星であるFigmaは、業界全体に革命を起こしそうになり、業界大手のAdobeから200億ドルの買収提案を受けたほどです。この買収提案は最終的に破談となりましたが、この提案は紛れもない事実を明らかにしました。AIがデザインの未来を再定義しているのです。この記事では、FigmaからVisorまで、AIを活用してクリエイティブツールをどのように変革してきたかを探ります。 噂によると、2023年12月に締結されたこの提案は、Adobeの役員を大いに喜ばせるほどの大失敗に終わったという。2023年はAI出現の年とされ、大規模なビジュアルモデルが次々と登場した。これによりAdobeはUI/UXデザインにおける苦境から脱却し、PhotoshopなどのソフトウェアにAI機能を迅速に統合することができた。Photoshopの新バージョンには、InPaintのようなチャットコパイロットベースのデザイン機能が搭載されている。皮肉なことに、この買収失敗によってAdobeは200億ドルの節約を実現し、その資金をPhotoshopなどのデザインツールへのAI機能実装に充てた。 まだ「技術的すぎる」のです。 MidjourneyやStable Diffusionに代表されるビジュアルデザインAIの分野は、今やかつてないほど活況を呈しています。Figmaのようなテクニカルツールと比較すると、AIデザインにおけるコミュニティの活動と貢献はベテランデザイナーの期待をはるかに超えています。一般の愛好家でも、わずか2日間の集中的な学習で素晴らしい画像を作成できます。これは以前は想像もできなかったことです。かつては、Photoshopのようなトップクラスのソフトウェアでさえ、ストックイメージを使用せずに広告の傑作を作成することは信じられないほど高価でした。その根本的な理由は、ソフトウェアがデザイナーの思考プロセスを迅速に捉えることができず、人間の想像力を正確に再現できないことにあると私は考えています。AI時代では、大規模なモデルがソフトウェア機能の操作における中間ステップを直接排除し、より速いペースで脳が想像と現実の境界を見つけて調整できるようにすることで、人間の創造性を刺激します。 しかし、現在のツールはどれもまだ「技術的すぎる」と私は考えています。Dreaminaを例に挙げてみましょう。画像生成エクスペリエンスは優れており、背景除去、部分的な再描画、画像の拡大、画質向上、アウトラインやスケルトン図に基づく画像生成など、AI設計でよく使われる機能を多数備え、様々なインタラクティブフォーマットも提供しているため、クリエイティブなアイデアを持つ一般の人々にとって、中国で最も優れた製品の一つと言えるでしょう。しかし、別の視点、つまり深みのあるコンテンツを作成する必要があるユーザーの観点から見ると、Dreaminaの製品形態は単一のユーザーニーズしか満たせません。簡単に言えば、ユーザーが単一の画像を生成するだけであれば非常に便利です。しかし、より長いクリエイティブプロセスを完了したい場合、困難に直面するでしょう。というか、現在の製品形態では対応できていないのです。このシナリオでは、SDのWeb UIを簡略化して製品化したに過ぎず、パラメータは一般ユーザーにとって依然として技術的で複雑すぎます。 ユーザーの視点から見ると、パラメータ制御は不要で、最小限の入力で素早く画像を生成したいだけなのです。彼らは最も目的意識の高い人々です。 設計ソフトウェアの再定義 数年前、写真スタジオで撮影された写真を見ると、どれだけの費用がかかっているのかと驚嘆したものです。こうした文脈において、デザインソフトウェアは、エンジニアリングソフトウェアでさえも、専門家の操作を必要とするプロ仕様のソフトウェアと見なされています。デザイン自体が非常に主観的なものであるため、専門家はクライアントの美的ニーズにも応えなければなりません。プロ仕様のソフトウェアは、機能が多様かつ細分化されているのが特徴です。あらゆる目標をソフトウェアの操作手順に細分化し、あらゆるシナリオに適用できます。しかし、まさにこのため、一般の人々の創造性は排除され、デザインは限られた少数の人々だけの領域となってしまいます。 AIデザインの台頭は、少なくとも今年は、一般の人々にとって創造的な成果を出すための障壁を打ち破りました。Dreaminaのようなツールを使えば、誰でも自分なりの試みをすることができます。 かつて、画像編集において特定の効果を得るには、様々な技術的パラメータと特定の操作ロジックを組み合わせる必要がありました。しかし、現在では、これらの技術的パラメータと操作ロジックはAIによって置き換えられています。例えば、「画像を切り抜く」、「背景を変える」、「通行人を削除する」といったタスクは、ユーザーにとってもはや技術的なプロセスではなく、「ワンクリック機能」です。ワンクリックで実行でき、場合によってはプロ仕様のPhotoshopよりも優れた結果を生み出すこともあります。AIがこれらの技術的な詳細をセマンティックなアクションに変換すると、デザインソフトウェアはもはやPhotoshopのようには機能しなくなります。私たちはデザインソフトウェアを再設計する必要があります。 ユーザーはデザインを完成させる際に、次の 3 つの段階を経ると考えています。 生画像: AI に基づいて候補画像のバッチが生成され、クリエイティブなアイデアに最も一致する画像がソース マテリアルとして使用されます。タスクに複数の要素がある場合は、複数のシード画像が生成されます。 最適化: 「部分再描画」などの優れた機能など、AI を活用したシード画像の調整により、迅速な画像レタッチを実現できます。 最終製品: すべての資料が整理されてエクスポートされ、最終ドラフトがエクスポートされます。 一見シンプルに見えるこの3つの段階は、それぞれの段階で様々な課題に直面します。これらの課題を解決するには、ソフトウェア開発者としての視点を脇に置き、現実世界のシナリオでビジュアルコンテンツを作成するユーザーの思考や感情に目を向ける必要があります。ユーザーは何を必要としているのか、そして私たちは何を提供できるのか。 この考えに基づいて、私はVisorというソフトウェアを開発しました。自分でまともなデザインソフトウェアを作れるとは思ってもいませんでしたが、AIの力を借りて、徐々に自分のアイデアを実装し、Visorの最初のバージョンを設計・実装しました。まだ完璧ではありませんが、私の視点から見ると、ツール自体の完璧さだけでは根本的な問題は解決しません。Visorは、一般ユーザーにAIによるビジュアルデザインを体験する機会を提供します。次に、Visorに関する私の考えを詳しく説明します。 生写真 創造性そのものは仮想的で形のないものです。では、どうすれば「無から有を生み出す」ことができ、視覚効果に命を吹き込むことができるのでしょうか?「脱興奮」理論は非常に興味深い答えを提示してくれると思います。私たちの心にある概念的な効果は、実際には捉えることができません。ゴッホやダ・ヴィンチのような巨匠だけが、意識の中にイメージを捉えることができたのです。私たちのような凡人は、不確実性を排除し続け、層を剥がし、明らかに「そうではない」部分を拒絶することを選択します。そして、残ったものが、私たちが表現したいものになることが多いのです。視覚的な創造性において、ほとんどの人は瞬時にマスターすることはできません。どんなデザインツールも、最初の草稿からこれが私たちのアイデアだと保証することはできません。だからこそ、初期のクリエイティブデザイン段階では、不要なものを排除し、最も望む部分を残すことを選択するのです。 Visorでは、まず真っ白な画面が表示されます。何も表示されていないと、まず「何か作ろう」と考えます。そこで、何か新しいものを作る必要があります。クリエイティブな画像を生成・編集するには、新しいレイヤーを作成する必要があります。 このレイヤーでは、必要な画像を生成します。 いくつかのオプションがあります。ローカル画像をインポートして処理する、テキストから画像を生成する、既存画像の構成を参照してテキスト説明付きの画像を生成する、スケルトン図を参照してテキスト説明付きの画像を生成する、といったものです。ローカルソースから既存の画像をインポートする最初のオプションを除き、他のすべての方法ではAI生成コンテンツが利用されます。 クリエイティブな画像をゼロから作り出す必要があります。他のソフトウェアでは4枚の代替画像が提供されますが、Visorは1枚しか提供しません。そのため、判断が難しい人にとっても希望が持てます。もし満足できない場合は、新しいレイヤーを作成し、別の画像を生成して比較し、最適なレイヤー以外のレイヤーをすべて削除することができます。これが先ほど述べた「ノイズ除去」の仕組みです。 Visor は AI を使用して画像を生成する際に、複雑で理解しにくいパラメータを削除し、ユーザーにとって最もシンプルな入力エントリ ポイントのみを残すように収束させます。 AIの助けにより、ブラシやシェイプといったPhotoshopのようなソフトウェアツールを使って必要な素材を作成する必要がなくなり、画像に直接アクセスできるようになりました。これがAIがもたらした変化です。 最適化 不要な部分を継続的に削除し、想像通りの部分に置き換えていくことで、当初のアイデアに近づいていきます。「ノイズリダクション」の核となるコンセプトは、「既存のものを反復し、不要なものを削除し、必要なものに置き換え、最終的な効果に近づく」ことです。 Visorでは、画像生成方法を選択した後、最適化を行うことができます。AIは、インペイント機能を使って特定の領域を再描画する機能を提供しています。これは非常に興味深い機能です。画像の一部をペイントした後、テキストプロンプトを使ってその領域を再描画できます。従来のソフトウェアでは、このプロセスは非常に複雑で、照明効果など、ソフトウェアが直接目的の効果を生み出せない場合があります。しかし、AIでは、これらの複雑な操作がテキストによる説明と組み合わせたペイントプロセスに変換されるため、ユーザーにとって非常に簡単に操作できます。 インペイント機能を使用して画像内のテーブルをペイントし、テキストの説明を使用してテーブルを削除します。 Visorは、テキスト説明コンテンツの検索と置換、部分的な再描画(上記参照)、インテリジェントな画像拡大、背景除去(被写体のみを保持)、画質向上(解像度拡大)、切り抜き、回転といった画像最適化機能を提供します。最後の2つを除くすべてのオプションはAIによって実装されています。 クリエイターにとって、Visor はクリエイティブプロセス全体とイメージの変化を記録するため、プロセスを理解してより明確な最適化戦略を立てることができ、過去の経験に基づいて最適化の品質を向上させることができます。 製品の観点から見ると、Visorは技術的な側面よりも、ユーザーが目標を達成する方法に重点を置いています。この違いは、MeituとPhotoshopの関係に似ています。 完全な映画 ユーザーの核心的なニーズは、最終的な結果を受け取ることです。Visor でユーザーが生成した画像はすべてオープンになっており、元の画像をダウンロードできます。他の AI デザインソフトウェアとは異なり、単一の画像を単に処理することが創作の標準ではないと考えています。クリエイターとして、私たちは素材を連続したシーケンスとして出力したいことがよくあります。たとえば、クリエイティブなプロセスでは、ストーリーを伝える相互に関連した一連の画像を生成したいと考えています。純粋な AI を使用して画像を生成する場合、さまざまなツールを切り替える必要があり、一貫性を保つために複雑な設定が必要になります。しかし、一般ユーザーとしての私たちの直感は何でしょうか。それは、すでに作成した素材を再利用することです。たとえば、同じベース画像を背景として使用し、その上にさまざまな被写体や環境を重ね合わせることで、この写真セットに物語を与えることができます。 まず、Visor は複数のレイヤーを結合して単一の画像を作成する結合機能を提供します。結合された新しいレイヤーを使用してさらなる最適化を行うことで、より高品質な最終画像を作成できます。 複数のレイヤーを 1 つの画像に結合するには、結合を使用します。 AI ツールを使用して、結合された画像がさらに洗練され、詳細が最適化され、人物のエッジと環境の関係が改善されます。 同じ背景レイヤーと異なるモデルを使用することで、さまざまなビデオを作成し、一連のプロモーションビデオを形成できます。 ご覧のとおり、髪の毛の細部まで非常に自然に見せることができます。 同時に、Visor はフレームの概念を提供します。つまり、ユーザーは特定の時間に [保存] をクリックして記録フレーム (スナップショットに相当) を作成し、これらのフレームから選択することができます。 フレームを使用することで、ユーザーは創作プロセスの特定の段階を明確化できます。この製品設計は、フレームに基づいてビデオを直接出力できる機能など、将来の機能拡張も考慮しており、一貫性をより適切に制御できるようになります。 結論 AI技術の継続的な進歩により、デザインソフトウェアはもはやプロ専用のツールではなく、誰もが簡単に使いこなせるクリエイティブプラットフォームとなっています。Visorの登場は、デザイナーがアイデアをより早く実現できるだけでなく、クリエイティブ表現の新たな扉を開き、一般の人々がデザインの楽しさを味わえるようにしました。AI時代において、私たちの創造力は無限に増幅されており、Visorはこの変革の証人であり、推進力となっています。AIの発展に伴い、今後さらに効率的な手法が登場すると信じています。現在はまだ、どのAI機能を処理に利用するかを選択する必要がありますが、大規模モデルの開発に伴い、将来的には自然言語でソフトウェアと対話するだけでよくなり、ソフトウェアがAIインターフェースをどのように呼び出して画像を処理していくかを基礎レベルで決定できるようになるかもしれません。 |