|
2022年11月末、OpenAIはGPT3.5シリーズの大規模言語モデルを微調整した新しい対話型AI「ChatGPT」を正式にリリースし、生成AIへの関心が高まりました。2023年1月には、ChatGPTは月間アクティブユーザー数1億人を突破しました。実際、2022年2月には、拡散モデルに基づくAI描画ジェネレーター「Disco Diffusion」が、アート業界の専門家から生成AIと関連技術への注目を集めていました。2022年8月には、ゲームデザイナーのジェイソン・アレン氏がAI生成アート作品「スペースオペラ」でコロラド州フェアの「デジタルアート/デジタル写真」コンペティションで最優秀賞を受賞し、「AI描画」に関する世界的な議論が巻き起こりました。 米国のベンチャーキャピタル、セコイア・キャピタルのウェブサイトに掲載された「ジェネレーティブAI:クリエイティブな新世界」という記事では、機械がデータやモノの分析において人間を上回る能力を発揮し、AIはタスク遂行の過程でますます知能化していく可能性があると述べられています。これは従来のAI、つまり分析型AIです。しかし、分析作業以外にも、人間は創造力に優れており、芸術作品の創作、製品設計、コーディングなど、これまでAIができなかった一連のタスクを遂行することができます。現在、AIは創造的な活動にも挑戦し始めており、ChatGPTに代表されるジェネレーティブAIは人間の創造プロセスに統合されつつあります。 「ビッグデータ時代において、企業のデジタルトランスフォーメーションは主に業務、マーケティング、リスク管理におけるインテリジェント化の課題に取り組んでいます。そのため、意思決定型AIはデジタル経済時代の企業の中核競争力に対応し、生成型AIは新たな学習パラダイムを採用しています。複雑で異種なデータを処理して学習・要約することで、さらに推論・創造を行い、模倣やステッチのような創造によって全く新しいコンテンツ(データ要素)を生成します」と、エバーブライト・テクノロジー株式会社ビッグデータ部門責任者の田江氏は述べています。「意思決定型AIは企業の実際の生産性に対応し、生成型AIはあらゆるものを強化するAGI(人工知能)の未来の潮流を示しています。」 NLPからCNNへ:ディープラーニングが生成型AI技術の革新を促進 生成AIは、ディープラーニング技術に基づく人工知能モデルであり、人間の思考をシミュレートすることで創造的な作業を実行し、言語テキスト、画像、音声などの論理的で一貫性のあるコンテンツを生成します。現在普及しているAI生成テキストとAI生成画像という2つの応用シナリオでは、大規模なモデルが重要な役割を果たします。ChatGPTに代表されるチャットボットプログラムは大規模な生成言語モデルに基づいており、AI生成描画アプリケーションは大規模な生成画像モデルに基づいています。 NLP(自然言語処理)は、人工知能の誕生とともに登場した技術です。当初は規則と統計データに基づいていましたが、ディープラーニングの導入により急速な発展を遂げました。ディープラーニングはニューラルネットワークを学習させることで、AIが入力データの特徴やパターンを学習できるようにします。ChatGPTは、注目すべき新しいNLPモデルです。膨大なデータと革新的なTransformerネットワークアーキテクチャを組み合わせることで、自然言語に基づくディープラーニングモデルが実現し、コンピューターが人間の話し言葉を鮮明に模倣できるようになりました。 言語モデルと比較して、画像モデルの核心はコンピュータビジョン技術にあります。CNN(畳み込みニューラルネットワーク)から特徴物体認識まで、20世紀末のコンピュータビジョン技術は確固たる理論的基盤を築いていました。しかし、視覚アルゴリズムは主に特徴知覚、画像前処理、特徴抽出、特徴選択、推論予測、認識の5つのステップで画像を分析するため、認識精度は比較的低くなっています。インターネット時代の到来とともに、データ量は急速に増加しました。コンピューティングパワー関連ハードウェアの継続的な開発とそれに伴う計算能力の向上と相まって、CNNはますます深くなり、画像スタイルの転送、色の復元などの処理技術を使用してアートワークを完成させることができました。さらに、GAN(敵対的生成ネットワーク)などのディープラーニングモデルは、元のデータに近似するデータを生成できるため、大規模な生成画像モデルのトレーニングに膨大なデータサポートを提供します。 千の帆レース:生成型AIがインテリジェント時代の到来を告げる ChatGPTは、生成AIへの世界的な関心を喚起しました。ChatGPTに代表される生成AIは、将来大きな可能性を秘めており、新たな技術革命と産業変革をさらに牽引していくでしょう。 Web3.0の新たな生産性を構築するためのイノベーションの創出 Web 3.0(インターネットの第3世代)、つまりプロトコルベースのインターネットでは、生成AIが重要な制作ツールになります。テキストベースのAIツールの助けを借りて、ユーザーはより直感的なウェブナビゲーションを体験でき(MicrosoftによるChatGPTのBing検索への統合など)、検索エンジン広告モデルへの依存を減らし、SEO生成コンテンツからノイズを排除し、ゲーム開発者やアーティストの創造性と生産性を高めます。画像ベースおよびビデオベースのAIは、アートNFT(非代替トークン)の生成を支援し、アーティストが入力したルールの枠組みの中でアート作品を作成できます。コード開発プロセスでは、ChatGPTはすでにコードの読み書きだけでなく、エラーの発見も含め、その応用可能性を示しています。現在、人々はAIプログラムを使用して簡単なコード監査タスクを完了し始めており、AIに直接コードを作成させています。 研究開発サイクルを短縮すると、コストが削減され、医薬品設計の効率が向上します。 デロイトによる2021年医薬品イノベーション投資収益率評価によると、世界の医薬品開発サイクルは2016年以降、成長を続けており、革新的医薬品開発の平均コストは2020年に23億7,600万ドルに達し、プロセス全体には平均7.14年かかっています。現在、大規模モデルの継続的な開発に伴い、生成AIは様々な医薬品設計プロセスに導入され、医薬品設計サイクルをわずか数か月に短縮し、製薬業界における医薬品開発のコストと時間を削減しています。 工業デザイン要件を満たす主要な特性を定義する 材料科学の発展に伴い、新素材産業は現代の国民経済において急速に発展するハイテク産業へと成長しました。様々なニーズを満たすために、特定の物理的特性を持つ新素材を設計する必要があり、自動車、航空宇宙、エネルギーなどの産業の発展をさらに促進しています。必要な材料を見つけるために偶然に頼っていた従来の設計プロセスと比較して、生成AIは逆設計プロセスを通じて材料に必要な特性を定義し、導電性、磁力、耐腐食性などの特性を持つ材料を設計することで、様々なニーズに対応します。 さらに、工業デザイン分野において、生成AIはコストを大幅に削減し、設計品質を向上させることも可能です。チップ設計プロセスにおいて、機械学習技術を基盤とする生成AIは、半導体チップ内の各種コンポーネントの位置を自動最適化することで、製品開発サイクルを数週間から数時間に短縮します。部品設計においては、製造企業が性能、材料、製造プロセスなどの特定の目標を満たす部品を設計できるよう、生成AIが支援します。例えば、自動車メーカーは生成AIを活用して、より軽量で安全な車種を設計し、安全性を確保しながら自動車のエネルギー消費を削減することができます。 合成データを生成することでAIのトレーニング時間を短縮 合成データとは、コンピュータプログラムによって直接生成されるデータであり、現実世界の現象やイベントから生成されるデータとは無関係です。大規模モデルの学習において、第一に、合成データを用いることで、現実世界のイベントからデータを取得する必要性が低減し、データ生成とデータセット構築が迅速化されます。第二に、合成データセットは現実世界の根拠やセンシティブな変数を含まないため、プライバシーへの懸念が軽減されます。そして最後に、合成データは生成時に自動的にラベル付けできるため、ラベル付けにかかる時間が大幅に短縮されます。生成AIは、合成データの構築に大きく貢献します。高品質な画像を生成できるため、自律走行車やドローンなどの業界におけるAIシステムのパフォーマンスが向上します。また、知覚モデルの学習とテストのための広範な合成データセットを作成できるため、開発者は機械学習モデルの迅速な反復と最適化が可能になり、ターンアラウンドタイムが短縮され、AI開発が加速されます。さらに、ユーザーは自然言語やプログラミング言語を通じて様々なパラメータを選択することで、合成データセットを柔軟に構成できるため、合成データの多様性と現実感を高めることができます。 ビッグ言語モデルに基づく金融サービスの変革を推進 ChatGPTは、大規模モデル技術を基盤とし、専門知識と様々な業界のデータを組み合わせることでインタラクティブな学習が可能で、多ターンの複雑な対話、自然言語理解・生成、感情認識、適応といった能力を獲得します。金融分野では、このタイプのインテリジェントなカスタマーサービスは、クレジット商品、資産管理商品、保険商品など複数のビジネスに適用でき、法人顧客に24時間365日対応のコンサルティングサービスを提供することで、ユーザー満足度とコンバージョン率を大幅に向上させ、人件費とリスクを削減します。生成AIは、膨大なデータの分析とモデリングを通じて、企業のインテリジェントなリスク管理を支援し、金融機関に効果的なリスク警告と予測を提供し、金融リスクを軽減します。また、生成AIは、インターネットテキストデータ、行動データ、信用報告書を解釈することで、より多くの次元でリスク指標を特定し、信用リスクをより適切に評価し、信用承認、融資後管理、不正防止、マネーロンダリング防止などのプロセスにおけるリスク管理の効率と精度を大幅に向上させます。 産業変革をリードする生成AIには有望な未来があります。 2023年4月、中国サイバースペース管理局は「生成人工知能サービス管理弁法(意見募集稿)」を発表し、人工知能アルゴリズムやフレームワークなどの基礎技術における自主的な革新、推進、応用、国際協力を国が支援し、安全で信頼性の高いソフトウェア、ツール、コンピューティング、データリソースの優先的な利用を奨励すると表明しました。生成AIの急速な発展に伴い、セキュリティ上の課題が相次いでいます。大規模モデルの応用を通じてAI能力をさらに向上させる過程では、応用におけるリスクに常に注意を払い、開発プロセスで遭遇する問題点や困難に対処する必要があります。 データからモデルへ、生成AI開発における課題を克服 本誌のインタビューで、北京人工知能産業連盟メタバース特別委員会のヤン・ヤン委員長は、トレーニングデータ、モデルの複雑さ、コンテンツ出力制御という3つの側面から生成AI開発の課題について語った。 学習データに関して言えば、生成型AIの学習では、高品質なモデルを出力し、「創発」現象(学習データ量が一定量を超えるとモデルの精度が飛躍的に向上する現象)を促進するために、通常、膨大な量のデータが必要です。こうしたデータの取得と準備は困難で時間のかかるプロセスです。さらに、データの品質と多様性、プライバシーとセキュリティ、そしてデータ所有権の保護も不可欠です。武漢大学コンピュータサイエンス学院教授であり、Zall Smart Commerce Research Institute所長でもある蔡恒金氏もこの見解に賛同しており、ブロックチェーン技術を深く応用することで、データの所有権を確立し、大規模モデルの学習に必要なデータのプライバシーとセキュリティを保証できると考えています。 モデルの複雑さという点では、生成AIモデルは一般的に意思決定AIモデルよりも複雑であり、学習と推論に多くのパラメータと計算リソースを必要とします。これは、学習時間の長さ、計算コストの高さ、モデルの展開の複雑さ、メンテナンスの難しさといった問題につながる可能性があります。 コンテンツ出力制御の観点から、生成AIの適用には、生成されるコンテンツの制御が必要です。生成モデルは通常、統計モデルに基づいており、確率分布特性を示すため、生成される結果を完全に予測することはできません。そのため、出力結果が不正確になり、追加の処理や人間の介入が必要になる場合があります。 データの出所が不明瞭な場合、生成AIに一定の侵害リスクが生じる可能性があります。検証可能な出所を持つ公開データセットの利用、データの匿名化・非識別化、データ利用に関するポリシーと手順の確立、そしてデータの規模を確保しつつ合成データを使用することで、これらのリスクを軽減できます」とティアン・ジャン氏は述べています。「公開データセットは通常、侵害リスクを軽減できます。例えば、公開されているニュース記事や政府データは、独自の裏付けとなるチャネルがあり、その真正性を保証しています。また、識別情報を削除または置き換え、データをランダム化することで、ユーザーのプライバシーを保護するためにデータを匿名化・非識別化できます。明確なデータ利用ポリシーと手順は、データの合法的かつ安全な利用を確保します。合成データには個人情報や機密情報が含まれないため、侵害やプライバシーの問題を回避できます。」 生成AIアプリケーションにおけるリスクの防止 生成AIの急速な発展は、AIトレーナーやAIスーパーバイザーといった新たな雇用を生み出す可能性があります。さらに、生成AIは既存の人間の知識から学習し、そこから派生するため、人間の創造性はまだ代替されていません。単純なタスクが代替されれば、人間の創造性は生成AIを通じて解き放たれ、急速に顕在化し、様々な産業におけるイノベーションを促進するでしょう。生成AIによって生成されるコンテンツは、どこからともなく現れるのではなく、ユーザーが入力するデータソースと密接に関連しています。入力されるデータの種類が異なれば、出力されるコンテンツの価値判断も多様化します。そのため、この種の人工知能の開発と利用においては、データソースの違法収集、アルゴリズムの誤動作のリスク、コンテンツの真偽の判別の難しさ、誤情報の蔓延、プライバシー保護の欠如、知的財産権の侵害、不正競争など、これまでとは大きく異なる法的リスクと倫理的課題に直面しています。これは、技術規制にとって多くの課題を提起しています。 「生成AIの普及に伴い、AI倫理やプライバシーに関する問題への注目度はますます高まるでしょう。企業や政府は、AIの発展が人類社会に悪影響を及ぼさないように、適切な規範や政策を策定する必要があります」と田江氏は述べた。 企業は、生成 AI を本格的に適用する前に、6 つの側面から生成 AI の実装における潜在的なリスクを総合的に評価する必要があります。 まず、生成AIの能力と可能性については、まだ多くの未知数があります。このツールが広く普及する前に、マルウェアや巧妙なフィッシングメールなどの悪意のある活動を防ぐための堅牢なプログラムと防御ネットワークを構築する必要があります。 第二に、今日の生成AIは企業の変革を支援する力を持っています。企業が大規模モデルから得る洞察は、事業開発や製品の改善に不可欠です。そのため、企業は専門的なモデルのセキュリティを慎重に検討し、ユーザーや従業員によるこれらのモデルの適用方法を理解する必要があります。 第三に、個人や組織が専門的な生成AIモデルを構築する際、独自の文書や情報をトレーニングに活用します。パーソナライズされた知識やデータは生成AIの適用範囲を拡大する可能性がありますが、ユーザーは機密データや個人情報が公共システムに侵入するのを防ぐため、生成AIにとって安全で信頼できる環境を構築するための関連ポリシーを策定する必要があります。 第四に、生成AIの強力な創造力は、サイバー犯罪者によってディープフェイク画像の作成に悪用され、マルウェアやランサムウェア攻撃を容易にする可能性があります。企業は、基本的な「サイバー衛生」を維持し、大規模なレガシーシステムを圧縮することで、システムの攻撃対象領域を縮小する必要があります。 第五に、生成AIツールの「コンテンツ」には商業上のリスクが伴います。ChatGPTのようなツールは、膨大なインターネットデータを吸収・学習する必要があり、各データソースから個別に許可を得ることは不可能です。生成されたコンテンツの国境を越えた送信に関する規制要件は、第三者の著作権を侵害するリスクを高めます。 第六に、データ処理と国境を越えたコンプライアンスリスクがあります。多くの企業は、経営判断を支援するために生成AIツールを活用しており、そのデータが他国のサーバーに流出する可能性があります。こうした流出は、様々な国や地域の法令を遵守する必要があります。 ChatGPTに代表される生成型AI技術の普及は、今まさに目前です。AI技術の革新を積極的に推進し、応用の道を模索し、AI関連の法規制を慎重に策定することが、既存資源の時代において、組織、企業、さらには国家が主導権を握るための「鍵」となるでしょう。 |