HUOXIU

Volcano Engine は、企業が手頃な価格で高品質のビジネス モデルを実現するための、より優れたオプションを提供します。

大規模モデル技術の開発と応用は、課題と機会の両方を伴う新たな段階に入りつつあります。

先日開催された「2024春季火山エンジンFORCEパワーカンファレンス」において、ByteDanceはDoubao大型モデルファミリー、Volcano Ark 2.0、AIアプリケーション、AIクラウドインフラストラクチャなど、最新製品を正式に発表しました。Doubao大型モデルの価格設定は特に高く評価され、非常にリーズナブルな価格設定が強調されました。Doubao汎用モデルpro-32kの推論入力価格はわずか0.0008元/千トークンで、業界平均より99.3%も安価です。

ボルケーノ・エンジン社長タン・ダイ

「大規模モデルの超低価格は、テクノロジーによるコスト最適化への自信から生まれています」と、Volcano Engineの社長であるタン・ダイ氏は述べています。大規模モデルは様々な業界に浸透しており、Volcano Engineは企業にそれらを適用するための優れた選択肢を提供しています。

大規模モデルを導入する際の課題と機会は何でしょうか?企業はどのようにして、自社のニーズに合った大規模モデルを迅速にトレーニングできるでしょうか?試行錯誤にかかるコストをどのように削減できるでしょうか?ITPUBはこれらの問題についてVolcano Engineの専門家にインタビューを行い、Volcano Engineの考え方と実践を共有しました。

大規模モデルの導入における機会と課題

大型モデルが発売された後、多くの企業や個人が積極的に試用しました。

Volcano Engineの大規模モデルアルゴリズムサービス責任者である王克氏は、「2023年は大規模モデル分野全体がプロトタイプの探索に重点を置いた年でした。例えば、携帯電話、自動車、教育、ゲーム、ソーシャルメディア、エンタープライズサービスなどの業界では、この1年間で多くのトライアルが実施されました。さらに、2023年後半からは、AIネイティブのスタートアップ企業もいくつか設立されました。2024年は探索と実装の年になると考えており、大規模モデルがより多くの応用シナリオに実装され、より大きな商業価値を生み出すことが期待できます」と指摘しました。

全体として、大規模モデルの開発はまだ初期の探索段階にあります。技術自体は急速に変化しており、急速に変化する大規模モデル技術に基づいて上位レベルの製品を構築するには、必然的にいくつかの課題と不確実性が伴います。

「企業が大規模モデルを成功裏に導入するには、モデルの有効性、推論コスト、そして導入の難しさという3つの主要な課題に直面しています。複雑な問題の解決を支援する優れた基盤となる大規模モデル、大規模モデルの広範な適用を可能にする低コストの推論サービス、そして企業が様々なシナリオでモデルを成功裏に導入するのに役立つツール、プラットフォーム、アプリケーションがさらに必要です」とタン・ダイ氏は述べています。

試行錯誤にかかるコストの高さは、しばしば新技術の適用を阻む重要な要因となる。王克氏は、企業が大規模モデルを実際に使用して初めて、自社のシナリオにおいてそのモデルがどれほど効果的であるかを判断できると指摘した。しかしながら、企業のイノベーションにおいてはROI(投資収益率)が必ず考慮されるものであり、そのためにはモデルの有効性とコストを総合的に検討する必要がある。コストの高さは、企業が大規模モデルを導入するハードルを引き上げてしまうだろう。

例えばコスト面では、携帯電話メーカーのように事業規模が大きいお客様にとって、既存事業の規模が大きいため、1シナリオにおけるわずかな利用量でも高額なコスト負担となる可能性があります。しかし、まだイノベーションや探索段階にある新規事業やスタートアップ企業にとって、大規模なビジネスモデルにおいては、高額なコスト負担は困難です。

さらに、大規模モデル技術は新しいものであり、変化が激しいため、市場には多くの大規模モデルが存在します。適切なモデルを選択し、実際の企業シナリオで良好な適用効果を生み出すことも、企業が直面する課題です。

火山エンジン大規模モデルプロジェクトの責任者であるLei Jingyan氏によると、企業が大規模モデルを適用する際には、技術エンジニアリングの面でいくつかの課題があるという。

まず、大規模モデルが様々な業界で導入される際には、多くのユーザーが自社のビジネスにより適したモデルを作成するために、モデルを微調整します。微調整自体は複雑ではありませんが、難しいのは、いかに効率的に微調整を行い、コストと学習速度のバランスを取るかにあります。微調整後、特に微調整の反復回数が多い場合、推論の展開にはカナリアリリースと、微調整後の異なるモデルバージョン間のA/Bテスト比較が必要になります。推論トラフィックのピーク変動に対応するには、基盤となるシステムがコストを抑制できる十分な弾力性を備えている必要があります。

第二に、セキュリティ上の懸念があります。企業はサンプルデータの漏洩やセキュリティ攻撃のリスクを懸念するかもしれません。一方で、生成モデルによって生成されたコンテンツは、違法コンテンツの出現など、事業運営にリスクをもたらす可能性があります。そのため、タイムリーな介入能力が求められます。現在、多くのVolcano Engineユーザーは、すべてのセキュリティルールを30分以内に正確に送信することを望んでいます。

3 番目に、アルゴリズムの有効性を向上させるために、大規模モデル自体の大量の推論計算、およびモデルと周囲の知識ベースおよびその他の周辺システムとの広範な相互作用により、レイテンシの課題が生じ、システムのハードウェアとソフトウェアを組み合わせた計算効率の最適化に対する要求が高くなります。

雷静燕氏は、OpenAIが既にいくつかのシナリオについて人々を教育しており、大規模モデルの使い方を誰もが徐々に理解しつつあると考えている。現在、技術工学の観点から見ると、中国で主流となっている大規模モデルのスケジューリングと推論最適化能力はGPT-4に迫っており、アルゴリズムの性能はより急速に向上しており、一部のローカルシナリオではGPT-4を凌駕している。

Volcano Engineは、大規模モデルの今後の発展に自信と確信を持っています。大規模モデルは、あらゆる企業や個人とつながるインフラであり、長期的には社会に大きな影響を与える技術となります。次世代モデルは新たな市場機会を開拓し、モデルの機能が進化し続けるにつれて、これらの市場機会はますます拡大していくでしょう。

大規模モデルのような初期段階のテクノロジーでは、実践的な経験が鍵となります。企業は、実現可能な実装パスを模索し、大規模モデルを推進することで業界全体にわたる価値創造を実現するために、より多くの実験を行う必要があります。

大規模モデルの実装の課題に対処し、誰もが経済的な負担なしに試すことができるようにするために、Volcano Engine は顧客にとってコストを十分に低く抑え、企業に優れた選択肢を提供しています。

企業により良い選択肢を提供する

優れた大規模モデルとはどのようなものでしょうか? おそらく、1,000 人から 1,000 通りの異なる答えが出てくるでしょう。

Tan Dai氏は、優れたモデルは大規模な利用によってのみ洗練されると考えています。また、コスト削減が大規模モデルを「価値創造段階」へと押し上げる重要な要素であることを強調しています。これは、Volcano Engineが優れた大規模モデルについて抱いているシンプルな考え方を反映しています。つまり、ランキングやパラメータではなく、適用シナリオと効果に焦点を当てるということです。さらに、優れたモデルとは、誰もが利用できる価格帯のものです。

カンファレンスでは、ByteDanceが自社開発したDoubaoビッグモデルが、Volcano Engineを通じて正式にサービスとしてリリースされます。Doubaoビッグモデルファミリーには、Doubao総合モデルPro、Doubao総合モデルLite、Doubaoロールプレイングモデル、Doubao音声合成モデル、Doubao音声複製モデル、Doubao音声認識モデル、Doubaoテキスト変換モデル、Doubao関数呼び出しモデル、Doubaoベクトル化モデルが含まれます。企業は自社のビジネスニーズに合わせて柔軟にモデルを選択し、迅速に導入することができます。

豆宝ビッグモデルは、ByteDanceの専門アルゴリズムチームによって開発されたと報じられています。ByteDance社内の50以上のビジネスシナリオにおける実践的な検証と、毎日数千億トークンを処理する継続的な改良により、モデルの性能は保証され、ビジネスへの適応性も向上しています。さらに、このモデルはビッグモデルサービスのセキュリティ申請をいち早く通過し、コンプライアンス要件を満たし、企業の利用における信頼性を確保しています。現在、豆宝ビッグモデルは毎日平均1,200億トークンのテキストを処理し、3,000万枚の画像を生成しています。

Volcano Engineは極めて低いモデル価格を提供しています。Doubao汎用モデルPro-32K版を例にとると、モデル推論の入力価格はわずか0.0008元/千トークンです。これに対し、同スペックのモデルの市場価格は一般的に0.12元/千トークンで、Doubaoモデルの150倍の価格となっています。大規模モデルの価格設定は「センタビリティ時代」に突入しています。モデル推論価格は業界平均を大幅に下回る一方で、Doubao汎用モデルのTPM(1分あたりのトークン数)とRPM(1分あたりのリクエスト数)はともに中国最高水準に達しています。1分あたりのトークン処理能力は、業界の同等モデルの4~8倍に達し、大多数の企業のビジネスニーズを満たしています。

タン・ダイ氏は、Volcano Engineは技術最適化によるコスト削減に自信を持っていると述べました。例えば、モデル構造の最適化と調整、エンジニアリングにおける単一マシン推論から分散推論への進化、そして異なるワークロードとの推論の混合とスケジューリングなどにより、これらの技術は基盤となる様々なコンピューティングパワーをより有効に活用しながらコストを大幅に削減し、あらゆる企業が大規模モデルを利用できるようにすることができます。

実際には、大規模モデルを適用する際、お客様は主に2つの方法を採用します。1つは、オープンソースモデルをベースにした独自モデルをトレーニングする方法です。これは高度な技術的専門知識を必要とし、一部の大手企業が採用するアプローチです。もう1つは、MaaS(Model as a Service)APIサービスを呼び出す方法で、これは多くの企業が選択する選択肢です。

Volcano Engineは、アプリケーションサービス、MaaS、クラウドコンピューティングサービスなど、AIサービスのフルスタックを提供します。シナリオ駆動型で大規模モデルの探索と応用を加速し、企業がAI技術開発のメリットをより容易に享受できるようにします。

モデル制作においては、Volcano Engineは優れたコンピューティングパワーシステムと機械学習プラットフォームを通じて、安全で信頼性が高く、効率的な「モデル制作工場」を構築しました。このプラットフォームは、効率的なトレーニングと推論のオーケストレーションおよびスケジューリング機能を誇り、演算子ライブラリや通信ライブラリなどのシステム全体を最適化し、低侵入かつほぼ透明な方法で顧客に提供しています。国内の大手モデルスタートアップのほとんどが、この機械学習プラットフォーム上でトレーニングを完了しており、リソースオーケストレーションおよびスケジューリング機能、そして障害カードの自己修復機能も高い評価を得ています。

アップグレードされた機械学習プラットフォームは、GPUの断片化リソースの自動最適化により、リソース利用率をさらに向上させます。さらに、モデル環境のデバッグ後、安定した学習のためのDockerイメージを構築できます。大規模な学習環境の構築はわずか2秒で完了し、プラットフォームの使いやすさが向上します。

モデル応用分野においては、Volcano Engineは昨年、ワンストップの大規模モデルサービスプラットフォームであるVolcano Arkをリリースしました。「Model as a Service」というコンセプトに基づき、高品質な大規模モデルを厳選し、企業が効率的かつ安全な環境で様々なモデルを適用できるよう支援しています。Volcano Engineは今年、Arkプラットフォームを全面的にアップグレードしました。アップグレードされたVolcano Ark 2.0は、より強力なパフォーマンス、より優れたプラグイン、より優れたサービス、そしてライフサイクル全体にわたる安全で信頼性の高いソリューションにより、大規模モデル応用の実装を容易にします。

雷静燕氏は、Volcano Arkは大規模モデルのライフサイクル全体にわたる管理を重視しており、オープンソースとクローズドソースの両方の大規模モデルに対して運用・保守管理を提供していると説明した。特に、クローズドソースモデルの運用・保守管理はVolcano Engineのベストプラクティスを統合し、クローズドソースモデルの「ブラックボックス」状態における顧客のサービス運用・保守の向上を支援し、より安定したサポート体制を提供し、アルゴリズムの性能と実装コストの最適なソリューションを見つける。

クラウドインフラストラクチャに関しては、Volcano Engineの超大規模コンピューティングクラスターは、数万枚のカードのネットワーク接続をサポートします。パブリッククラウド、ハイブリッドクラウド、そして異機種混在コンピューティングパワーをサポートし、AIイノベーションのためのスケーラブルで非常に安定したクラウドインフラストラクチャを提供します。

ご覧のとおり、Volcano Engineは、ByteDance社内およびVolcano Engineサービスの外部顧客を含む幅広いビジネスシナリオで磨き上げられた高品質なモデルを提供しています。同時に、Volcano Arkや機械学習プラットフォームなどのプラットフォームを通じて、外部クライアント向けに大規模モデルのトレーニングと適用のための優れたエンジニアリングプラクティスを提供することで、企業は大規模モデルをより低コスト、高効率、そしてより高いセキュリティと安定性で適用できるようになります。

概要: 大規模モデルを一般企業でも利用できるようにする

大規模モデルを用いて価値を創造する企業がますます増えています。証券業界の顧客サービスを例に挙げると、従来の証券顧客サービスシステムは、商品形態の孤立化、意図認識の汎用化不足、マルチターン対話理解能力の欠如といった問題を抱えており、顧客体験の質を低下させています。華泰証券は、Volcano Engine Arkプラットフォームを基盤とする新世代の資産管理アシスタントを構築し、従来の技術が顧客意図を正確に把握できず、顧客とのマルチターン対話ができないという問題を解決し、ユーザーエクスペリエンスを向上させています。

価格の低下と試行錯誤コストの低減は、より多くの企業が大規模モデルを試すことを促します。継続的な実験と理解を通じて、期待はより合理的になり、大規模モデルはより持続的かつ健全に発展していくでしょう。AI時代において、Volcano Engineは魚を提供するだけでなく、魚の釣り方を教えてくれます。同社のフルスタック大規模モデルサービスは、大規模モデルを一般企業に届け、新たな選択肢を提供します。