HUOXIU

企業内に眠る知識を目覚めさせる:MetaBrain Enterprise Intelligence EPAIによる大規模モデル(RAG)の3ステップ効率的な構築

今日のビジネスオペレーションにおいて、データ量は爆発的に増加しています。企業はビジネスプロセスのあらゆる側面をカバーする膨大な量のデータを蓄積しています。しかし、豊富なデータリソースがあるにもかかわらず、企業はそこから貴重な知識を効率的に抽出することに苦労し、大量のデータが「遊休状態」に陥っています。

大規模モデルなどの AI 技術の開発と反復により、RAG (検索拡張生成) により、生成大規模モデルが外部の知識ソースを活用して生成機能を強化し、生成品質と信頼性を向上させ、企業内に蓄積された大量のデータを効果的に活用し、企業内の眠っている知識を呼び覚ますことが可能になります。

しかし、企業にとって知識検索システムの構築は容易ではなく、開発障壁の高さやコンテンツ生成の不備といった課題に直面することがよくあります。InspurのMetaBrain Enterprise Intelligence EPAIエンタープライズ大規模モデル開発プラットフォームを活用することで、企業はわずか3ステップで大規模モデル(RAG)を効率的に作成できます。これにより、企業内に蓄積された膨大なデータを有効活用し、眠っている知識を目覚めさせ、大規模モデルの応答精度を大幅に向上させることができます。

RAG: 大規模生成モデルの導入におけるベストプラクティス

企業におけるAIGC大規模モデル導入における重要な課題は、モデルの学習と導入プロセスが開発プロセスの終わりを意味しないことです。現実世界では、膨大なデータが絶えず生成され、知識は急速に反復され、新しい理論の出現、ドメイン知識の更新、定義の拡張、指標の調整が行われます。「生涯学習」は人間だけでなく、AIにとっても不可欠な能力です。この能力が失われると、大規模モデルはすぐに限界を示し、幻覚の発現、生成されたテキストの解釈性の欠如、専門分野の知識の理解不足、最新の開発動向への対応不足などが生じます。

この問題に対処するために、業界では主に 2 つのソリューションを提供しています。1 つはモデルを微調整すること、もう 1 つは AI が外部世界と対話してさまざまな形式と方法で知識を獲得できるようにすることです (つまり、大規模モデル + RAG)。

ファインチューニングは効果的であり、モデルが特定のドメイン知識を真に「学習」することを可能にしますが、同時にいくつかの問題も生じます。第一に、生成モデルは固有の知識(重み)に依存しているため、学習しているという錯覚から逃れることができません。これは、理解度の閾値が高く、精度要件が厳しいシナリオでは全く受け入れられません。第二に、モデルのファインチューニングは簡単な作業ではありません。データの準備、計算量、ファインチューニングの有効性、トレーニング時間の観点から、新しく生成されたデータでいつでもファインチューニングを行うことは現実的ではなく、最終的なファインチューニングの効果も保証できません。月に一度の更新でさえ理想的と考えられています。

一方、 RAGは、生成型大規模モデルが(モデル自身の知識ベースではなく)外部の知識ソースを活用することで生成能力を高め、生成コンテンツのバイアスやエラーを削減し、生成品質と信頼性を向上させることを可能にします。モデルの錯覚を効果的に軽減するだけでなく、「眠っている知識を目覚めさせる」ことで、企業内に蓄積された膨大なデータを有効活用することを可能にします。外部のリアルタイムの動的データにアクセスできるため、RAGは理論上、知識境界の制限がなく、頻繁なモデルトレーニングを必要としないため、業界における生成型大規模モデルの実装におけるベストプラクティスソリューションとなっています。

RAG は良いものですが、良い RAG を開発するのは難しいです。

RAGは魅力的ですが、実際の開発・応用シナリオにおいて、企業にとって知識検索システムを構築することは容易ではありません。多くの場合、開発障壁の高さやコンテンツ生成の不備といった課題に直面します。

1. 技術的なハードルが高く、開発効率が低い。

まず、優れたプログラミングスキルと大規模モデルアーキテクチャの原則に関する深い理解を持っていても、膨大なオープンソースソリューションから最適な大規模モデル + RAG の組み合わせを選択するには、継続的な試行錯誤が必要であり、カスタマイズ開発に多大な時間コストがかかります。次に、RAG の構築には、知識ドキュメントの準備、モデルの埋め込み、ベクトルデータベース、クエリの取得、回答の生成という 5 つの基本段階があります。各段階には、最適化の余地がかなりあります。たとえば、エンタープライズデータを処理する場合、さまざまな種類のデータをクリーニング、分類、ラベル付けして、その品質がモデルのトレーニング基準を満たすようにプロセスを設計する必要があります。これは、取得パラメータの設定にも当てはまります。ベクトルモデルの選択と最適化におけるエラーは、モデルトレーニングの失敗と不正確な取得に簡単につながる可能性があります。さらに、乗法効果の法則に従うと、90% × 90% × 90% × 90% = 59% となり、どの段階でも最適化が不十分だと、最終的に生成される結果は当初の構想とは大きくかけ離れてしまいます。

2. 複雑なドキュメントを解析する能力が不十分で、生成品質が低下します。

企業のデータドキュメントは多様かつ複雑であり、高品質なドキュメント解析機能は、最終的な知識検索の有効性に大きく影響します。金融機関を例に挙げると、契約書、レポート、 Excelファイルなどはすべて一般的なデータソースです。  財務データシートと パワーポイント 商品紹介などの文書は、複数の形式で並行して提示されています。オープンソースのRAGソリューションは、主要な契約条項の抽出が不正確であったり、条項の解釈に偏りがあったりするなど、解析能力が不十分です。商品の比較・推奨を行う際には、検索パラメータや大規模なモデルの選択が不適切になりやすく、個々のニーズに合った金融商品を推奨することが困難になり、顧客の信頼と満足度の低下につながります。

MetaBrain Enterprise Intelligence EPAI: わずか3ステップで大規模RAGモデルを構築し、眠っている企業知識を目覚めさせる

InspurのYuanBrain Enterprise Platform of AI(EPAI)は、企業がRAG構築において直面する共通の課題に対処するため、企業がデータ資産を発見し、「眠っている知識」を喚起するための強力な開発プラットフォームを提供します。ドキュメント解析、ナレッジベース構築、強化された検索生成といった独自の機能は、企業のナレッジマネジメントシステム構築の効率を大幅に向上させるだけでなく、大規模モデル応答の精度も大幅に向上させます。

1. 効率的な文書解析と知識ベースの構築

YuanBrain Enterprise Intelligence EPAIは、PDF、TXT、DOCXなど、複数のドキュメント形式のアップロードと解析に対応しています。ドキュメントコンテンツを詳細に処理し、強力なデータクリーニングと柔軟な知識ブロック分割により、企業が高品質なプライベートドメイン知識ベースを構築できるよう支援します。また、複雑な問題、大規模なデータセット、複数のドキュメントにまたがるクエリにも対応します。

2. 検索の改善と結果生成の強化

MetaBrain エンタープライズインテリジェンスEPAI  キーワード検索、セマンティック検索、ハイブリッド検索など、複数の検索モードを備え、様々な検索シナリオに的確に適応します。ユーザーは、それぞれのニーズに合わせて最適な検索方法を選択できます。自動化により…   RAGパイプライン技術は、最新の知識を迅速に取得し、大規模モデルに統合することで、検索データベースの定期的な更新を可能にします。これにより、生成されるテキストコンテンツは最新の情報に基づいていることが保証され、生成されるコンテンツの精度と効率が向上し、企業の多様な利用ニーズに効果的に対応できます。

YuanBrain Enterprise Intelligence EPAIは、Inspur Informationによる大規模モデルおよびRAG開発における反復的な実践と検証を経て、 Inspur Informationが高度に最適化したRAG環境をカプセル化しています。開発者はわずか3つのステップで、検索強化生成システムの構築を迅速に完了できます。

ステップ1  ナレッジベースを作成することで、知識の基盤が築かれます。

まず、ユーザーはYuannao Enterprise Intelligence EPAIプラットフォームにナレッジベースを作成し、企業文書をアップロードする必要があります。Yuannao Enterprise Intelligence EPAIは、PDF、TXT、DOCXなど、さまざまなドキュメント形式をサポートしています。次に、ユーザーはエンコーディングモデルやテキストチャンクの長さなどの解析パラメータを選択して設定します。すると、ドキュメントの解析が開始されます。ドキュメントの解析では、ドキュメントのコンテンツを抽出し、チャンクに分割します。Yuannao Enterprise Intelligence EPAIは、解析中にドキュメントレイアウトを認識し、表や画像からテキストを正確に抽出します。

 

ドキュメントが正常に解析されると、そのコンテンツは知識ベースに保存され、構造化された知識ブロックが形成されます。

 

ステップ2  検索パフォーマンスを最適化するために検索パラメータを設定する

文書解析が完了したら、ユーザーは大規模モデルと検索パラメータを設定して検索結果を最適化する必要があります。MetaBrain Enterprise Intelligence EPAIは、粗ランク付けされた引用数、引用数、検索タイプなど、様々な検索パラメータを提供します。検索戦略としては、ハイブリッド検索、キーワード検索、ベクター検索をサポートしています。

 

検索パラメータを設定後、ユーザーは検索テストを実施し、ドキュメントのセグメンテーションと検索の有効性を検証できます。検索テストインターフェースでは、テストテキストを入力して検索結果を表示できます。

 

ステップ3  対話インタラクションによりインテリジェントなアプリケーションが可能

テストが完了すると、YuanBrain Enterprise Intelligence EPAI はナレッジ ベースをナレッジ アシスタントとして公開し、オンライン インタラクションと API の 2 つの使用方法を提供できます。

オンラインインタラクションでは、ユーザーが質問を入力すると、MetaBrain Enterprise Intelligence EPAIが知識ベースのコンテンツと大規模なモデルを統合し、正確な回答を生成して引用元を表示します。下の画像は、MetaBrain Enterprise Intelligence EPAIが栄養に関するQ&Aアシスタントとして機能し、強化された検索機能を通じて栄養関連の回答を提供している様子を示しています。

 

APIアプローチを選択した場合、MetaBrain Enterprise Intelligence EPAIを使用してカスタムアシスタントを作成し、構成済みのモデルと知識ベースをアシスタントとして保存し、APIインターフェースを介して呼び出すことができます。この機能により、MetaBrain Enterprise Intelligence EPAIのRAG機能を既存の情報システムに容易に統合し、システムのインテリジェンスレベルを向上させることができます。

MetaBrain Enterprise Intelligence EPAI が大手 IT 企業のインテリジェントな生産性を飛躍的に向上

大手IT企業は、YuanBrain Enterprise Intelligence EPAIプラットフォームを積極的に活用し、社内のインテリジェント化を推進しています。同社は既に、ITプリセールスアシスタント「袁小智(Yuan Xiaozhi)」とライティングアシスタント「袁小模(Yuan Xiaomo)」を「ゼロコード」で開発しています。

「Yuan Xiaozhi」の開発、同社のプリセールスチーム(非専門開発者)は、YuanBrain Enterprise Intelligence EPAIに組み込まれたデータ処理ツールを利用して、スーパーマーケットからの構造化データと非構造化データを自動的に解析しました。   1500  カバレッジ  PDF、DOCX、DOC、XLSなど、様々な形式のデータリソースを活用し、8つの事業分野にわたる全販売製品のナレッジベースを構築しました。開発全体はわずか1名とわずか1ヶ月で完了し、ナレッジの統合と業務改善を効果的に推進しました。

「袁小墨」の開発、同社のマーケティングチーム(非専門開発者)は、様々な事業分野や記事の種類に応じて、1300件以上の記事、背景情報、速記メモ、ホワイトペーパーを収集しました。そして、これらの資料をワンクリックでパッケージ化してアップロードし、コーディングなしで専用のナレッジベースを構築しました。同時に、自動化されたRAGパイプラインも活用しました。  このテクノロジーは、最新の知識を大規模なモデルに統合し、キーワード検索、セマンティック検索、ハイブリッド検索などのさまざまな検索戦略を選択することで、検索されたコンテンツの精度を効果的に向上させます。

「袁小謨」のサポートにより、同社のマーケティングチームはデータ検索時間を80%短縮すると同時に、コンテンツ作成の質を向上させ、多様なニーズへの対応と市場コミュニケーションの革新を推進しました。例えば、コンテンツ企画段階では、キーワード検索によって製品のハイライトや市場動向レポートを的確に把握し、コピーライティング段階では、セマンティック検索によってブランドの意図を正確に捉え、スタイルに合ったコピーを配信しました。また、WeChat公式アカウント運用では、ハイブリッド検索統合の利点を活用し、膨大なデータから関連するトレンド素材を正確に見つけ出し、投稿をサポートしました。

InspurのEnterprise Platform of AI(EPAI)は、大規模AIモデルの導入を支援するソリューションです。企業が大規模AIモデルを導入するための、効率的で使いやすく、安全なエンドツーエンドの開発プラットフォームを提供します。データ準備、モデルトレーニング、知識検索、アプリケーションフレームワークのための一連のツールを提供し、多様なコンピューティングパワーとマルチモデルアルゴリズムのスケジューリングをサポートします。これにより、企業は生成型AIアプリケーションを効率的に開発・導入し、インテリジェントな生産性を構築できます。大規模モデル技術の進化に伴い、EPAIは革新を続け、企業のインテリジェントアプリケーションの革新と効率性の向上を支援します。