HUOXIU

AIが「ツールマン」を救う:RPA+AIがあらゆるものの自動化を実現

QbitAIの郭一普(郭一普)による報告 | WeChat公式アカウント QbitAI

A、人事のプロフェッショナル。

典型的なエントリーレベルの人事担当者として、彼の日常業務の大部分は文書や手続きの処理です。

入社手続き、退職手続き、休暇申請、社会保険や住宅基金の拠出の処理、各種書類のスキャン、従業員情報のシステムへの入力、さまざまな部署へのメール送信など...

忙しく単調な仕事が毎日続いていた。他部署の同僚たちが新製品や大型プロジェクトに取り組むのを見て、大学を卒業したばかりのシャオ・アは、自分の才能が無駄にされていると感じていた。

しかし今では、こうした面倒な作業はすべて、インテリジェントな自動ロボットによって処理されるようになりました。

請求書の入力、文書の処理、固定形式での電子メールの送信など、反復的で面倒な作業はすべて自動的に処理できます。

ユーザーインターフェースでいくつかの簡単な設定を行うだけで、システムはさまざまな視覚および音声 AI 機能を活用して操作を自動的に完了し、これまでオフィス自動化システムでは不可能だったタスクを実現します。

彼は、最近リリースされたばかりの Laiye Technology のUiBot Mageを使用しています。

UiBot Mage は発売後、UiBot ファミリーの元の 3 つのモジュール (Creator、Worker、Commander) と統合され、RPA ロボットの製造、実行、割り当て、インテリジェント化に対応するツールとプラットフォームを提供します。

UiBot Mageとは何ですか?

機械的な労働から創造的な仕事へと移行するのは、とても未来的なことのように思えます。

では、UiBot Mage は具体的にどのように AI を活用してタスクを自動化するのでしょうか?

これはRPAから始まります。

RPA はロボティック・プロセス・オートメーションの略です。

これらのサービスは、財務および税務システムにおける固定された操作プロセスの完了、電子商取引のバックエンドにおける単調な製品アップロード/注文処理タスクの完了、学務システムにおける学生の成績の一括入力など、コンピュータ画面の UI 上に存在するいくつかの面倒で固定されたワークフローを自動化できます。

しかし、従来の RPA は十分にスマートではなく、構造化データしか処理できず、非構造化データは処理できません。

整理された Excel スプレッドシートが機械的に並べ替えやフィルタリングを行ったり、棒グラフや円グラフを自動的に作成したりできるのと同様に、分類されていない散在したレコードを自動的に処理することは難しく、人間の脳による手動の分析と判断が必要になります。

中国語で「マジシャン」とも呼ばれるMageは、コンピュータービジョンや自然言語処理といった様々なAI機能を統合しています。従来のRPAを様々なAIモデルAPIに接続することで、機械的な処理しかできないRPAにスマートな頭脳を与え、非構造化データも理解・処理することが可能です。

例えば、OCR技術を用いて、VATインボイスや各種証明書などの画像を汎用テキストファイルに変換できます。事前学習済みのモデルにより、本文、日付、数字などを直接抽出でき、その精度は97%以上です。すべてのモデルはプライベート展開をサポートしており、これらのファイルから情報が漏洩することはありません。

UiBot Mageは、画像上のテキストを読み取った後、テキスト理解機能も備えています。テキスト分類、情報抽出、テキストマッチングのための事前学習済みモデルを通じて、メールの件名の要約、契約当事者の日付などのコア情報の抽出、履歴書からのコア情報の読み取り、2つの住所が同じ場所に属しているかどうかの判断など、一般的なNLPタスクを自動的に実行できます。

さらに、ユーザーごとにビジネスニーズが異なるため、プロセスで使用されるコーパスも当然異なります。そのため、特定のシナリオにおけるモデルのパフォーマンスを向上させるための、ターゲットを絞ったトレーニングが可能になります。

さらに、Laiye Technology は、RPA ロボットが実際の従業員と同じように人間のリーダーと対話できることを期待しており、双方向の対話とマルチターンの対話を実現できるマルチモーダルなヒューマンマシン対話機能も統合しています。

UiBot Mageのリリース後、UiBotコミュニティエディションのユーザーはこれらのAI機能を直接使用できるようになり、エンタープライズエディションのユーザーはカスタマイズやアップグレードもできるようになります。

RPAのローコード性により、ユーザーはUiBotに組み込まれたCreatorコマンドを活用することで、Scratchでモジュールをドラッグ&ドロップするのと同じように、シンプルなドラッグ&ドロップ操作でAI機能をRPAプロセスに簡単に組み込むことができます。モデルはパブリッククラウドから直接アクセスすることも、プライベートクラウドにデプロイすることもできます。「VAT請求書の認識」などの汎用モデルと組み合わせて使用​​することも、カスタマイズされたタスク向けにトレーニングすることも可能です。

さまざまなシナリオの高速化

UiBot Mage のこれらの機能により、UiBot は RPA + AI 機能を実現し、多くの面倒なタスクをインテリジェントに解決できるようになります。

つまり、「自分も面倒だと思うけど、仕方がないので誰かがやらないといけない」という仕事はすべてロボットに任せることができるのです。

例えば、さまざまなショッピングモールにある同一ブランドのチェーン店の経営など。

ワンダプラザやジョイシティなど、各ショッピングモールはそれぞれ異なるレシートフォーマットを採用しています。しかし、ユニクロのようなチェーン店は複数のショッピングモールに店舗を構え、それぞれ独自のPOSシステムを導入しています。これらのチェーン店のシステム情報と各ショッピングモールのレシート情報を照合することで、会計を照合し、注文収益を明確にする必要があります。

UiBot Mageは、OCR+NLP技術を活用して、さまざまなシステムから商品名、数量、価格、合計金額、取引時間などのコア情報を自動的に抽出し、決定木方式を使用してそれらの整合性をチェックすることで、手動での繰り返し検証の必要性を排除し、調整プロセスを自動化します。

もうひとつの例は、製薬会社が新薬を宣伝するプロセスです。

製薬会社は、医師に新薬を宣伝するために営業担当者を派遣する必要があります。しかし、医師は営業担当者の言葉をそのまま信じることはなく、具体的な効能や副作用について質問してきます。しかし、営業担当者はそこまでの包括的な医学的知識を持ち合わせていません。そこで、営業担当者はこれらの質問をサービスチームの同僚に伝え、サービスチームは膨大な医学論文の中から薬の有効性を証明する学術研究を探し出し、営業担当者に伝えます。営業担当者はこれらの情報を医師に伝え、薬の有効性を証明するのです。

このプロセスでは、サービス チームが大量の医学文献を検索する必要があり、サービス チームが 24 時間オンラインになることはできません。また、さまざまな医師が同様の質問をするため、この作業は反復的で面倒なものになります。

しかし、UiBot MageプラットフォームのNLP機能を活用することで、システムはMRからの質問を自動的に理解し、文献データベースから関連論文を検索し、薬剤の有効性と副作用を説明する論文の段落を自動的に特定し、要点を強調表示してMRに送信できます。MRはその後、紙の資料を医師に渡すことで、プロセス全体がよりスムーズかつ迅速になります。

また、各地に政府サービスホールがあり、さまざまな政府部門が集まって国民が行政を処理できるようになっています。

一般の人が統合サービス窓口に申請書類を提出する場合、担当者はどの部署に連絡すればよいかを手作業で特定し、書類をスキャンしてアップロードし、システムに入力して、処理の進捗状況を追跡する必要があります。

しかし、RPA+AIの導入により、OCRはテキスト情報を自動的に認識・抽出し、自動的に入力・保管し、各部署に送信して進捗状況を照会できるようになります。このプロセスは非常にシンプルかつ効率的になります。

Laiye Technologyは、UiBot MageのすべてのAI機能がプライベート展開サブスクリプションモデルで提供され、インスタンスあたり年間5万元から始まり、モデルの複雑さに応じてさまざまなAI機能に異なる価格が設定されることを明らかにした。

チームのジュニアアシスタントを雇うのに年間 50 万ドルの給与が必要な場合でも、コスト削減は依然として相当な額になります。

Laiye Technologyの顧客企業の一つは、毎日数千件ものメールを処理し、メールを自動で分析、分類、返信する機能を必要としていました。1件あたり10分の手作業で処理すると、1日1,000件のメールを処理するには20人の人員が必要になります。しかし、RPAとAIを活用することで、この20人の人員をより重要な業務に割くことができるようになります。

すべてを自動化できる

その効率は驚くべきものです。

AI技術を組み込んだRPA製品と比較すると、従来型のRPAシステムは、インテリジェント性が低いため、ボタンをクリックするだけの単なるツールとなり、スキャンした文書内のテキストを認識できず、情報を自動的に整理できず、機能が制限されるため、適用範囲が狭くなってしまいます。

その差はスマートフォンとフィーチャーフォンほど大きいです。

従来の RPA は通常のロボット アームと同様、番号付きプログラムに従って固定位置で固定動作を実行し、変化する環境に対応できません。

AI機能を追加することで、RPAはセンサー、脳、アクチュエータを備えたロボットアームのように、入力認識、プロセスオーケストレーション、出力フィードバックという閉ループを形成します。これにより、より複雑なタスクを実行し、エンドツーエンドの自動化を実現できます。

さらに、システムの自動運用の範囲も拡大しました。

従来のRPAは部分的なアクションしか実行できません。ボタンを数回クリックするだけで、次のステップを完了するにはより賢い「頭脳」が必要であることがわかります。AI機能を追加することで、より賢い「頭脳」を持つのと同じになり、作業プロセス全体を自動的に完了できるため、より幅広い適用シナリオが可能になります。

たとえば、ほとんどの人はコーヒー豆を挽くことしかできないマシンを購入しないでしょう。なぜなら、豆を自動的に挽いた後、手動でお湯を沸かしてコーヒーを淹れなければならないからです。しかし、豆の挽き方からお湯を沸かし、コーヒーを淹れるまでの全プロセスを処理するコーヒーマシンは、市場でより人気が出るでしょう。

さらに、この効率化はRPA+AIを導入している企業だけに当てはまるものではなく、従業員にとってもより大きな価値を実感する機会となります。結局のところ、毎日同じ作業をしていると、35歳を過ぎると解雇される可能性が非常に高くなります。

ユーザー側はさておき、供給側から見ると、RPA に AI を実装すること自体が、「ドラゴンを倒す力」を持つより多くの AI モデルが実用的なアプリケーション インターフェイスを見つけるのに役立ちます。

AIモデルの大多数は、画像の自動認識、テキストの自動変換、自動翻訳など、本質的には「単純な思考力を必要とするタスクを一括して迅速かつ自動的に完了する」というタスクを実行しています。 一括タスクを迅速に実行し、人間の手を解放できるAIモデルは、単に商用化するための実用的なインターフェースが欠けているだけです。

インターフェースを獲得することは、これらのAIモデルにその才能を発揮するプラットフォームを提供するようなものです。同時に、モデルの開発者にも大きなメリットがあります。開発者はより優れたモデルを学習し、より効率的にユーザーにサービスを提供できるようになります。そして、より豊富なアプリケーションシナリオとより大規模なユーザーベースは、開発者の研究開発への継続的な取り組みのモチベーションを高めます。

研究開発から実装まで、産業エコシステム全体の積極的な推進力により、すべてが自動化できる世界はそう遠くありません。

その背後にある会社、ライイエ・テクノロジー

この製品はAI企業Laiye Technologyが開発したもので、同社は2019年にUiBotの開発チームであるRPA企業Aosen Technologyと合併し、RPA+AIの道を歩んでいます。

合併したLaiye Technologyチームは強力な技術的背景を誇ります。

王冠春会長兼CEOと胡一川CTOは、Google創業者のラリー・ペイジとセルゲイ・ブリンのように、それぞれプリンストン大学とペンシルベニア大学を卒業した後、起業を決意しました。彼らのプロジェクトは百度に買収され、二人はそれぞれ百度のインテリジェントインタラクションと百度のビデオ技術のチームリーダーとなりました。かつて大人気を博した百度快索(箸検索​​)は、王冠春のチームから生まれました。

共同CEO兼社長の李偉氏と上級副社長の朱睿氏は、国防科技大学の卒業生です。ゲーム愛好家であれば、彼らが開発したAutoHotkeyソフトウェアとReliable Assistantプラットフォームはご存知でしょう。これらはゲームワークフロー自動化のための製品であり、RPAの初期の開発者でもあります。

左から右へ:Hu Yichuan、Li Wei、Wang Guanchun、Chu Rui

このチームは強力な同盟であると言える。

現在、Laiye Technologyは、Deloitte、Digital China、TravelSky Enterprise Servicesなど、200社以上のパートナー企業に拡大しています。これらのパートナー企業は中国全土をカバーし、シンガポールや日本などの海外にも進出しています。

おそらく近い将来、仕事の退屈で反復的な部分も、RPA + AI を使用して簡単に実行できるようになるでしょう。