HUOXIU

大規模なAIモデルが「試験」に殺到しているが、中国語試験では国産AIが依然として優勢で、漢文能力は受験者の95%を超えている。

于陽小暁が澳飛寺からQbitAIに報告 | WeChat公式アカウント QbitAI

ChatGPT 設立後初の全国大学入学試験は、学生と大規模モデルの両方を忙しくさせました。

案の定、大学入試が終わる前に、試験問題に対する AI の挑戦が話題となり、さまざまな大規模モデルが大学入試のエッセイの作成に使用されたり、試験全体に参加したりしました。

(偶然かどうかは分かりませんが、バードもその日の午後の数学の試験の後、数学的推論スキルを急いで向上させました...)

驚いたことに、大きなモデルが書いた作文がベテランの高校教師さえも騙したのです!

試験当日、社内テスト中だった百度検索の「 AIパートナー」が中国語の試験をライブ配信した。

漢文の翻訳、読解、古詩の鑑賞といった「基本問題」から、短文やエッセイの「採点問題」まで、AIパートナーがすべて解答しました。

その結果、AIパートナーの作品が「こっそり」混入した大学入試エッセイ9編が中国語教師の荘林旭に届けられたとき、彼はそのうちの1編がAIによって書かれたものであることに全く気づかなかった。

AIが古典中国語でエッセイを書けるとは、まったく予想していませんでした。

次に、AIパートナーの古典中国語を理解する能力は、経験豊富な教師さえも驚かせました。

私の指導経験に基づくと、95% 以上の生徒には問題はありません。

AIパートナー試験を全て視聴したBi Dao氏も、ライブストリーム全体を見た後に感銘を受けた。

もしもう一度中国語で大学入試を受けたら、おそらく合格できないでしょう…

では、Baidu のセマンティック検索テクノロジーと大規模モデル機能を統合したこのAI パートナーは、試験全体でどのようなパフォーマンスを発揮したのでしょうか。

それぞれの項目を一つずつ見ていきましょう。

「AI受験者」が中国語大学入試に現地で挑戦。

まず、大きなモデルの「基本的な質問」である古代の詩の鑑賞について考えてみましょう。

感情と文体の「違いを見つける」という課題に直面して、百度検索AIパートナーは自信を持って、使用されている修辞技法を特定するだけでなく、古代の詩の起源と感情をさらに分析し、真に徹底した読解力を示しました。

さらに、読解力と空欄補充の練習もあります。AIアシスタントは、文章の解釈と文章の続きを書くことにも同様に長けています。

では、大きなモデルの「得点差別化問題」を参考に、ミクロエッセイを書いてみましょう。それでも問題はありません!

短いエッセイでは物足りないという方は、AIコンパニオンが詩をどれだけ上手に書けるか見てみましょう。現代詩はもちろん、頭韻詩まで難なくこなします。

しかし、プロンプトワードエンジニアリングがもう少し注意深く行われれば、AIパートナーはさらに良い回答をするようになるようです。

大学入試における漢詩の読解を例にとると、ここではまずヒントを与えずにAIパートナーに質問を「フィード」します。

AIの回答は良かったものの、大学入試問題としては長すぎ、詳細すぎました。

次に、AIコンパニオンのプロンプトを「最も重要な3つの画像」を強調したものに置き換えます。

案の定、AIはより正確な答えを提供し、病気の糸杉、不死鳥、フクロウを含む3つの画像が最も重要であると指摘しました。

しかし、上記はライブ配信中に示された効果のみを反映しています。AIコンパニオンのような大規模モデルに依存する機能の場合、その効果は本当にプロンプ​​トワードのパフォーマンスと強く相関しているのでしょうか?

私たちの AI パートナーの「真の能力」をテストするために、私たちは実際に大学入試問題でそのパフォーマンスをテストしました。

ライブ ストリームではすでに全国大学入学試験 (NCEE) A 試験のエッセイ トピックを取り上げましたが、今年の上海 NCEE 試験のエッセイ トピックに挑戦してみましょう。

第 1 ラウンドでは、次のような質問を直接提示しました。

AI パートナーは記事の「主なアイデア」を理解していたものの、その文章にはまだ欠陥があったようです。議論が十分に明確ではなく、エッセイの構成もあまり明確ではありませんでした。

第 2 ラウンドでは、プロンプトを変更し、AI パートナーに「ロール プレイング」効果を設定してみました。

まず、大学入試受験用であることを強調し、次に大学入試エッセイの書き方のテクニックを「教え込みます」。

このラウンドでは、AI パートナーの文章は大学入試のエッセイのような感じでした。

10 文字以内のタイトルが提供されているだけでなく、エッセイも一般-詳細-一般の構造と物語と議論の組み合わせを使用してよく書かれています。

大規模モデルの潜在能力を解き放つことは、確かにキューワード エンジニアリングに大きく依存しているようです。

ライブ配信中、百度グループの副社長兼検索プラットフォーム責任者であるシャオ・ヤン氏は、プロンプトワードに関する非常に簡潔な公式も教えてくれました。

プロンプトワード = タスク + 役割 + コンテキスト + 追加の詳細。

これにより、大規模なモデルが想定とは無関係な答えを出力することを心配する必要がなくなります。

もちろん、Baidu の「大規模モデルによる検索機能の再構築」における究極の武器である AI Partner は、大学入試問題を解く以上の成果を達成できます。

2023年の百度モバイルエコシステムカンファレンスで公式発表されたAIパートナーは、現在クローズドベータテスト中です。トライアルアクセスを取得すると、百度検索インターフェースから直接アクセスできます。

その主な機能は、検索エンジン上の万能 AI アシスタントのようなもので、インテリジェントな検索機能だけでなく、クリエイティブな生成スキルも備えています。

AIコンパニオンは、本質的には会話型のインテリジェント検索ツールです。情報を検索する際には、キーワードで検索する必要はなく、平易な言葉で質問するだけで済みます。

さらに、すべての回答は論理的で根拠がしっかりしています。「物事の真相を知りたい」場合は、リンクをクリックして対応するウェブサイトにジャンプしてください

こうすることで、ChatGPT がファイルを整理するときに行ったように、ケースが何もないところから作成されることを心配する必要がなくなります。

一方、マルチモーダルな大規模モデル作成アシスタントとも言えます。

リサーチや週報の作成、肖像画の描画を手伝ってくれるだけでなく、模擬面接に同行してくれたり、デートにも同行してくれたりします(?)。

ここでは、AI パートナーの「プログラマー アシスタント」を使用して、コードを生成する機能を試します。

面接で質問される可能性のあるバブルソートアルゴリズムを例に挙げてみましょう。

AIパートナーは、ほとんど何も考えずに、あっという間にアノテーション付きのバブルソートアルゴリズムを提供しました。そして何よりも重要なのは、すでにアルゴリズムを実行し、結果を出力していたことです。

つまり、私たち自身でコードを実行する必要はなくなり、面接官 (doge) に渡すだけで済みます。

上で実証された機能から判断すると、AI パートナーは、大学入試問題に対する「参考解答」を提供する以上の多くのことを行うことができます。

大学入試問題に挑戦するためにこの方法を採用した選択は目新しさからだったのかもしれないが、表面的な「テクニック」を超えて、その根底にある「原理」はもっと注目に値する。

大学入試問題に対してもAIパートナーが「輝き」続けることを可能にする大規模モデル技術は、検索エンジンの世代交代をきっかけに、あらゆる業界に波及し、人​​々の働き方さえも変えつつあります。

ChatGPT が初めて騒動を巻き起こしたときに Microsoft CEO の Satya Nadella 氏が予測したとおり、検索は大きな変革に直面しています。

そして、変化したのは検索技術や製品そのものだけではありません。今度は、検索が一人ひとりとより密接に結びつくようになりました。

3つの変更を検索

百度のCEO、ロビン・リー氏も「ビッグモデルが世界を変えようとしている」と考えている。この判断に基づき、リー氏は2023年第1四半期のOKRで「検索体験における世代的革命を主導する」ことを目指した。

それから3か月が経ち、この大規模モデルが検索をどう変革するのかという答えは、ますます明らかになりつつあります。

技術的な観点から見ると、大規模言語モデルの出現により、人間とコンピュータの相互作用が再定義されています

人間にとって最も自然なコミュニケーション手段は言語です。大規模モデルにおけるこの世代的ブレークスルーの最も直接的な現れは、機械の自然言語の聴取能力と表現能力の急速な向上です。

百度検索AIパートナーからの回答

検索自体は、人間とコンピュータのインタラクションの中核となる手法です。その本質的な技術的追求は、機械がより効率的に理解し、推論し、自己表現できるようにし、複雑な問題を直感的な最初の検索結果に変換することです。

したがって、大規模言語モデルのブレークスルーにより、検索の新たな可能性が十分に発揮されていると言えます。

AI の発展に伴い、検索は常に最先端の AI テクノロジーの最初の応用シナリオとなっていることは注目に値します。

百度検索を例に挙げると、百度検索は「ユーザーがニーズを表現するハードルを下げる」、「ユーザーがコンテンツやサービスにアクセスするハードルを下げる」、「検索エンジンのコンテンツ供給を充実させる」という3つの目標を達成するために、AI技術に多額の投資を行ってきました

大規模モデルを導入する前に、Baidu Search はすでに次のことを達成していました。

  • インターネット全体の何千億ものデータ ポイントの包括的なインデックス。

  • 世界をリードするディープセマンティック理解技術であり、その関連成果は2020年に国家技術発明賞二等賞を受賞しました。

  • 50 億のエンティティを網羅する中国最大のナレッジ グラフ。

製品の観点から見ると、過去 3 か月間のデータにより、会話型検索が検索エンジン市場の新たな変数になりつつあることが証明されています。

百度グループの副社長兼検索プラットフォーム責任者であるシャオ・ヤン氏は、大規模なモデルに支えられたAIパートナーが内部テスト段階でヒットとなり、関連する検索の質問と回答が急増したことを明らかにした。

これは、大規模モデルによってもたらされる新しい人間とコンピュータのインタラクション方法が、人々の「高速」かつ「効果的」な検索に対する要求をよりよく満たすことができることをさらに裏付けています。

「一つの行動が全体の状況に影響を与える」という諺があるように、現在、検索に関連するコンテンツの制作・創造の分野では、革新的なモデルが登場し始めており、積極的に模索・実践されています。

また、百度世界会議において、百度検索はAIパートナーと連携し、AI BOTソリューションを発表しました。これは、コンテンツおよびサービスプロバイダーに大規模な言語モデルとAIテクノロジー機能を提供し、新しい検索モデルとの統合の障壁を下げることを目的としています。

具体的には、百度検索は、クリエイター、マーチャント、組織、サービス、ブランドなど、さまざまなタイプの AI ボットを提供し、各社の強みや独自のコンテンツ、知識、サービスを活用して、ユーザーの質問に直接答える仮想アバターを作成できるようにします。

テクノロジーや製品以上に、誰にとってもさらに関連性が高いのは、ユーザーの検索方法の変化です。

前述のように、大規模モデルの時代においては、「質問する」能力がますます重要になっています。

現在の状況では、これは検索候補キーワードの品質が生成される検索結果の品質に直接影響を与えることを意味します。キーワードエンジニアリングのスキルを習得することは、インターネット時代の黎明期における検索スキルの習得と同じくらい重要です。

これに応えて、シャオ・ヤンは「検索インテリジェンス」という概念について言及した。

今後はIQやEQだけでなく、「検索力」でも競争していく必要があるでしょう。

プロンプトと AI パートナーをより有効に活用することで得られる利点は、ますます重要になります。

つまり、適切なプロンプトを見つける能力が強ければ強いほど、大規模モデル導入の時代に大規模モデルの強力な生産性をより十分に活用できるのです。

大規模モデルによってもたらされた時代を定義する嵐の下で、検索の 3 つの変革は、内部の技術的ボトルネックにおける世代を超えた突破口であると同時に、人間が情報にアクセスする方法の完全な革命を表していると言えます。

テクノロジーの変化を直接目撃したシャオ・ヤンが、このような判断を下したのも不思議ではない。

セマンティック検索技術と大規模言語モデルの組み合わせにより、理解、推論、組織化、創造といった検索の潜在能力がさらに発揮され、多くの面で破壊的イノベーションが促進され、検索シンギュラリティがもたらされると期待されています。

そして今回、おそらく誰もが世代交代の影響を真に感じることになるでしょう。

もう一つ

そういえば、大学入試のこの2日間、AIを搭載した百度検索は練習問題以外にも忙しく動いていた。

百度は毎年この時期になると、全国大学入学試験(高考)の特別サービスを開始し、検索とAIコアテクノロジーを通じて受験生とその保護者に利便性を提供しています。

百度は今年、AI技術を基盤とした初の大学入試検索インデックスもリリースしました。専門分野の検索人気度やトレンド、「大学比較」といった情報を網羅し、学生や保護者に学校や専攻を選ぶ際のより便利な参考資料や比較情報を提供します。

AI 搭載の大学出願アシスタントも大幅にアップグレードされ、出願予測をより直感的に表示し、学生と保護者の意思決定を支援する関連データを提供するようになりました。

ちなみに、百度は大学入試検索インデックスやその他の大学入試関連の検索データを利用して、中国教育オンラインのモバイル大学入試アプリと共同で多くの興味深いデータも公開している。

高等教育機関について見ると、検索人気度が最も高い学部教育機関のうち、ダブルファーストクラス大学と非ダブルファーストクラス大学の両方で南部の大学がトップ 10 を占めています。

専門学校の中で、職業教育の検索が最も多いのは山東省です。

専門分野では、医学が検索人気度で第 1 位にランクされていますが、航空宇宙は検索関心度が最も急速に伸びています。

最も収益性の高い分野は海洋電気電子工学です...