新知源報道 出典: 同期 編集者:ピーチ・ジョーイ 【新情報まとめ】ヒントン氏のAIへの懸念には根拠がある。テキサス大学が開発したChatGPTに似たモデルは、最大82%の精度で人の心を読み取ることが可能であり、ネットユーザーからは「私たちの心のプライバシーはどこにあるんだ?」という声が上がっている。ニューラルネットワークの父、ジェフリー・ヒントン氏は、生涯をかけて取り組んだ仕事に後悔していると述べ、Google を退社した。 振り返ってみると、AIに対する彼の恐怖は根拠のないものではなかった。 ChatGPT のようなモデルが心を読むことを学習し、その精度は最大 82% に達します。 テキサス大学オースティン校の研究者らは、GPT に基づいた言語デコーダーを開発しました。 非侵襲的なMRI/fMRIを通じて脳活動に関する情報を収集し、思考を言語に変換することができます。 論文リンク: https://www.nature.com/articles/s41593-023-01304-9 驚くべきことに、脳のデコーダーは、ピクサーの無声映画を見ている間のあなたの思考を読み取ることができます。 この ChatGPT のようなモデルは、これまでにない精度で人間の思考を解読し、脳イメージングの新たな可能性を解き放つだけでなく、プライバシーに関する懸念も引き起こします。 この研究はネット上で大きな騒動を引き起こした。ネットユーザーたちは「恐ろしい」と絶叫した。 私たちは真の思想警察となることに一歩近づきました。 GPT マインドリーディングは最大 82% の精度を誇ります。 では、この恐ろしい脳デコーダーはどのようにして「心を読む」ことができるのでしょうか? ここで、大脳皮質のさまざまな部分の血中酸素濃度を監視することで脳の動的な画像を取得できる機能的磁気共鳴画像法 (fMRI) について触れておく必要があります。 したがって、機能的磁気共鳴イメージングデータを分析するだけで、被験者の心の中の物語やイメージさえも非侵襲的に記述することが可能になります。 脳の活動は暗号化された信号のようなものであり、大規模な事前トレーニング済みの言語モデルはそれを解読する方法を提供します。 ここで、研究者らは GPT-1 に基づくニューラル ネットワーク言語モデルをトレーニングしました。 アレクサンダー・フートは、3人の参加者にポッドキャストを16時間連続で聴かせ、聴取中のfMRIデータを収集しました。 これらの言語ポッドキャストは、主にニューヨークタイムズの「Modern Love」などのトークショーや TED トークから構成されています。 次に、研究者らは大規模な言語モデルを使用して、参加者の fMRI データセットを単語やフレーズに翻訳しました。 参加者は、新しい録音を聞きながら脳活動をテストされました。翻訳されたテキストが参加者が聞いたテキストとどれほど似ているかを観察することで、デコーダーの精度を判定することができました。 人間が聞いた文章(左)と、脳活動に基づいてデコーダーが出力した文章(右)を比較すると、青色と紫色の部分が大部分を占めていることがわかります。青色は完全な一貫性、紫色は一般的な正確さを表しています。 ほぼすべての単語が 1 対 1 で対応しているわけではありませんが、文全体の意味は保持されます。つまり、デコーダーが脳への信号を「解釈」していることになります。 たとえば、最後の文では、被験者は「私はまだ運転免許を取得していません」と聞きましたが、デコーダーは「彼女はまだ運転の勉強を始める準備ができていません」と応答しました。 研究者が述べているように、人工知能は思考を正確な単語や文章に翻訳することはできず、むしろ書き換えるのです。 次に、参加者は静かに心の中で物語を思い描き、それを声に出して繰り返し、自分の語り直しとデコーダーの翻訳の違いを確認するように求められました。 ご覧のとおり、意味の重複はかなり多くなっています。 最後に、被験者は音のないアニメ映画を鑑賞しましたが、彼らの脳活動を分析することで、デコーダーは彼らが鑑賞していたものの要点を理解することができました。 実験結果によると、GPT モデルは、知覚された音声、想像上の音声、さらには無音のビデオからでも、理解可能な単語シーケンスを驚くほど正確に生成します。 具体的な精度率は次のとおりです。 知覚された音声(被験者は録音を聞く):72~82% 想像上の言語(被験者が1分間の物語を心の中で語る):41~74% 無声映画(被験者はピクサーの無声映画のクリップを視聴しました):21~45% MIT の神経科学者 Greta Tuckute 氏によると、言語の知覚は外部から駆動されるプロセスであるのに対し、想像力は能動的な内部プロセスであり、大規模な言語モデルによって脳内部の活動を明らかにすることができるとのことです。
将来的には、このデコーダーが、話す能力を失った人々を助けたり、精神的な健康状態を調べたりするために使用されるようになるかもしれません。 個人のプライバシーさえも失われます。 しかし、人間の思考を解読する可能性は、精神的なプライバシーに関する疑問も生じさせます。 ヒュース博士は、この言語デコード方法には一定の限界があると指摘しています。 fMRI スキャナーは大きくて高価であり、モデルのトレーニングは各人に対して個別のトレーニングを必要とする長くて退屈なプロセスだからです。 これに応えて研究チームは、他の被験者のデータで訓練されたデコーダーを使用して新しい被験者の思考を解読する追加の研究を実施しました。 研究では、異なる被験者のデータを使用してトレーニングされたデコーダーのパフォーマンスが低いことが判明しました。 つまり、被験者自身の脳で記録されたデータを使用して AI モデルをトレーニングすることによってのみ、その精度を非常に高くすることができるのです。 これは、それぞれの脳が意味を表現する独自の方法を持っていることを示唆しています。 さらに、参加者は、7 まで数える、農場の動物をリストアップする、まったく別の話をするなど、他の事柄について考えることで、自分の内なる独白を遮断し、デコーダーから逃れることができます。 つまり、このデコーダーでは正確な結果を得るためにボランティアの協力が必要です。 しかし、科学者たちは、将来のデコーダーがこれらの限界を克服し、嘘発見器のように悪用される可能性があることを認めています。 研究者たちは、これらおよびその他の予期せぬ理由から、美しい新しい世界が近づいていると結論付けました。 脳解読技術のリスクについての認識を高め、すべての人の精神的プライバシーを保護するための政策を策定することが重要です。 『ブラックミラー』には、保険外交員が事故死を調査するために、視覚モニターと脳センサーを備えた機械を使って人々の記憶を読み取るシーンがあります。 しかし、この未来はすでに現在なのかもしれません。 テキサス大学の研究者によるこの画期的な発見は、神経科学、コミュニケーション、人間とコンピュータの相互作用などの分野での潜在的な応用を直接的に促進しました。 「脳デコーダー」はまだ研究の初期段階にあるが、将来的には人々の夢を記録し、脳コンピューターインターフェースのさらなる開発に弾みをつけるために使用されるかもしれない。 この研究を率いた神経科学者のアレクサンダー・フース博士は、「この研究の背後にある原理に衝撃を受けました。私はこの研究を15年間続けてきました。ですから、ついに成功したときは、信じられないほどの驚きと興奮を覚えました」と語った。 X-メンのプロフェッサーXチャールズが使用した脳スキャン技術に一歩近づいたようだ。 ネットユーザー:AIサイキック この研究は多くの人々を困惑させた。あるネットユーザーは次のようにコメントした。 人工知能は人間の1万倍の速さでコミュニケーションできるだけでなく、今や私たちの思考を読むことさえできる。「これはすごい」と「え、私たちって時代遅れになってしまうの?」の間には、紙一重の境界線しかない。 AIは今や霊能者のように人の心を読むことができます。「心に留めておく」はまだバージョン1.0です。将来、私たちの思考はもはやプライベートなものではなくなります。世界経済フォーラムの第四次産業革命の概念は、この点を明確に示しています。 人間の脳活動から非侵襲的な方法で連続言語が再構築されたのはこれが初めてです。 この研究に関して、生命倫理学者のロドリゲス・アリアス・ヴェイルヘン氏は、これまで人間の脳が私たちのプライバシーの守護者であったと述べた。 「この発見は、将来この自由を犠牲にすることへの第一歩となるかもしれない。」 参考文献: |