|
先日、2011年ノーベル経済学賞受賞者であり、北京大学HSBCビジネススクールのサージェント定量経済・金融研究所名誉所長であるトーマス・J・サージェント教授が編集する*サージェント定量経済・金融研究所ニュースレター*第4号がオンラインで正式に公開されました。ニュースレターの初版に寄稿された独占記事「人工知能の起源」の中で、サージェント教授は人工知能と機械学習に関する自身の見解を述べています。全文は以下の通りです。 トーマス・サージェント あまり理解しにくい目撃者として、この記事では人工知能と機械学習がどのように発明されたかを説明し、この分野の主要人物とそのアイデアを列挙します。 1 導入 この記事は、人間、人工知能、そして学習に関するものです。ここで言う「人工」とは、「人間以外のもの」を意味します。人工知能と機械学習について説明する前に、自然とAIに対する私の理解を表明するため、まず、知的な人間が生得的なスキルと後天的なスキルを組み合わせて行う2つの重要な活動、すなわちパターン認識と選択について述べたいと思います。知能の他の側面としては、時間と空間の認識、そして他者への共感と思いやりが挙げられます。親たちは何世代にもわたって、先人たちから受け継いだスキルや視点、そして自らが学んだ新しい考え方を子供たちに伝えてきました。ガリレオ・ガリレイとチャールズ・ダーウィンが生来の才能と教科書的な知識をどのように組み合わせて科学的ブレークスルーを生み出したかを説明した後、現代の研究者がパターンを認識し選択を行うコンピュータプログラムをどのように設計しているかについて考察します。 この記事で多くの「ツリー」(様々な概念や手法)に触れてきましたが、一般の読者にとっては馴染みのない内容かもしれません。しかし、機械学習の「森」についての説明は分かりやすく理解していただけたかと思います。これらの複雑な「ツリー」についてさらに詳しく知りたい方は、専門のオンライン検索エンジンを利用するか、この記事の末尾にある参考文献を参照することをお勧めします。 2 人間の知能 まず、スティーブン・ピンカーの『白紙の石版』(2003年)の第13章から始めましょう。第13章のタイトルは「深淵からの脱出」です。高校生、大学1年生、あるいは教育の目的について深く考えるのが好きな方に、この章は特におすすめです。ピンカーは、人間の認知障害に関する自身の知見に基づき、高校や大学で何を学ぶべきか、そしてその理由についてアドバイスを提供しています。まず、進化によって私たちが自然に身につけたスキルと、学習を通して習得しなければならないスキルについて説明しています。 人類の10万年の歴史と先史時代において、進化によって私たちに与えられなかったスキルは特に重要ではありませんでした。しかし、現代の生活では、進化によって私たちに与えられなかったいくつかのものが、これまで以上に重要になっています。ピンカーはそのような4つの分野を特定しました。 1. 重さ、時間、空間、運動、エネルギー、熱、光に関する物理学の理論。 2. 生命、誕生、死に関する生物学理論。 3. 不確実性の統計的記述と相対頻度の識別および解釈の方法。 4. 仕事、生産、分配、価格、数量の経済的な説明。 現代社会において、これらの4つの領域を理解することによってのみ、私たちは情報に基づいた個人的な意思決定や公的な意思決定を行うことができます。しかしながら、私たちの「直感」はこれらの領域においてしばしば私たちを誤った方向に導きます。この記事では、「直感」を、様々な状況を素早く把握するために進化してきた思考方法と定義しましょう。同義語は「常識」、つまり私たちが本能的に理解していることです。スティーブン・ピンカーは、私たちの自然な直感的な理論が、これらの4つの領域においてどのように私たちを誤った方向に導く可能性があるか、そしてこれは教育によってのみ改善できると述べています。 ピンカーは、様々な分野における4つの説得力のある例を挙げ、私たちの常識や直感が現代物理学の理解に役立たないことを示しています。リチャード・ファインマンをはじめとする著名な物理学者によると、「常識」は一般相対性理論や量子力学を理解するのに苦労します。ピンカーは、私たちが統計的確率を計算する能力をどのように進化させてきたかを説明します。この能力は、狩猟採集民だった時代には役立ち、特定の事象の確率を計算することを可能にしました。しかし、今日、重大なリスク事象が発生する確率は、かつてよりもはるかに低くなっています。私たちの生来の傾向は、低確率の事象に対処するのに適していません。私たちは、公共の意思決定において、低確率のリスク事象のコストとベネフィットを適切にバランスさせることができなかったために、大きな代償を払ってきました。ピンカーは、進化が私たちの祖先に生産と交換の経済理論を与えたにもかかわらず、この理論が分業、分配、市場、仲介者、安定した市場における投機、そして利益を理解するのに役立たなかったことを説明しています。実際、私たちはこうしたことについて本質的に誤解しており、仲介業者、トレーダー、投機家、流動性提供者に対する搾取と虐殺が繰り返されるという悲劇的な結果につながることが多く、その犠牲者は少数派グループのメンバーであることが多いのです。 これらの認知的欠陥は、ピンカーが本書の第13章でカリキュラムの再設計を訴える理論的根拠となっている。ピンカーは教育を、生来の認知的限界を補い、生来の学習能力を活用する技術であると説明する。彼は、生物学、統計学、経済学といった、現代社会において人生を楽しみ、健全な意思決定を行うのに役立つスキルを教える、学問カリキュラムの抜本的な改革を提唱している。また、これらの科目の教育を増やすことは、他の科目の教育を減らすことを意味すると認識している。 2.1 人工知能と人間の認知能力の限界 第 13 章を読むと、人類が、人間本来の自然な知能を補完し、それを上回る「人工知能」に期待を寄せていることがわかります。 これは逆説的です。人工知能や機械学習を生み出すための主要な技術的ツールは、物理学、生物学、統計学、経済学といった、人間の生得的な知識が限られている分野から来ているのです。言い換えれば、私たちは本来的に苦手とする分野で人工知能や機械学習を生み出そうとしているのです。機械学習や人工知能の初期の先駆者や実践者たちは、既存の最適化技術や分析技術を徹底的に学び、想像力豊かに活用することで、自然認知における欠点を補ってきました。 3 機械学習の2人の先駆者 3.1 ガリレオ ガリレオ・ガリレイ イタリアの物理学者、数学者、天文学者、哲学者 17世紀初頭の偉大なイタリアの数学者、科学者、物理学者、そして天文学者であるガリレオ・ガリレイ(1564-1642)は、地球が太陽の周りを回っているという説を唱えたため、最終的に異端審問によって逮捕されました。逮捕の何年も前に、ガリレオは「機械学習」アプローチの真髄を体現する研究を行いました。ガリレオは(1) データ収集のための実験を設計・実施し、(2) パターン発見のためにデータを繰り返し観察し、(3) 関数を当てはめることでデータの次元を削減し、(4) その関数を自然界の一般法則として解釈しました。ガリレオの戦略は、機械学習と人工知能の意義を示す、おそらく最初の好例と言えるでしょう。 もちろん、ここで私が言及しているのは、ガリレオの「傾斜面実験」と、彼が行ったデータ処理と次元削減のことです。ガリレオは、落下する物体の力学を支配する自然法則を発見しようと試みました。「簡単だ、アイザック・ニュートンの万有引力の法則を適用すればいい」と思われるかもしれません。しかし、結論を急ぐのはやめましょう。ニュートンはまだ生まれていませんでした。当時広く受け入れられていた主流の理論は、2000年前にアリストテレスが提唱した「重い物体は軽い物体よりも速く落下する」というものでした。 ガリレオはアリストテレスの理論を研究するために経験的な方法を用いようとしました。重さの異なるボールを落として、その落下速度を測るだけでは不十分ではないでしょうか?ガリレオはそうすることができませんでした。なぜなら、重さに関わらず、どんなボールでも落下速度は当時の時計で正確に測定できる速度よりもはるかに速かったからです。そこでガリレオは、様々な角度の滑らかな斜面を作り、落下するボールが十分にゆっくりと動くように角度を調整することで、利用可能な時計を使って面に沿った速度を測定できると考えました。長さl、高さhの平面において、この比は… 平面の角度が決定されました。ガリレオはボールを落とし、ボールが平面に沿って移動した距離*d*を注意深く測定し、ボールを落としてから経過した時間*t*の関数として記録しました。彼は*ti*と*di*(i = 1,...)を記録する2列の表を作成しました。ここで、*n*は各実験における*n*回の測定回数を表します。特定の実験について、彼は*di*と*ti*を一緒にプロットしました。彼は様々な重さのボールを用いて、異なる*l*と*h*(つまり、傾斜面の異なる角度)を設定して実験を行いました。そして、記録したグラフを眺めていた彼は、驚くべき現象を発見しました。すべてのグラフにおいて、移動距離はボールの重さや平面の角度とは無関係に、経過時間の2乗に比例していたのです。彼は次の式を導き出しました。 驚くべきことに、右辺の関数にはボールの重さが含まれていないことに注目してください。したがって、ボールの落下速度は明らかに重さとは無関係です。このように、ガリレオは実験データに関数を当てはめることで、データの次元削減と一般化を同時に達成しました。彼は、50年後のアイザック・ニュートンの思考に大きなインスピレーションを与えることになる自然法則を発見したのです。 ガリレオの斜面実験には、現代の機械学習と人工知能の要素がすべて含まれています。彼は世界の仕組みを知らず、確固たる理論も持たずに実験を始めました。彼の行動は完全に理論から離れたものでした。そこで彼は一連の実験を行い、ボールの重さと斜面の長さ*l*、高さ*h*でインデックス付けされたデータテーブルを、実験ごとに1つずつ収集しました。これらの多数のデータテーブルから、彼は関数を導き出し(つまり「フィッティング」し)、この関数がたった一つの新しい数値、つまり「パラメータ」によって決定されることを発見しました。 ガリレオが実験を計画し、測定データを収集し、関数フィッティングによってデータの次元を削減するに至った動機が何だったのか、私には完全には理解できません。しかし、ガリレオが持っていたツール、そして彼を助けることができたのに欠けていたツールについては知っています。特に、彼は微分積分に精通していませんでした。これらのツールは、フェルマー、ニュートン、ライプニッツによって数十年後に発明されることになります。しかし、ガリレオは幾何学と代数学に精通しており、ユークリッドとアルキメデスにも精通していました。これらのツールがなければ、純粋なインスピレーションとアリストテレスの理論に対する懐疑心だけでは到底不十分だったでしょう。 3.2 ダーウィン チャールズ・ロバート・ダーウィン イギリスの博物学者、生物学者、進化論の創始者。 次の話は、ダーウィン(1809-1882)の「種の自然選択と進化」理論における経済理論の役割についてです。ハイエク(2011、付録B)は、サイモン・N・パットンが1899年に述べた次の言葉を引用しています。「…アダム・スミスが最後の道徳家であり、最初の経済学者であったように、ダーウィンは最後の経済学者であり、最初の生物学者であった。」 ダーウィンは原始的経験主義と次元縮減を用いて理論を構築した。彼は遺伝子とは何か、DNAとは何かを知らなかった。彼が「知っていた」のは、自身が飼育したハトの観察や自然界の動植物から収集した膨大なデータセットだった。ハトのデータのみを研究することで、彼は3つの基本原理のうち2つを導き出した。 1. 自然変異 2. 新しい変化の統計的継承 鳩の飼育者として、ダーウィンはこれらの二つの原理を用いて望ましい形質を選抜し、統計的遺伝に頼って新しい鳩の品種を開発しました。若い鳩は親から特定の形質を受け継ぎます。彼の繁殖は、自然選択ではなく「チャールズ・ダーウィンの選択」によって導かれました。ダーウィンは長い間、自然選択の原理を知りませんでした。その後、トーマス・マルサスの『人口原理論と社会の将来の進歩への影響』を読みました。マルサスは、人口増加率が食料生産率を上回ることから生じる闘争について説明しました。この前提の下では、食料の入手可能性が人口規模を制約し、個体は生存のために闘争を強いられます。マルサスの議論は、ダーウィンにパズルの欠けていたピース、すなわち生存闘争から生じる自然選択を与えました。生まれる子の数は、養える数を超えています。ダーウィン(1859)は序文で、第三の基本原理をマルサスに帰しています。 3. 競争的選択 ― 生存競争 著名なゲーム理論家や経済学者の中には、進化論を経済・社会ダイナミクスの源泉として頻繁に用いる者もいる。おそらく彼らはダーウィンに触発されたと考えているのだろう。しかし、ダーウィンの理論のかなりの部分は、実際には経済学者によって生み出されたものである。ハイエク(2011、付録A)が指摘するように、ダーウィンによる1838年のアダム・スミスの研究は、生物進化における自然選択理論の重要な要素となった。ハイエク(2011)はまた、文化進化論が1800年よりはるか以前から経済学者や社会学者に広く受け入れられていたことも指摘している。 ダーウィンの研究戦略は、3つの基本原則に基づいて膨大なデータセットの次元を削減し、低次元モデルを抽出するという好例です。データ収集、次元削減のための3つの基本原則の適用、そして最終的に理論の一般化。実に注目すべき研究戦略です。 ガリレオのように、ダーウィンもゼロからスタートしたわけではありません。彼は生物学、地質学、経済学に精通していました。これらの分野における既存の知識への深い理解が、既知を突破し革新を起こす彼の能力の基盤となりました。彼は「マクロ」思考者でした。なぜなら、彼の理論の最初の二つの柱、すなわち新しい形質の変異と遺伝には「ミクロ」な基盤が欠けていたからです。また、彼の三本柱理論に基づく生物進化が、古生物学と生物学における既知の証拠と一致するまでにどれくらいの時間がかかるかについても、彼は曖昧でした。⁴ 4 人工知能 これまで人間の知恵とインスピレーションについて議論してきましたが、今度は人工知能、つまり機械学習についてお話ししましょう。それは何でしょうか? ここで言及する人工知能とは、人間を模倣して「知的な」タスクを実行するコンピュータプログラムのことです。「機械学習」は、主に微積分と統計を用いてパターン認識を行います。ガリレオが傾斜面実験を用いて落下物体の速度を測定した方法に倣い、設計者は機械学習と人工知能を備えたコンピュータチップとプログラムを開発してきました。したがって、関数は「if-then」文の集合として捉えることができます。「if」の部分を関数のx座標、「then」の部分をy座標と想像してみてください。コンピュータを用いてパターンを認識するには、(1)データをxとyの部分に分割し、(2)関数fの関数形を推測し、(3)統計的手法を用いて異なるxとyのデータからfを推論する必要があります。「統計」という分野は、関数fを推論、つまり「フィッティング」するためのツールを提供します。 簡単な例を見てみましょう。地球上の特定の場所にいて、一年を通して日の出から日没までの「昼」の長さを記録したとします。X軸に1から365までの日数を、Y軸に日の出から日没までの時間を記入し、X軸とY軸を2つの列とする表を作成します。この表には365×2、つまり730個の数字があります。さあ、それらをプロットして眺めてみましょう。関数 y = cos(α + βx) を推測してみてください。 おそらくこれでこれらのデータをうまく要約できるでしょう。微積分を用いることで、関数に最も適合する2つのパラメータαとβの値を見つけ、それらを最小化することができます。 この関数は(完璧ではありませんが)非常によく当てはまることがわかります。データを要約すること(「データ圧縮」または「データ削減」とも呼ばれます)により、調査結果を「一般化」するための経験則(関数)を見つけることができました。この経験則は、365日間のサンプルを超えた「昼間」の長さを予測するために使用できます。 5 人工知能ツール 機械学習と人工知能の中核となる手法は、以下の分野から生まれています。⁵ 1. 物理学 2. 生物学 3. 統計 4. 経済 それでは、これら 4 つの分野を 1 つずつ分析してみましょう。 5.1 物理 18世紀と19世紀におけるオイラー、ラグランジュ、ハミルトンの研究は、微積分を用いて時間変動関数を最適化する積分法を拡張し、洗練させました。これは21世紀におけるハミルトン・モンテカルロ法のシミュレーション手法の基礎を築き、さらに高度なベイズ推定と機械学習手法の発展を促しました。19世紀には、クラウジウス、ボルツマン、ギブスが統計を用いて熱力学を記述するという概念を生み出しました。彼らは、エントロピー、すなわち尤度比(ある確率分布と別の確率分布の比)の期待値に基づいて熱力学第二法則を定義しました。一方の確率分布は平坦で一様であり、統計的には完全な無秩序を表しますが、もう一方の確率分布は、統計的に正確な意味で「秩序」を表します。 20世紀後半から21世紀初頭にかけて、エントロピーは多くの機械学習アルゴリズムに、適合モデルの確率分布とデータの経験的分布との差を測定する手法を提供しました。ポール・サミュエルソン(1947)と彼の同僚は、これらの手法をはじめとする数理物理学の手法を経済学に導入し、人工知能と機械学習のためのさらなるツール開発の基礎を築きました。 5.2 数理生物学 生物学は、時間と空間の両面における種の繁殖と変異のパターンを研究します。これらのパターンは、研究対象(個体、動物、DNA、RNA、あるいはそれらを構成するより小さな分子)に応じて、「マクロ」レベルと「ミクロ」レベルの両方で検出できます。生物学の数理理論(例えば、Feldman (2014) や Felsenstein (1989))は、確率差分または微分方程式の形で動的システムを構築することにより、これらのパターンを体系化します。ミクロレベルでは、主にDNAをバイナリ文字列にエンコードし、分析者がこれらの文字列に対して数学的演算(切断と組換え)を実行して突然変異や有性生殖を検出できるようにします。例えば、Holland (1987) を参照してください。 5.3 統計 現代の数理統計学では、「確率」には2つの意味があると考えられています。⁶ • 頻度主義者は、確率は、独立した同一分布のランダム変数の非常に大きなサンプルを観察した後に期待できる相対頻度であると信じています。 • ベイズ解釈:確率は、未知の隠れた「状態」または「パラメータ」に関する不確実性の主観的な表現です。 現代統計学は、(1) 一連のパラメータ(場合によっては高次のハイパーパラメータも)に依存する関数の集合を定式化する。(2) 標本からこれらのパラメータを推論または「推定」する。(3) 合理的な人間の視点からこれらの推論の不確実性を記述する。(4) これらの近似関数の確率的バージョンを用いて「標本外」予測を行う。これらの基本的な機械学習技術は、前述のようにガリレオが当時持っていなかった微積分の応用に依存している。 5.4 経済 経済学は、人間集団が希少資源をどのように意図的に活用し、配分するかを研究する学問です。現代経済理論は、自己整合的な環境における複数人による意思決定の理論です。整合的な経済モデルにおいては、抽象的な知的存在は「合理的」であるとされます。なぜなら、有限の最適化問題への対処は、環境に関する共有された正しい理解に基づいているからです。⁷ この複数人による意思決定理論には、主に2つのカテゴリーがあります⁸ ゲーム理論 一般均衡理論 これらの理論の主な要素と内容は次のとおりです。 • 制約 • 不確実性 • 分散化と並列最適化 • 取引ネットワークの台帳 • 価格 • 競争する これらのモデルでは、個体の意思決定ルールは、他の個体の選択問題に対する制約集合の一部を形成します。これらの制約は、モデルの「均衡条件」を通じて生成されます。個体制約付き最適化問題の解から、資源配分に役立つ情報を含む個体値を導出できます。 これらの経済モデルは、「並列処理」と分散型の意思決定プロセスを記述します。「均衡」として知られる仕組みは、異なる個人間の利己的な決定と物理的資源の制約を調和させるのに役立ちます。均衡という厳密な概念は、これらの主流の枠組みの両方において支配的です。均衡を定義することと、それを計算することは別の問題です。そのため、著名な経済理論家たちは長年にわたり次元の呪いと格闘し、競争的な均衡配分と価格体系を計算するための信頼性の高い手法を模索してきました。この取り組みにおける画期的な貢献としては、Arrow and Hurwicz (1958)、Arrow et al. (1959)、Arrow (1971)、Nikaido and Uzawa (1960)、Scarf (1967)、Scarf et al. (2008)などが挙げられます。これらのアルゴリズムは、計算手法を用いて、個人と社会が保有する価値の量、そして人々が望む財と活動の量と社会的な取り決めとの間のギャップを追跡します。 計算的均衡に関する研究は、均衡の計算と限定合理的個体の均衡への収束との間に密接な関連があることが明らかにされました。BrayとKreps (1987)とMarsetとSargent (1989)は、「均衡における学習」と「均衡の学習」という重要な区別を提唱しました。MarsetとSargent (1989)とSargentら (1993)は、確率的近似の数学的手法を用いて、合理的に期待される均衡への収束を研究しました(例えば、Gladyshev (1965)を参照)。私の知る限り、確率的近似に関する最も初期の研究は、Hotelling (1941)とFriedmanとSavage (1947)に遡ります。彼らは、与えられた点における未知の関数の最大値を厳密に求めるための統計的サンプリング法の構築を試みました。 シュビック(2004)とバック他(1999)は、均衡過程における価格設定者の促進的役割を考察するために、いくつかのゲームを構築した。(一般均衡モデルでは、価格受容者のみが存在し、価格設定者は存在しない。)シュビックの研究は、一般均衡理論とゲーム理論の隙間に存在するトピックに関する彼の専門知識を活用したものであり、機械学習と人工知能にとって非常に重要である。 • 貨幣理論 シュビック(2004)の精神に則り、貨幣理論を考える良い方法は、その目的が、一般均衡モデルの中で実際に生活する個人によって均衡価格ベクトルがどのように設定されるかを説明することであると認識することです。アイロとデブリューの古典的な一般均衡モデルは、均衡価格ベクトルの特性を記述していますが、誰がどのようにこの価格ベクトルを設定するかについては何も述べていません。その代わりに、モデルの外部にいる「神」が、すべての市場を均衡化させながら、不思議なことに価格ベクトルを宣言します。均衡価格ベクトルは、各個人の予算制約が満たされることを保証します。一般均衡モデルでは、貿易は多国間であり、予算制約は中央集権的な口座によって調整されます。対照的に、貨幣理論は、人々が時折、一連の二国間会合で会合し、「交換手段」を用いて財やサービスを交換する分散型システムに関するものです。この交換手段は、耐久性のある金属(金や銀)、トークン(ペニー、紙幣の「ドル」や「ポンド」)、流通する債務証券、あるいは銀行、決済機関、中央銀行の口座などです。オストロイとスター(1974年)、オストロイとスター(1990年)、そして最近ではタウンゼント(2020年)がこの学派の研究を要約しました。暗号通貨理論はこれらの研究の直接的な流れを汲んでいます。 ゲーム理論研究が機械学習にもたらした貢献について、さらに詳しくご紹介します。応用経済学者は数十年にわたり、ゲーム均衡を計算するアルゴリズムを開発してきました。これらの計算を支える主要なツールとしては、後方帰納法(動的計画法)や木探索などが挙げられます。研究対象となる可能性のある状態の次元が指数関数的に増加するにつれて、研究対象となる状態の数を減らすことが、近似均衡への進歩にとって極めて重要になります。この点において、ミニマックスアルゴリズムとα-β枝刈り探索アルゴリズムが主要なアプローチです。α-β枝刈り探索の説明、対応する計算システム、そして「適者生存」の考え方については、KnuthとMoore (1975) の研究とhttps://www.youtube.com/watch?v=STjW3eH0Cikを参照してください。関連する研究分野として、対戦相手の過去の行動に基づいてナイーブに最適化を行うプレイヤーのグループが、ナッシュ均衡に収束するかどうかを調査するものがあります。 Monderer and Shapley (1996)、Hofbauer and Sandholm (2002)、Foster and Young (1998)、Fudenberg et al. (1998) を参照。収束が達成されると、この「架空ゲーム」アルゴリズムは均衡点を計算する方法を提供する。Lambert III et al. (2005) を参照。 5.5 ジョン・ホランドが 1985 年頃に提唱した人工知能のビジョン。 ジョン・ヘンリー・ホランド アメリカの科学者、複雑性理論と非線形科学の先駆者、遺伝的アルゴリズムの父。 著名なコンピュータ科学者であるジョン・ホランドは、その先駆者でした。彼は、これまで述べたすべての技術分野のアイデアを組み合わせ、Arrow (1971) のアプローチに倣い、「実践による学習」しか選択肢のない特定の環境に生きる意思決定者のためのコンピュータモデルを構築しました。ホランド (1987) がこの手法を発表し、Marimon ら (1990) は、複数人が関わる経済環境への具体的な適用について説明しました。ホランドの手法の重要な部分は、彼が「遺伝的アルゴリズム」と呼ぶグローバル探索アルゴリズムです。これは、関数のパラメータを文字列として表現し、それらをランダムに組み合わせて文字列のペアを作成し、それを切断して再結合することで、「大まかな地形」を探索します。これは、ホランドが「有性生殖」を表現する機械的な方法です。このような「遺伝的アルゴリズム」には、彼が「分類器」システムと呼ぶものの一部が含まれています。ホランドの分類システムは、(1) 一連の「if-then」文(これらの文の一部は、オンライン(すなわちリアルタイム)の意思決定権を巡って互いに競合する必要がある)。(2) 「if-then」文をランダムに突然変異、切断、再結合可能なバイナリ文字列にエンコードする方法。(3) 個々の「if-then」文に報酬とコストを割り当てる計算システム。(4) DNAの切断と再結合に基づくランダムな突然変異や有性生殖を含む、新しい「if-then」文を分解および生成するプログラム。(5) 適切な意思決定ルールを選択するための競争的闘争。ホランドの分類システムは、動的な環境において忍耐を学習することが示されており、ラモン・マリモンが要約したように、ホランドのAI個体で構成される世界では「忍耐には経験が必要である」。ホランド分類器は、動的経済モデルにおいて「安定」なナッシュ均衡を計算することに成功した。このモデルの著者は、事前にその存在を知らなかったが、後にホランド分類器によって与えられた「推測」を検証することができた。序論については、Marimon et al. (1990) を参照のこと。 5.6 今日の人工知能 DeepMind社のコンピュータプログラムAlphaGoは、囲碁をマスターし、人間の囲碁チャンピオンを破るという驚くべき偉業を成し遂げました。Wang et al. (2016) を参照してください。AlphaGoの開発者たちが用いた手法は、料理の過程を彷彿とさせます。ある材料を他の材料にほんの少し加え、味見をして、また加えていくのです。AlphaGoの調理法には、動的計画法、トンプソンサンプリング(Thompson, 1933参照)、ランダム近似(Hotelling, 1941、Friedman and Savage, 1947参照)、α-β木探索(Knuth and Moore, 1975参照)、Q学習(Watkins and Dayan, 1992参照)、モンテカルロ木探索(Browne et al., 2012参照)といった手法から着想を得ています。パラメータ調整における経験則は、「探索」と「活用」の間のトレードオフを考慮する必要があるため、非常に重要です(Fudenberg and Kreps, 1993、Fudenberg and…)。この点はKreps (1995)でも議論されています。 機械学習における最近の進歩には、経済学的・統計学的手法も豊富に取り入れられています。例えば、計算最適化輸送問題において、Peyr'eら(2019)は、Dantzig、Kantorovich、Koopmansによる線形手法を用いて、理論的な確率と経験的測定値の差を測定しました。そして、この測定値を用いて、データと理論を一致させるための効率的な計算手法を構築しました。経済学者のHotelling(1930)は、リーマン幾何学を用いて、パラメータ化された一連の統計モデルを表現しました。このアイデアは、Amari(2016)によって体系化された計算情報幾何学の先駆けとなりました。 6 創造性の源泉:模倣と革新 ガリレオとダーウィンが、先人たちの成果と手法を習得し、比類なき洞察力と組み合わせることで、新たな自然法則を発見した経緯を解説しました。先例を尊重し、それを超越する能力こそが、この二人の天才の業績の顕著な特徴です。電磁気学の発見、そしてフランクリン、デービー、ファラデー、マクスウェル、マイケルソン、モーリー、そしてアインシュタインによる一連の発見など、後世の多くの天才たちも同じアプローチを採用しました。彼らは誰一人として「白紙の状態」(偶然にも、これは前述のピンカーの著書のタイトルです)から出発したわけではなく、むしろ先人たちへの深い理解と敬意から出発したのです。彼らは先人たちが気づかなかったことを見抜いていましたが、それは多くの場合、より優れた観察方法や推論方法を用いていたためです。ファラデーには知られていなかった数学を適用することで、マクスウェルは驚くべき統一と一般化を成し遂げ、電磁気学の法則を12の方程式にまで簡略化しました。ハイヴァードはそれをすぐに4つにまで簡略化しました。これら 4 つの方程式は、アインシュタインの特殊相対性理論への道を開いた。⊃1;⊃1; 電磁気学とは一見無関係に思える純粋に理論的な数学は、偶然にも後の電磁気学の発見と重なりました。幾何学を代数に変換し、関数として表現するために、デカルトは座標系を発明しました。50年後、ニュートンとライプニッツは直交座標系を用いて微分と積分を発明しました。19世紀前半には、ガウスとその弟子リーマンが平行線の交差に基づく曲面幾何学を完成させました。リッチはこれに曲率という具体的な概念を加えました。 爱因斯坦将这两个独立的、看似“毫不相关”的研究工作结合起来,一个是实际的物理现象,另一个是纯粹的抽象数学。爱因斯坦在努力扩展其狭义相对论时,学会了如何使用黎曼几何和里奇曲率,构建了一个自洽的广义相对论。⊃1;⊃2; 科学进步展示了“模仿”和“创新”两者之间的互动,这种互动在现代经济增长理论中也有所体现(例如,见班哈波柏(Benhabib et al.,2014)和班哈波柏(Benhabib et al.,2020))。在“模仿”阶段,电磁学、相对论和数学领域的先驱者主要是复制前辈和老师的技术;在“创新”阶段则是在某种程度上超越前辈和老师,因为他们比老师学得更多、理解得更深。 7 結論 通过对物理学、生物学、统计学和经济学中的观点的概述,我希望证明一个主张:即平克Pinker(2003)认为我们在认知上有先天局限的学科,正是被用来创造人工智能和机器学习的学科。这正是在学期间和离开学校以后继续学习这些学科的又一个理由。在我看来,它们自身的美则构成了另一个理由。 脚注1:哈耶克(Hayek, 2011, 附录A)讨论了自然和人工的其他定义。 脚注2:时至今日,观察科学家如何应用机器学习和人工智能,你会看到这些聪明人搜集了大量数据、然后以之拟合函数。De Silva et al. (2020)与Brunton and Kutz (2022)是其中两个漂亮的范例。 脚注3:为了找到埋藏在第谷·布拉赫(Tycho Brahe) (1546-1601) 的已知行星位置时间戳测量表中的三个行星运动定律,约翰内斯·开普勒(Johannes Kepler) (1571-1630) 使用了类似于伽利略的方法。李(Li)等人追随开普勒的脚步,使用机器学习技术从布拉赫(Tycho Brahe)的数据中提取开普勒定律之一。如需了解开普勒和伽利略的科学方法的精彩描述参见温伯格(Weinberg ,2015)。 脚注4: 当时一些顶尖科学家并没有马上接受达尔文的理论。例如,开尔文(Kelvin)勋爵声称当时盛行的地球估算年龄还远远无法论证达尔文的理论是否成立。 脚注5: 因此,现代计算和人工智能的伟大发明者约翰·冯·诺依曼(John von Neumann)对这四个领域进行了研究并做出了重大贡献并非巧合。参见Bhattacharya (2022) 了解更多有关冯·诺依曼的工作和生活的叙述。 脚注6: 这个网站借助Python 代码探索了这两种可能的有关概率意义,参见https://python.quantecon.org/prob_meaning.html。 脚注7:当经济学家谈到“理性预期”时,他们指的是假设“对环境的普遍正确理解”。 “理性预期”一词修饰的是“模型”,而不是“人”。 脚注8:参见克雷普斯(Kreps,1997)进一步了解这两类模型的共同特征和缺点,以及一些精彩的观点和关于新方向的猜想,在我看来,这些新方向似乎预示了人工智能随后会进入经济学。 脚注9:霍特灵、弗里德曼和萨维奇的工作最后引出了“贝叶斯优化”这一机器学习技术。可参见斯诺克(Snoek et al. ,2012)。 脚注10: 请参考https://en.wikipedia.org/wiki/John_Henry_Holland, https://www.nytimes.com/2015/08/20/ science/john-henry-holland-computerized-evolution-dies-at-86.html. 脚注11:爱因斯坦的办公室墙上挂有麦克斯韦的照片。 脚注12:对这些事件的记录详见法梅洛(Farmelo,2019)著作的第三章。 (上下滑动,查看更多) 原标题:《独家首发!诺奖得主萨金特教授论“人工智能的来源”》 |