HUOXIU

教師あり学習か教師なし学習か?この質問は明確にする必要があります。

2020-04-28 17:10:56

全文は 1691 語から成り、読むのに 6 分かかると推定されます。


画像出典: unsplash


機械学習の旅を始める際、まず最初にすべきことは、教師あり学習と教師なし学習を理解することです。初心者にとって、「教師あり学習と教師なし学習の違いは何ですか?」という質問は非常によく聞かれます。


答えは、機械学習アルゴリズムの本質を理解することにあります。教師あり学習と教師なし学習を明確に区別しなければ、学習は行き詰まってしまいます。


sSDBQIF は、線形回帰、ロジスティック回帰、クラスタリング、ニューラル ネットワークなどのアルゴリズムの適用範囲を理解していない場合、モデル構築段階に直接進むことができません。


機械学習アルゴリズムの目的を理解していなければ、正確なモデルを構築することはできません。これが教師あり学習と教師なし学習の起源です。


この記事は、この問題の解決に役立ちます。また、ボーナスとして、もう 1 つの重要な質問も提示します。教師あり学習と教師なし学習をいつ使用するかをどのように決定するのでしょうか。


教師あり学習とは何ですか?


教師あり学習では、コンピュータは事例から学習します。過去のデータから学習し、その学習内容を現在のデータに適用して将来の事象を予測します。この場合、入力データと期待される出力データの両方が将来の事象の予測に貢献します。


正確な予測を行うために、入力データは正解としてマークされます。


教師あり機械学習分類


すべての教師あり学習アルゴリズムは本質的に複雑なアルゴリズムであり、分類モデルや回帰モデルなどのカテゴリに分類されることを覚えておくことが重要です。


1. 回帰モデル - 回帰モデルは、出力変数が単一の数値、ドル、給与、体重、ストレスなどの実際の値である問題に使用されます。回帰モデルは、過去に観測されたデータに基づいて値を予測するために最も一般的に使用されます。一般的な回帰アルゴリズムには、線形回帰、ロジスティック回帰、多項式回帰、リッジ回帰などがあります。


2. 分類モデル - 分類モデルは、「はい」「いいえ」「合格」「不合格」といった出力変数を分類するために使用されます。また、データのカテゴリを予測するために使用されます。実際の例としては、スパム検出、感情分析、試験のスコアカード予測などが挙げられます。


教師あり学習アルゴリズムには、次のような実際の用途があります。


テキスト分類

スパム検出

天気予報

• 現在の市場価格に基づいて住宅価格を予測する

• 株価予測など

顔認識

• 署名認識

顧客発見


画像出典: unsplash


教師なし学習とは何ですか?


教師なし学習とは、分類もラベル付けもされていないデータを用いて機械を訓練する手法です。つまり、訓練データを提供することはできず、機械は自ら学習しなければなりません。機械は、データに関する事前情報を一切与えられなくても、データを分類できなければなりません。


その考え方は、まずコンピュータを大量の変化するデータにさらし、そこから学習させることで、これまで知られていなかった洞察を提供し、隠れたパターンを特定するというものです。したがって、教師なし学習アルゴリズムは必ずしも決定的な結果をもたらすわけではありません。むしろ、与えられたデータセットから何が異なっているか、あるいは何が興味深いかを特定します。


コンピュータが学習するにはプログラミングが必要です。構造化データと非構造化データの両方を理解し、そこから洞察を提供する必要があります。教師なし学習の正確な説明は次のとおりです。


教師なし機械学習による分類


1. クラスタリングは、最も一般的な教師なし学習手法の一つです。クラスタリング手法では、ラベル付けされていないデータをクラスターと呼ばれる類似のグループに整理します。つまり、クラスターとは類似したデータ項目の集合です。ここでの主な目的は、データポイント間の類似性を発見し、類似したデータポイントを単一のクラスターにグループ化することです。


2. 異常検出とは、データの大部分とは大きく異なる特別な項目、イベント、または観測値を特定する手法です。データ内の異常値や外れ値を探すのは、通常、それらが疑わしいからです。異常検出は、銀行詐欺や医療ミスの検出によく用いられます。


画像出典: unsplash


教師なし学習アルゴリズムの応用


教師なし学習アルゴリズムの実際的な応用としては次のようなものがあります。


マルウェア検出

• データ入力プロセス中の人為的エラーの特定

• 正確なショッピングカート分析などを実施します。

不正行為検出

教師あり学習と教師なし学習はいつ選択すればよいのでしょうか?


製造業において、特定のタスクに最適な機械学習手法は多くの要因によって左右されます。さらに、機械学習の問題はそれぞれ固有の性質を持つため、どの手法を用いるかを決定するのは複雑なプロセスです。


一般的に言えば、適切な機械学習手法を選択するための良い戦略は次のとおりです。


• データを評価します。ラベルを付けるかどうか?追加のラベル付けをサポートする専門知識はありますか?これは、教師あり学習、教師なし学習、半教師あり学習、強化学習のどの手法を使用するかを判断するのに役立ちます。

• 次元問題(特徴量、属性、または特徴量数)に適した利用可能なアルゴリズムを検討します。候補となるアルゴリズムは、データ全体の量とその構造に適したものでなければなりません。

• 成功したケーススタディと同様の問題に適用されたアルゴリズムの種類を研究します。

• 目的を定義する。定義された問題は再発しますか?アルゴリズムは新しい問題を予測できると期待できますか?


画像出典: unsplash


教師あり学習と教師なし学習は、機械学習分野における重要な概念です。機械学習を学び始める際に最初に学ぶべき内容なので、しっかりと理解しておきましょう。



https://www.toutiao.com/i6820687480707088903/