Python 3 – 機械学習アルゴリズムの比較-Pythonチュートリアル

人工知能、特に機械学習は、開発者とプログラマーの作業を最も簡単にするために作成されました。

多くのコード行を記述する代わりに、機械学習アルゴリズムから選択してから、プログラミング言語を決定する必要があります。 それは難しいかもしれません。

関連コース: Python機械学習コース

どうして? まず、機械学習には4種類のアルゴリズムがあります。

機械学習アルゴリズム

教師あり学習

教師あり学習はに基づいています ラベル付きトレーニングデータ

教師あり学習のベースは、トレーニングデータと呼ばれるデータと一連のトレーニング例です。

ラベル付きトレーニングセットには、他のオブジェクトの未知のラベルを予測する機能があります。

2つのタイプがあります:

  1. 回帰(ラベルが実数の場合)
  2. 分類(ラベルが制限されていて順序付けされていない場合)。

教師あり学習は、ラベル付けされたトレーニングデータを使用します

教師なし学習

教師なし学習は、ラベルのないデータです。

教師なし学習の基本は、オブジェクトに関する情報が少ないことです。 これらのテストデータは、ラベル付け、分類、または分類されていません。

教師なし学習では、クラスター内で類似性のあるオブジェクトのグループを作成し、これらのオブジェクトを異常と見なして、すべてのクラスターから異なるオブジェクトを分離できます。

半教師あり学習

半教師あり学習には、ラベル付きとラベルなしがあります。

教師ありおよび教師なしの長所と短所を収集する半教師あり学習は、特にデータにラベルを付けることができない人向けです。

トレーニングセットには、精度を向上させるために、ラベル付きとラベルなしの両方があります。

強化学習

強化学習が行動を起こしている。

強化学習用のデータセットがないため、以前のものとは異なります。

強化学習は、ソフトウェアエージェントが報酬を最大化するために行動を起こす方法です。 これは、最も効果的な方法で行動するためのトレーニングです。

アルゴリズム

それで、これを知って、6つの機械学習アルゴリズムの簡単な再開をしましょう。

  • 線形回帰線形分類器:最も単純なアルゴリズムがある場合は、これらである必要があります。 何千もの機能があり、まともな品質を提供する必要がある場合に使用します。

これらよりも優れたアルゴリズムは、過剰適合に悩まされる可能性がありますが、回帰と分類器は膨大な量の機能を保証します。

  • ロジスティック回帰:バイナリ分類を実行するため、ラベル出力はバイナリです。 これは、特徴の線形結合を取り、それに非線形関数を適用します。 これは、非線形分類器の最も単純なアルゴリズムです。

  • 決定木:枝と葉は命を救います。 このアルゴリズムは、観察から結論に至る予測モデルです。 実在の人々は意思決定ツリーを使用して意思決定を行うことができるため、かなり理解しやすくなります。 解釈が最も簡単なのは、ランダムフォレストまたは勾配ブースティングを構成するために一般的に使用されます。

  • K-means:オブジェクトの機能に応じてラベルを割り当てることが目標であるが、ラベルがない場合は、クラスター化タスクと呼ばれ、このアルゴリズムによって可能になります。 ただし、さまざまな長所と短所を持つクラスタリング手法の範囲があり、最初に検討する必要があります。

  • 主成分分析(PCA):さまざまな機能があり、相互に高い相関関係があり、モデルが大量のデータに簡単に収まりすぎる場合に適用できます。 このアルゴリズムは、情報の損失を最小限に抑えて次元を削減するのに最適です。

  • ニューラルネットワーク:すべての特定のタスクには、さまざまなアーキテクチャまたはさまざまなレイヤー/コンポーネントがあります。 画像を扱う時点では、ニューラルネットワークが理想的です。 彼らのトレーニングは非常に複雑な計算を必要としますが、アルゴリズムの新時代を提示します。

機械学習を初めて使用する場合は、 それなら私はこの本を強くお勧めします。

Hope this helps!

Source link