scikit-learn

Pythonの機械学習ライブラリ「scikit-learn」の説明です。

scikit-learn とは?

scikit-learnは、Pythonの機械学習ライブラリであり、オープンソースで利用可能です。

このライブラリは、機械学習のアルゴリズムやツールを提供し、データの分析や予測モデルの作成に役立ちます。

scikit-learnの導入方法

導入方法は以下の通りです。

  • Pythonをインストール
  • pipを使用して、scikit-learnをインストール

「-U」というオプションは、pipのアップグレードを意味します。

pip install -U scikit-learn

scikit-learnの使い方

使い方は以下のようになります。

  • 必要なライブラリをインポート
  • データを読み込み、前処理を実行
  • モデルを選択し、訓練データを使ってモデルを学習させる
  • テストデータを使ってモデルを評価

scikit-learnのサンプルコード

以下は、scikit-learnを使ったサンプルコードです。

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score

# データを読み込む
iris = load_iris()

# 特徴量とターゲットを取得する
X = iris.data
y = iris.target

# データを訓練用とテスト用に分割する
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# モデルを定義する
knn = KNeighborsClassifier(n_neighbors=3)

# モデルを訓練する
knn.fit(X_train, y_train)

# テストデータでモデルを評価する
y_pred = knn.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)

print("Accuracy:", accuracy)

このコードは、アヤメの花のデータを使用して、「K最近傍法(ケイきんぼうほう)」を使って花の種類を分類することを示しています。

この例では、テストデータに対する正解率を評価しています。

タイトルとURLをコピーしました