Pythonの機械学習ライブラリ「scikit-learn」の説明です。
scikit-learn とは?
scikit-learnは、Pythonの機械学習ライブラリであり、オープンソースで利用可能です。
このライブラリは、機械学習のアルゴリズムやツールを提供し、データの分析や予測モデルの作成に役立ちます。
scikit-learnの導入方法
導入方法は以下の通りです。
- Pythonをインストール
- pipを使用して、scikit-learnをインストール
「-U」というオプションは、pipのアップグレードを意味します。
pip install -U scikit-learn
scikit-learnの使い方
使い方は以下のようになります。
- 必要なライブラリをインポート
- データを読み込み、前処理を実行
- モデルを選択し、訓練データを使ってモデルを学習させる
- テストデータを使ってモデルを評価
scikit-learnのサンプルコード
以下は、scikit-learnを使ったサンプルコードです。
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score
# データを読み込む
iris = load_iris()
# 特徴量とターゲットを取得する
X = iris.data
y = iris.target
# データを訓練用とテスト用に分割する
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# モデルを定義する
knn = KNeighborsClassifier(n_neighbors=3)
# モデルを訓練する
knn.fit(X_train, y_train)
# テストデータでモデルを評価する
y_pred = knn.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
このコードは、アヤメの花のデータを使用して、「K最近傍法(ケイきんぼうほう)」を使って花の種類を分類することを示しています。
この例では、テストデータに対する正解率を評価しています。