【AIプログラミング】サポートベクターマシンのカーネルによる境界線の確認

2020年4月21日

サポートベクターマシンのカーネルによる違いで境界線がどのように変化するかを見てみるよ。

scikit-learn公式ドキュメントの「plot different SVM classifiers in iris dataset」のやつだね。

前回、サポートベクターマシンについて勉強をして、最終的にカーネルを変更することで、境界線を直線（線形）にしたり、曲線にしたりできるというところまでやりました。今回は、scikit-learnの公式ドキュメント、「Plot different SVM classifiers in iris dataset」を参考に、カーネルの違いで境界線を引いてみたいと思います。

公式scikit-learnの公式ドキュメントはこちらからどうぞ

scikit-learn

Plot different SVM classifiers in the iris dataset Comparison of different linear SVM classifiers on a 2D projection of the iris dataset. We only consider the first 2 features of this dataset: Sepal length, Sepa...

こんな人の役に立つかも

・機械学習プログラミングを勉強している人

・サポートベクターマシンのカーネルによる境界線の違いを知りたい人

境界線を描くプログラムで確認しよう

今回は、アヤメデータを利用するのですが、アヤメデータは４特徴量のため、２特徴量だけに絞ります。

scikit-learn公式ドキュメントのプログラムは若干直感的ではなかったので、分解して作成しなおしました。それぞれのプログラムパート毎に記事を書いていますので、よろしければ参考にしてください。

アヤメデータを２次元化する部分については、こちらの記事で詳細にプログラムを開設していますので、アヤメデータの２次元化がわからない方はご参考ください。

ぱんだクリップ

【AIプログラミング】アヤメのデータの2次元化、機械学習アルゴリズムを試す準備 | ぱんだクリップいきなり特徴量が４個のアヤメのデータの分類をしていたけれど、もっとわかりやすいところをやるべきだった・・・機械学習のアルゴリズムを何種類か勉強してみたところ、...

import～２次元アヤメデータの読み込み

ライブラリのimport～アヤメデータを読み込み、２次元のアヤメデータに変換します。

#サポートベクターマシン
from sklearn import svm
from sklearn.datasets import load_iris
#matplotlib
import matplotlib.pyplot as plt

import numpy as np
#import matplotlib.pyplot as plt

panda_box = load_iris()

X = panda_box.data
y = panda_box.target

X_2dim = panda_box.data[:,:2]

次に、境界線を視覚的にわかりやすく描くための関数を作成します。

こちらの記事でも詳しく詳細を記載しておりますので、ご参考ください。

ぱんだクリップ

【AIプログラミング】分類問題の境界線を引く機能を理解する１ | ぱんだクリップサンプルプログラムをそのまま動かしたけれど、何してるか理解しいないと進歩ないね・・・よき心がけですね。前回、k最近傍法の境界線がどうなっているかを確認するプロ...

#関数を作成
def make_meshgrid(x, y, h=.02):
    x_min, x_max = x.min() - 1, x.max() + 1
    y_min, y_max = y.min() - 1, y.max() + 1
    xx, yy = np.meshgrid(np.arange(x_min, x_max, h),
                         np.arange(y_min, y_max, h))
    return xx, yy

def plot_contours(ax, clf, xx, yy, **params):
    Z = clf.predict(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)
    out = ax.contourf(xx, yy, Z, **params)
    return out

def graf_setting(ax):
    #ax.set_xticks(())
    #ax.set_yticks(())
    ax.set_xlabel('Sepal length')
    ax.set_ylabel('Sepal width')

サポートベクターマシンに訓練をさせて、境界線を表示します。

以下のプログラムでは、

１．線形サポートベクターマシン

２．リニアカーネルのサポートベクターマシン

３．RBFカーネルのサポートベクターマシン

４．polynominalカーネルのサポートベクターマシン

のそれぞれを試すことができるようになっています。

試したいサポートベクターマシンのコメントアウト（#）を外して、（それ以外はコメントアウトする）利用することで、４種類の境界線を確認することができます。初期は１．線形サポートベクターマシンとなっています。

#===サポートベクターマシンの作成===
C = 1.0
#↓試したいmodelのコメントを外します。
#１．線形サポートベクターマシン
model = svm.LinearSVC()
#２．リニアカーネル
#model = svm.SVC(kernel='linear', C=C)
#３．rbfカーネル
#model = svm.SVC(kernel='rbf', gamma=0.7, C=C)
#４．polynominalカーネル
#model = svm.SVC(kernel='poly', degree=3, gamma='auto', C=C)

#訓練
clf = model.fit(X_2dim, y)

#空のグラフを作成
fig = plt.figure(figsize=(9, 4))
ax = fig.add_subplot(121)
#fig = plt.figure()
#ax = fig.add_subplot(111)

#グリッドのデータを作成
X0, X1 = X[:, 0], X[:, 1]
xx, yy = make_meshgrid(X0, X1)

#グラフに境界線とデータをプロット
plot_contours(ax, clf, xx, yy, cmap=plt.cm.coolwarm, alpha=0.8)
ax.scatter(X0, X1, c=y, cmap=plt.cm.coolwarm, s=20, edgecolors='k')
graf_setting(ax)

線形サポートベクターマシンの境界線は以下のようになりました。