MENU

きーぴんぐくりえいてぃぶ・作曲とプログラミングの備忘録

python– category –

python

【AIプログラミング】XGBoostアルゴリズムを使うまで

初めてscikit-learn以外のアルゴリズムを使ってみるよ。なんだか楽しみだね。以前、勾配ブースティングマシンを勉強しました。勾配ブースティングマシンは「Kaggle」という機械学習のコンペなどでもよく利用されて、良い結果を出しているらしく、その中...

2020年5月23日
python

【AIプログラミング】Precision(適合率)とRecall(再現率)を勉強、より詳しくスコアを分析するツール

ConfusionMatrixを勉強したけど、ほんと混乱したよ。さらに、そこから「Precision(適合率)」と「Recall(再現率)」というものも勉強したよ。 PrecisionとRecallを見ることでより良いモデルが作れそうだね。 ConfusionMatrixを勉強しましたが、ConfusionMatr...

2020年5月22日
python

【AIプログラミング】ConfusionMatrixを勉強、分類問題の精度をより詳しく

ConfusionMatrixっていうもので、分類問題をもっと詳しく分析できるようになりそうだ。単純に正解率を出すだけじゃないってことだね。 ConfusionMatrixというものを勉強しました。今までは、scikit-learnの機械学習アルゴリズムに「score」という正解率を...

2020年5月21日
python

【AIプログラミング】勾配ブースティングマシンを勉強、乳がんデータを分類

勾配ブースティングマシンという名前がかっこいいやつを勉強しました。アルゴリズムは見た目じゃなくて中身だよ。決定木の流れで、ランダムフォレストと勉強してきましたが、今回は、最終進化のような、勾配ブースティングマシンというものを勉強しまし...

2020年5月20日
python

【AIプログラミング】ランダムフォレストで乳がんデータを分類、RandomForestClassifier

30次元のすべての特徴量でランダムフォレストしてみました。特徴量２つだけだと寂しかったからね。前回までのランダムフォレストでは、可視化のために特徴量を２次元に絞って行っていました。今回は、scikit-learnの乳がんデータですべての特徴量を利用...

2020年5月19日
python

【AIプログラミング】ランダムフォレストを学ぶ、scikit-learnで分類

ランダムフォレストを学んでいます。ランダムフォレストは、決定木の進化版みたいだね。決定木について、ある程度勉強してきたので、次は決定木の進化版のランダムフォレストについて勉強していきたいと思います。２００１年に考案されたまだ比較的新し...

2020年5月18日
python

【AIプログラミング】scikit-learnの決定木、max_leaf_nodesを調整

scikit-learnのパラメータ調整で、max_leaf_nodesは重要っぽい重要なパラメータが何かを知っておいたほうがいいね前回までの決定木のパラメータmax_depthは、重要でした。今回は、scikit-learnの決定木でチューニングできるたくさんのパラメータのうち、...

2020年5月17日
python

【AIプログラミング】plot_treeで決定木を視覚化

scikit-learnの決定木は、どんな条件に木構造がつくられたか、確認できるみたいだね。条件が確認できると、人間側としてもアルゴリズムが何をしているか、ブラックボックスにならなくていいね。前回は、決定木について概要を勉強し、どんなふうに分類さ...

2020年5月16日
python

【AIプログラミング】決定木で分類を行う、境界線の可視化

教師あり学習で使える、決定木というものを勉強しました。決定木は機械学習の中でも、比較的イメージしやすい動作をするね。決定木というものを勉強しました。決定木は機械学習の手法でも、比較的イメージしやすいらしく、また、最近の機械学習のコンペ...

2020年5月15日
python

【AIプログラミング】scikit-learnのPCAで次元削減、サポートベクターマシンで乳がんデータを分類

PCAには寄与率というものがあるらしい・・・寄与率を確認して特徴量を減らしていくことができるね。前回、PCAを試してみてどんな風に特徴量を抽出するのか、なんとなくのイメージが持てました。今回も、もう少しPCAについて勉強してみました。寄与率とい...

2020年5月14日
python

【AIプログラミング】乳がんデータの特徴量を変換、PCAで特徴量を削減

主成分分析という手法を勉強しているけど、仕組みが難しいよ。 scikit-learnだと、PCAという機能に入れるだけで簡単にできるみたい。データの標準化を学び、いい感じの結果が出たので、データを変換することを調べていました。そして、主成分分析（PCA）...

2020年5月13日
python

【AIプログラミング】データの標準化、StandardScalerで精度を上げる

データの前処理という重要な工程を勉強しました。何事にも準備は大切だよね。今まで、データの処理を行わずに機械学習の訓練を行っていました。機械学習の精度を向上させるためには、アルゴリズムのチューニングより、訓練するためのデータを整えること...

2020年5月12日

1...11 121314 15...18