2018-01-01から1年間の記事一覧

permutation importance 〜特徴量の重要度の測り方〜

概要 Random Forestや勾配ブースティングなどの決定木アルゴリズムのアンサンブル手法の強みは性能の高さの他に入力に用いた各特徴量の重要度を算出できることにあります。各特徴量の重要度の大きさを元に特徴量選択を見直し、モデルの性能の向上を図ること…

書評「データサイエンティスト養成読本 ビジネス活用編」

データサイエンティスト養成読本シリーズの新刊である「データサイエンティスト養成読本 ビジネス活用編」が今週発売されたので早速kindleで購入して読んだ。せっかくなので僭越ながら書評を認めてみたいと思う。 データサイエンティストに必要とされるスキ…

Google colablatoryの無料TPU上でtensorflowのKeras APIで実装したCNNを動かしてみる。

久しぶりにDeep Learningを使いたいと思い、兼ねてより気になっていたが今まで使うタイミングがなかったGoogle colabolatoryの無料TPU(※ ただし、12h以内)の上でCNNを動かしてみる。本記事執筆の時点ではTPU対応の深層学習フレームワークはtensorflowのみの…