元バイオ系

元バイオウェット系がデータサイエンスやらを勉強していくブログ。 基本自分用のまとめ。

Machine Learning

特徴量重要度を理解したい

特徴量重要度を理解したい記事です。 まさか、どういうものか理解せずに使ってないですよね? 特徴量重要度とは 平均不純度変少量(Mean Decrease Impurity; MDI) 平均正解率減少量(Mean Decrease Accuracy; MDA) 単一特徴量重要度(Single Feature Impor…

アンサンブル法を理解したい #1

まだまだ使う機会の多いアンサンブル法ですが、理論とアルゴリズムからちゃんと追いかけられている人ってどの程度いるのでしょうか? データサイエンティスト()にならないためにちゃんと理解してきたい記事です。 今回はバギングについてまとめます。 問題…