元バイオ系

元バイオウェット系がデータサイエンスやらを勉強していくブログ。 基本自分用のまとめ。

強化学習

強化学習を理解したい #2

前回 hotoke-x.hatenablog.com の続きで、今回はモデルフリー手法の話です。 モデルベース手法では と が定義可能である前提でした。 モデルフリーの問題では直接これらを定義できない為に、蓄えたデータ(経験)から推定する必要があります。 また、経験を…

強化学習を理解したい #1

仕事でDeep Learningを使う機会がちょいちょい出てきたので、tensorflowやPyTorchの練習も兼ねて強化学習を勉強中。 手法が色々あってよくわからなくなってきたので記事にまとめます。 全体を俯瞰することに努めます。 正確性よりわかりやすさを優先します。…