前回 hotoke-x.hatenablog.com の続きで、今回はモデルフリー手法の話です。 モデルベース手法では と が定義可能である前提でした。 モデルフリーの問題では直接これらを定義できない為に、蓄えたデータ(経験)から推定する必要があります。 また、経験を…
仕事でDeep Learningを使う機会がちょいちょい出てきたので、tensorflowやPyTorchの練習も兼ねて強化学習を勉強中。 手法が色々あってよくわからなくなってきたので記事にまとめます。 全体を俯瞰することに努めます。 正確性よりわかりやすさを優先します。…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。