元バイオ系

元バイオウェット系がデータサイエンスやらを勉強していくブログ。 基本自分用のまとめ。

2022-02-07から1日間の記事一覧

強化学習を理解したい #2

前回 hotoke-x.hatenablog.com の続きで、今回はモデルフリー手法の話です。 モデルベース手法では と が定義可能である前提でした。 モデルフリーの問題では直接これらを定義できない為に、蓄えたデータ(経験)から推定する必要があります。 また、経験を…