Pytorch-RL

这里包含了一些使用pytorch对一些标准强化学习的实践。

和一些著名的实践不同（比如openai-baseline)，我们的实践每个算法相对比较独立，而且只关注了最核心的方向，适合理解。

运行环境

运行需要进入到子目录中。

cd A2C
python run.py

cd A2C
python test.py

注意到，在pretrained.pth存储了我所训练的模型（并未充分训练，但是已经能取得一些好的效果），可以用来测试效果。

使用pretrained的模型进行测试

python test.py --model_path ./pretrained.pth

这是A2C的结果

Common中包含了常用的环境wrapper.

其他每个文件夹包含某一个特定的算法。其中可能会包含如下的代码：

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
A2C		A2C
DQN		DQN
common		common
.gitignore		.gitignore
README.md		README.md
__init__.py		__init__.py