GitHub

Policy Gradient

Experiment with Policy Gradient methods (description), as well as variance reduction.

Current implementation:

$ conda env create -f [environment.yml | environment_cuda.yml]
$ conda activate [policy_grad | policy_grad_cuda]

$ python main.py --config_filename config_filename

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
src		src
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md
environment.yml		environment.yml
environment_cuda.yml		environment_cuda.yml
main.py		main.py
setup.py		setup.py