Publications

Benjamin Ellis, Jonathan Cook, Skander Moalla, Mikayel Samvelyan, Mingfei Sun, Anuj Mahajan, Jakob Foerster, Shimon Whiteson (2024). Smacv2: An improved benchmark for cooperative multi-agent reinforcement learning. Advances in Neural Information Processing Systems.

PDF Cite Code Project

Michael Matthews, Michael Beukman, Benjamin Ellis, Mikayel Samvelyan, Matthew Jackson, Samuel Coward, Jakob Foerster (2024). Craftax: A Lightning-Fast Benchmark for Open-Ended Reinforcement Learning. arXiv preprint arXiv:2402.16801.

PDF Cite Code Project

Mingfei Sun, Benjamin Ellis, Anuj Mahajan, Sam Devlin, Katja Hofmann, Shimon Whiteson (2023). Trust-region-free policy optimization for stochastic policies. RLDM 2022.

PDF Cite

Alexander Rutherford, Benjamin Ellis, Matteo Gallici, Jonathan Cook, Andrei Lupu, Gardar Ingvarsson, Timon Willi, Akbir Khan, Christian Schroeder De Witt, Alexandra Souly, Saptarashmi Bandyopadhyay, Mikayel Samvelyan, Minqi Jiang, Robert Tjarko Lange, Shimon Whiteson, Bruno Lacerda, Nick Hawes, Tim Rocktaschel, Chris Lu, Jakob Nicolaus Foerster (2023). Jaxmarl: Multi-agent rl environments in jax. arXiv preprint arXiv:2311.10090.

PDF Cite Code Project

Anuj Mahajan, Mikayel Samvelyan, Tarun Gupta, Benjamin Ellis, Mingfei Sun, Tim Rocktäschel, Shimon Whiteson (2022). Generalization in cooperative multi-agent systems. arXiv preprint arXiv:2202.00104.

PDF Cite

Michael Schaarschmidt, Alexander Kuhnle, Benjamin Ellis, Kai Fricke, Felix Gessert, Eiko Yoneki (2018). Lift: Reinforcement learning in computer systems by learning from demonstrations. arXiv preprint arXiv:1808.07903.

Cite