Added Multi-Agent Conf and Deepmind RL lectures links

This commit is contained in:
Igor Brylyov 2021-10-18 15:21:19 +03:00
parent d18eb5f376
commit 3c2adbbafd

View file

@ -24,6 +24,12 @@ title: 'Применение машинного обучения в робото
[Официальный Сайт](https://sites.google.com/robot-learning.org/corl2020/home) | [Youtube](https://www.youtube.com/c/ConferenceonRobotLearning)
### IEEE International Symposium on Multi-Robot and Multi-Agent Systems
[Site](https://mrs2021.org/)
Multi-robot multi-agent конференция
### Workshop on Closing the Reality Gap in Sim2Real Transfer for Robotics
Воркшоп по sim2real с научными публикациями. [Официальный сайт](https://sim2real.github.io/)
@ -300,3 +306,7 @@ Model-free делятся на
### Выбор алгоритма ОП
Нет универсальных алгоритмов, все имеют как преимущества, так и недостатки. Наиболее значимые критерии оценки - устойчивость, выборочная эффективность, время обучения, простота использования, надёжность. Алгоритмы градиента стратегии более устойчивы и надежны, чем алгоритмы функции ценности. С другой стороны, методы функции ценности обладают лучшей выборочной эффективностью, поскольку это методы с разделенной стратегией и потому могут использовать предшествующий опыт. В свою очередь, алгоритмы, основанные на модели, лучше алгоритмов Q-обучения с точки зрения выборочной эффективности, но гораздо дороже с вычислительной точки зрения и работают медленнее.
### Ссылки
[Курс лекций](https://deepmind.com/learning-resources/reinforcement-learning-series-2021) по Reinfocement Learning от Deepmind