Added Multi-Agent Conf and Deepmind RL lectures links
This commit is contained in:
parent
d18eb5f376
commit
3c2adbbafd
1 changed files with 10 additions and 0 deletions
|
@ -24,6 +24,12 @@ title: 'Применение машинного обучения в робото
|
|||
|
||||
[Официальный Сайт](https://sites.google.com/robot-learning.org/corl2020/home) | [Youtube](https://www.youtube.com/c/ConferenceonRobotLearning)
|
||||
|
||||
### IEEE International Symposium on Multi-Robot and Multi-Agent Systems
|
||||
|
||||
[Site](https://mrs2021.org/)
|
||||
|
||||
Multi-robot multi-agent конференция
|
||||
|
||||
### Workshop on Closing the Reality Gap in Sim2Real Transfer for Robotics
|
||||
|
||||
Воркшоп по sim2real с научными публикациями. [Официальный сайт](https://sim2real.github.io/)
|
||||
|
@ -300,3 +306,7 @@ Model-free делятся на
|
|||
### Выбор алгоритма ОП
|
||||
|
||||
Нет универсальных алгоритмов, все имеют как преимущества, так и недостатки. Наиболее значимые критерии оценки - устойчивость, выборочная эффективность, время обучения, простота использования, надёжность. Алгоритмы градиента стратегии более устойчивы и надежны, чем алгоритмы функции ценности. С другой стороны, методы функции ценности обладают лучшей выборочной эффективностью, поскольку это методы с разделенной стратегией и потому могут использовать предшествующий опыт. В свою очередь, алгоритмы, основанные на модели, лучше алгоритмов Q-обучения с точки зрения выборочной эффективности, но гораздо дороже с вычислительной точки зрения и работают медленнее.
|
||||
|
||||
### Ссылки
|
||||
|
||||
[Курс лекций](https://deepmind.com/learning-resources/reinforcement-learning-series-2021) по Reinfocement Learning от Deepmind
|
Loading…
Add table
Add a link
Reference in a new issue