Страницы, ссылающиеся на Proximal Policy Optimization
Материал из MachineLearning.
(Список ссылок)
> Proximal Policy OptimizationСледующие страницы ссылаются на Proximal Policy Optimization:
Просмотреть (предыдущие 50) (следующие 50) (20 | 50 | 100 | 250 | 500)- Методы обучения с подкреплением (← ссылки)
- Direct Preference Optimization (← ссылки)
- Group Relative Policy Optimization (← ссылки)
- RubricRL (← ссылки)

