Оценка качества политики активации каналов, полученной с помощью обучения с подкреплением

Мобильные сети пятого поколения (5G A.) предусматривают использование многошаговой полудуплексной передачи в сети радиодоступа. В такой конфигурации для обеспечения абонентов требуемыми показателями качества необходимо особое внимание уделять задаче планирования передачи по каналам сети. Формулируя эту задачу с помощью Марковского процесса принятия решений со счетным множеством состояний, можно численно найти оптимальную политику управления с помощью методов обучения с подкреплением. Однако, возникает необходимость оценить погрешность решения, полученного с помощью численных алгоритмов. Для этого в данной работе проводится сравнение целевого показателя численно найденной оптимальной политики с результатами других известных политик.

Язык
Русский
Страницы
51-55
Статус
Опубликовано
Год
2024
Организации
  • 1 Российский университет дружбы народов им. Патриса Лумумбы
Ключевые слова
многошаговые беспроводные сети; активация каналов; планирование передачи; обучение с подкреплением; управляемая сеть массового обслуживания; полудуплекс; задержка
Цитировать
Поделиться

Другие записи