Обзор одной из самых перспективных архитектур нейронных сетей в контексте задач оптимизации и не только. Речь о тандеме трансформеров и обучения с подкреплением — технологии, которая обещает стать одной из ключевых вех этого столетия.
Если ваши нейросети ещё не глубокие и неподкреплённые, то эта заметка для вас ✌️
Глубокое Q-обучение (DQN)
Помогаю разобраться в авторской реализации Deep Q-learning для задачи коммивояжера (TSP)
А не пора ли нам подкрепиться?
Обучение с подкреплением – это одна из ключевых концепций ИИ. Пришло время подкрепить коммивояжера методом Q-обучения.
Внимание правильный ответ
Ранее я представил механизм внимания как черный ящик в рамках архитектуры Pointer Network. Теперь предлагаю узнать, что там внутри.
Внимание - это все, что нужно коммивояжеру
Первое относительно успешное решение задачи коммивояжера с помощью ИИ
Алгоритм Кристофидеса-Сердюкова
Описание лучшей апроксимации решения TSP
Простые эвристики для TSP
Реализация нескольких простых алгоритмов для решения задачи TSP и их сравнение
Когда ИИ может в оптимизацию...
Это первая заметка из серии про оптимизацию с использованием ИИ