«Зрячий» искусственный интеллект: эксперты ТГУ раскрыли секреты машинного зрения и научили нейросеть побеждать в сложных головоломках

ТОМСК — Эксперты Института дистанционного образования Томского государственного университета (ТГУ) показали, как заставить искусственный интеллект «видеть» мир глазами человека. В ходе открытого вебинара специалисты в прямом эфире продемонстрировали создание интеллектуального агента, который самостоятельно анализирует визуальную информацию, выстраивает стратегию и принимает решения в условиях неопределенности — не имея при этом доступа к исходному коду программ.

Полигоном для испытания стал не сложный промышленный софт, а культовая головоломка «2048». По словам разработчиков, за простыми правилами игры скрывается нетривиальный вызов для машинного разума.

Руководитель образовательной программы «Компьютерное зрение и искусственный интеллект» Артём Осинцев и модератор Вероника Диброва, эксперт программы «Искусственный интеллект и обработка искусственного языка», разобрали весь путь «оживления» бота-победителя. Чтобы нейросеть справилась с игрой, инженерам пришлось решить каскад задач:

«Слепое» зрение (Детекция): Программа должна была сама найти окно игры на скриншоте захламленного рабочего стола, словно человек, который ищет нужную иконку на экране.
Хитрость вместо классического OCR: Вместо того чтобы заставлять нейросеть считывать цифры (что ресурсоемко и часто ведет к ошибкам), разработчики научили бота распознавать уникальные цвета плиток, которые жестко закодированы в игре.
Машинная «интуиция» (Монте-Карло): Поскольку в игре есть элемент случайности (появление новых плиток), просчитать все ходы вперед невозможно. Бота оснастили алгоритмом поиска по дереву Монте-Карло, который оценивает вероятности и выбирает наиболее перспективный шаг.

Итогом стал автономный бот, который уверенно собирает плитку номиналом 2048, применяя логику, поразительно схожую с человеческой стратегией накопления крупных чисел в одном углу поля.

От виртуального поля к реальным производствам

На таком игровом примере Артём Осинцев, кандидат технических наук, продемонстрировал, как можно использовать технологии компьютерного зрения в игровой индустрии. После чего рассказал, что студенты новой магистратуры ТГУ с первого же семестра применяют их в реальном секторе. Обучение строится на решении актуальных задач от промышленных партнеров. Уже сейчас будущие специалисты работают над проектами в области:

автоматической дефектоскопии на производствах;
мониторинга транспортных потоков;
биологической идентификации животных в дикой природе;
анализа медицинских снимков для помощи врачам.

«Недостаточно просто писать код. Нужно учить машину видеть, анализировать визуальную информацию и принимать взвешенные решения в условиях неопределенности. Это фундаментальный навык, применимый далеко за пределами игровой индустрии», — подчеркивает Артём Осинцев, руководитель онлайн-магистратуры ТГУ «Компьютерное зрение и искусственный интеллект».

Запись вебинара с разбором алгоритмов доступна по ссылке