Доклад

MiVOLO: State-of-the-Art визуальный трансформер для распознавания пола и возраста по фотографии

  • На русском языке
Презентация pdf

Спикер расскажет о том, как его команда создавала новую трансформерную модель для распознавания одновременно пола и возраста, которая взяла первое место во всех основных бенчмарках. Даже в тех, чьи тренировочные данные никогда не видела.

Модель использует одновременно два входа: изображения лица и тела. Эффективно применяя механизмы перекрестного внимания, она не только умеет извлекать пользу от дополнительного входа, но и способна отрабатывать в случае подачи только одного из них.

Также Максим раскроет интересные дополнительные детали:

  • Кто более точен в задачах определения возраста и пола по фотографии: человек или машина? Какая вообще у людей тут точность, и у всех ли она одинакова?
  • Как получить разметку с возрастом, имея только обезличенные фотографии? Какая точность у модели, если лица не видны?

Приходите, чтобы узнать ответы на эти и другие вопросы.

Спикеры

Приглашенные эксперты

Расписание