Если у вас есть билет, авторизуйтесь для просмотра видео

ДокладДата: 19.09 / Начало: 00:00 – Конец: 00:00

Повышение точности субтитров в художественных фильмах: технологии и опыт

ML/AI

Сложность -

Презентация pdf Смотреть запись в VK Видео Смотреть запись на Youtube

Расскажу о создании системы автоматической генерации и улучшения качества субтитров для художественных фильмов. Начну с проблем, возникших при использовании стандартных моделей распознавания речи, и представлю наш комплексный подход к их решению.

Основное внимание уделю трем ключевым этапам обработки: препроцессингу аудио, оптимизации модели распознавания речи и постобработке текста. Подробно остановлюсь на методах повышения точности и синхронизации субтитров, включая voice activity detection, Whisper fine-tuning и alignment с использованием word-level timestamps.

Важной частью доклада станет обсуждение метрик оценки качества субтитров. Расскажу, какие показатели использовались для объективного измерения улучшений и как проводилась локализация проблемных участков на временной шкале. Затрону вопрос оптимизации производительности системы для обработки длительных фильмов.

Продемонстрирую конкретные результаты работы, включая не только количественные метрики, но и субъективное сравнение качества субтитров до и после улучшений на реальных примерах.

Будет интересно разработчикам, занимающимся обработкой аудио и видео, специалистам по машинному обучению, а также всем, кто интересуется применением AI-технологий в медиаиндустрии и повышением доступности видеоконтента.

Спикеры

Дмитрий Шатнёв
Инвентос

Приглашенные эксперты

Александр Шалимов
Инвентос

Другие доклады по теме «ML/AI»
- Смотреть запись
  Использование машинного зрения на производственных объектах
  Илья Смирнов
  ГК Юзтех
  Зал 1Сложность -
- Смотреть запись
  Мультимодальный ИИ, интеллектуальные агенты — будущее наступило, что дальше?
  Евгений Ильюшин
  Viasat Tech
  Зал 1Сложность -
- Смотреть запись
  Великолепная тройка: ML, бизнес-правила, редакция. Как строятся персональные витрины в KION
  Алексей Жиряков
  KION
  Зал 3Сложность -
- Смотреть запись
  Эволюция методов диффузионной генерации видео
  Константин Соболев
  AIRI
  Сложность -
- Смотреть запись
  Способы энкодинга видео для мультимодальных моделей
  Андрей Кузнецов
  AIRI
  Сложность -
- Смотреть запись
  Автоматическая вертикализация коротких видео
  Егор Домнин
  Иви
  Зал 1Сложность -
- Смотреть запись
  Машинное зрение на производстве и в промышленности. Реальные кейсы
  Петр Хвесюк
  Норд Клан
  Зал 2Сложность -
- Смотреть запись
  Первый нейросетевой стандарт сжатия изображений JPEG AI: принципы разработки, эффективность сжатия и перспективы внедрения
  Елена Альшина
  Huawei Technologies
  Сложность -
- Смотреть запись
  Как с помощью AI найти нужный кадр в тысячах видео
  Александр Соколов
  ГПМ Дата
  Зал 1Сложность -
- Смотреть запись
  Реидентификация силуэтов
  Руслан Ревель
  NtechLab
  Зал 1Сложность -
- Смотреть запись
  Шумоподавление для SaluteJazz. Делаем ваши беседы более приятными
  Яна Лысова
  SberDevices
  Зал 2Сложность -
- Смотреть запись
  Метрика качества голоса VK Звонков и как мы к ней пришли
  Иван Бескровный
  VK / ВКонтакте
- Смотреть запись
  Система технического зрения для новой автономной платформы
  Георгий Никандров
  Яндекс Беспилотные Технологии
  Зал 2Сложность -
- Смотреть запись
  Новые стандарты сжатия и устойчивость JPEG AI к состязательным атакам
  Дмитрий Ватолин
  МГУ
  Зал 2Сложность -

Расписание