ГРЧЦ заключил договор на доработку Автоматизированной системы мониторинга телерадиовещания РФ (АСМТРВ) «в части разработки программного модуля транскрибирования медиаконтента», пишет «Коммерсант» со ссылкой на сайт госзакупок. Сумма контракта — 41,7 млн руб. Дорабатывать АСМТРВ будет разработчик системы — компания «Стрим Лабс».
АСМТРВ с 2015 года мониторит все вещающие в России телеканалы и радиостанции с целью выявления нарушений законодательства. Система выявляет перерывы в вещании, фиксирует выходные данные телерадиоканалов, рекламные врезки, бегущую строку, отсутствие знаков информационной продукции. Кроме того, АСМТРВ хранит и предоставляет Роскомнадзору записи содержимого телерадиоканалов.
Преобразование телерадиоконтента в текст «существенно повысит эффективность дальнейшего автоматического анализа», считают в Роскомнадзоре.
По мнению управляющего партнера Коллегии медиаюристов Федора Кравченко, одним из последствий модернизации АСМТРВ может стать увеличение штрафов для эфирных СМИ «на порядок». Кроме того, доработка позволит органам власти, следящим за «политической благонадежностью СМИ», иметь дополнительный инструмент мониторинга острых тем, считает Кравченко.
Технология распознавания речи существует более 70 лет, но если раньше все сводилось к распознаванию простых слов, то сейчас точность даже в повседневной жизни вышла на новый уровень и постоянно совершенствуется благодаря машинному обучению, уточняет руководитель группы AI-разработки компании Voximplant Артем Бондарь. «Для качественной работы требуются большие объемы данных, десятки тысяч часов размеченных вручную диалогов, а также долгая и дорогая настройка модели машинного обучения»,— отметил он.