Источники «Ведомостей» сообщают, что планируется нанять около десяти таких специалистов. Предполагается, что тренеры будут заниматься обучением генеративной модели, создавая свои собственные эталонные примеры, оценивать качество переводов и подготавливать нейросеть к распознаванию и переводу текста с различных медиаформатов, включая изображения и видео.
Стоит отметить, что ранее, в начале 2023 года, «Яндекс» также проводил набор сотрудников под специальностью «AI-тренер» для обучения моделей YandexGPT. Тогда компания искала специалистов гуманитарного направления, которые могли бы работать с русскоязычными текстами, например, профессиональных редакторов, журналистов, филологов и педагогов. Как уточнил представитель компании, на этот раз речь идет о специалистах, которые смогут обучить нейросеть узким тематическим областям — от физики до юриспруденции, что позволит детализировать и углубить знания модели.
В мае 2023 года «Яндекс» представил свою собственную нейросеть YandexGPT, в которую был интегрирован виртуальный ассистент «Алиса». Летний релиз прошлого года был ознаменован важным шагом: нейросеть научилась запоминать контекст беседы и задавать уточняющие вопросы, после чего ее функции были добавлены в приложение для генерации изображений «Шедеврум». В сентябре была анонсирована обновленная версия YandexGPT-2, обладающая способностью давать быстрые ответы на запросы в «Поиске». Позднее пользователи получили доступ к функции кратких пересказов русскоязычных видеороликов длительностью до четырех часов. В марте 2024 года компания выпустила третье поколение нейросетей YandexGPT, включая модель для бизнеса, а в июне YandexGPT была интегрирована в переводчик.
В сфере машинного обучения важнейшими критериями являются чистота и качество данных. Многие компании, занимающиеся машинным переводом, регулярно нанимают специалистов с узкими специализациями для улучшения своих алгоритмов. Для обучения современных моделей необходимы два типа экспертов: во-первых, нейролингвисты, которые понимают, как работают нейросети, и помогают создавать современные алгоритмы машинного перевода. Во-вторых, это специалисты, владеющие несколькими языками, которые необходимы для создания пар между различными языками.
Ранее мы писали о том, что диффузионная нейронная сеть Yandex AI Rendering Technology (YandexART) научилась восстанавливать и повышать качество архивных видеозаписей и кинохроник.