РЖД открыла доступ к нейросети для расшифровки аудиозаписей

0

Компания «РЖД — Цифровые пассажирские решения» вывела в открытое тестирование собственный аналитический сервис «Автопротокол». Решение, изначально создававшееся для внутренних нужд и обученное на специфической терминологии железнодорожной отрасли, теперь доступно всем пользователям интернета. Платформа умеет переводить аудио- и видеозаписи встреч в структурированный текст, распознавать голоса разных спикеров, расставлять таймкоды и автоматически формировать краткую выжимку ключевых договоренностей по итогам многочасовых совещаний.

Для российского рынка корпоративного софта автоматизация рутины становится базовым требованием, однако универсальные языковые модели часто не справляются с профессиональным жаргоном. Разработчики попытались решить эту проблему, дообучив алгоритмы на сложной корпоративной лексике, специфических аббревиатурах и нестандартных сокращениях, характерных для транспортного сектора. При этом создатели утверждают, что сценарии применения системы не ограничиваются железной дорогой — инструмент вполне подходит для стандартных бизнес-задач любых команд, которым нужно быстро и точно фиксировать итоги рабочих звонков.

«“Автопротокол” — это рабочий инструмент, которым мы пользуемся сами и который продолжаем активно развивать. Поэтому запуск открытого тестирования на этапе MVP — осознанный шаг: нам важна живая, в том числе критическая, обратная связь, которая позволит быстрее улучшать продукт. Ключевое преимущество сервиса — ориентация на железнодорожную специфику, понимание отраслевой терминологии и контекста», — заявила генеральный директор РЖД — Цифровые пассажирские решения Евгения Чухнова.

Разработка собственного транскрибатора продиктована не только вопросами точности перевода голоса в текст, но и жесткими требованиями к информационной безопасности, которые сегодня предъявляются к корпоративному сектору. Использование массовых облачных сервисов для расшифровки закрытых совещаний несет прямые риски утечки конфиденциальных данных. Чтобы исключить этот фактор, архитектуру нового инструмента выстроили таким образом, чтобы весь процесс анализа медиафайлов происходил строго внутри защищенного контура компании. Как только нейросеть завершает генерацию документа, исходные записи автоматически удаляются с серверов. Готовый текстовый протокол отправляется исключительно на указанную пользователем электронную почту. Весь технологический стек базируется на отечественных решениях, что гарантирует соблюдение российского законодательства в сфере защиты цифровой информации.

Процесс создания инструмента стартовал в начале две тысячи двадцать пятого года на базе профильной ИИ-лаборатории предприятия. Архитектурно сервис опирается на открытые языковые модели, которые инженеры переработали под специфику корпоративного общения. Развитие продукта идет по методологии бережливого стартапа, когда приоритет отдается скорости проверки гипотез на реальных пользователях. До того как открыть доступ широкой аудитории, алгоритм прошел жесткую обкатку внутри компании. За восемь недель закрытой эксплуатации сотрудники прогнали через нейросеть почти шестьсот записей. Общая продолжительность загруженного тестового контента превысила двадцать один день непрерывного звучания, по итогам которого искусственный интеллект сформировал около четырехсот детализированных рабочих протоколов.

Появление подобных специализированных решений иллюстрирует важный сдвиг на рынке: крупные игроки все чаще отказываются от попыток адаптировать универсальные потребительские нейросети под свои процессы, предпочитая создавать кастомные модели с глубоким пониманием отраслевого контекста. В перспективе разработчики планируют серьезно расширить возможности платформы. Ожидается внедрение модуля шумоподавления для обработки некачественных записей, переход на улучшенную модель распознавания речи и полноформатная интеграция через API, которая позволит встраивать помощника в сторонние системы и запускать его через мини-приложения в мессенджерах.

В условиях, когда искусственный интеллект стремительно забирает на себя рутинные процессы, бизнесу необходимо оперативно отслеживать подобные инновации. Узнавать о новых инструментах для оптимизации рабочих задач и читать свежую аналитику технологического рынка можно, если подписаться на телеграм-канал Digital Report.

Digital Report
Share.

About Author

Digital-Report.ru — информационно-аналитический портал, который отслеживает изменения цифровой экономики. Мы описываем все технологические тренды, делаем обзоры устройств и технологических событий, которые влияют на жизнь людей.

Leave A Reply