Как понять кошку или собаку: переводчик для животных работает?

0

Шестилетняя бордер-колли по кличке Годо смотрит в камеру так, будто что-то знает. На шее у нее ошейник Petpuls, и приложение на смартфоне честно сообщает хозяйке: собака сейчас злится, потому что проиграла в игре. Это не кадр из мультика «Вверх» про говорящего пса с электронным ошейником, а вполне настоящая сцена из новостей CES, которые гуляют по сети уже несколько лет. В 2026-м таких сцен стало на порядок больше, и часть из них уже не очень похожа на милую игрушку.

В мае этого года китайский стартап Meng Xiaoyi из Ханчжоу показал на It Expo ошейник, который, по словам разработчиков, переводит мяуканье и лай в человеческую речь с точностью около 95%. Цена — 799 юаней, примерно 118 долларов. К концу мая компания отчиталась о 10 000 предзаказов. Параллельно на Kickstarter собирает деньги PettiChat: 27 граммов, 1,2 секунды на перевод, 94,6% заявленной точности и обещание не просто слушать питомца, но и отвечать ему «на его языке». А где-то в Атлантике в это же время плавают кашалоты, чьи щелчки расшифровывает Project CETI, и дельфины, под которых Google DeepMind специально натренировал модель DolphinGemma.

Получается, что мечта доктора Дулиттла превратилась одновременно в большую науку, серьезный бизнес и потенциально очень удобный способ выманить деньги у владельцев домашних животных. Разобраться, где проходит граница между этими тремя категориями, в 2026-м стало почти отдельной профессией. Эта статья — попытка такой границы наметить.

Почему именно сейчас, а не в 1997-м

Идея переводчика с собачьего или кошачьего стара примерно как сам интернет. В 2002 году Takara Tomy выпустила Bowlingual — первый коммерческий гаджет, который классифицировал лай по шести «эмоциям». Производитель честно писал на коробке: «только для развлечения». Ветеринар Софи Йин в обзоре тогда отметила, что переводы «не очень надежны и часто бессмысленны». С тех пор индустрия двадцать лет колебалась между новогодним подарком и нишевой игрушкой.

Изменилось две вещи. Первая — большие языковые модели. ChatGPT научил весь мир, что нейросеть может находить тонкие закономерности там, где раньше требовался целый отдел лингвистов. Вторая — дешевая запись. Гидрофон, акустический ярлычок, дрон и смартфон стали стоить меньше, чем годовой бюджет лаборатории. В результате к 2024-2026 годам у исследователей собрались датасеты в десятки тысяч часов: щелчки кашалотов, мяуканье кошек, лай хаски в разном возрасте, свисты дельфинов Сарасоты, песни соловьев и взмахи щупалец каракатиц. И вот к этому добру можно наконец приложить методы, которые работают для человеческой речи.

Главное обещание звучит так: даже если мы не понимаем язык, мы можем найти в нем структуру. Лингвист Джонатан Берч из LSE формулирует жестче. Главное препятствие для перевода с любого животного языка — не алгоритм, а данные. Чтобы обучить большую модель уровня ChatGPT, нужен примерно триллион слов. Для китов, дельфинов и собак у нас этого нет. Но впервые в истории — сама задача собирания таких корпусов становится решаемой.

Большая наука: четыре проекта, за которыми реально стоит следить

Если упростить, мировой «переводчик с животного» собирают сразу несколько команд, и большая часть из них не имеет никакого отношения к умным ошейникам.

Project CETI (Cetacean Translation Initiative) занимается кашалотами в водах Доминики. В мае 2024 года команда из MIT CSAIL опубликовала в Nature Communications работу, в которой впервые описала «фонетический алфавит» кашалотов: 156 разных код (последовательностей щелчков), четыре базовых музыкальных параметра (ритм, темп, рубато и орнамент) и контекстная зависимость, очень похожая на ту, что есть в человеческой речи. В ноябре 2025-го та же команда показала, что у кашалотов есть нечто вроде «гласных» — устойчивых тембральных характеристик внутри щелчков. По состоянию на апрель 2026 года CETI идентифицировал минимум две таких «гласных», условно «а» и «и». Это пока не перевод, но это уже фонология, и впервые она построена не интуитивно, а на машинном обучении поверх 9000 размеченных записей.

Earth Species Project (ESP) — американская некоммерческая организация, которую основали Аза Раскин, Бритт Сельвителл и Кейт Закариан. В ноябре 2024 года ESP выпустила NatureLM-audio, первую большую языковую модель именно для звуков животных. Идея простая, как и у текстовых LLM: научить модель универсальным представлениям биоакустических сигналов, чтобы потом ее можно было дообучать под конкретные задачи. NatureLM умеет определять вид, пол, стадию жизни, тип крика и в некоторых случаях работает даже с видами, которых ни разу не видела на обучении. В 2026-м ESP получила 17 миллионов долларов грантов, в том числе от Paul G. Allen Family Foundation. Сейчас модель используют, например, в проекте FrogID для анализа записей австралийских лягушек, собранных волонтерами.

Google DolphinGemma — совместный проект DeepMind, Georgia Tech и Wild Dolphin Project. В апреле 2025 года Google анонсировал модель на основе открытого семейства Gemma: около 400 миллионов параметров, оптимизирована под смартфон Pixel 9, обучена на 40 годах записей атлантических пятнистых дельфинов на Багамах. DolphinGemma работает как генеративная модель: получает на вход последовательность звуков и предсказывает, что дельфин скажет дальше. Параллельно с ней работает система CHAT (Cetacean Hearing Augmentation Telemetry): на Pixel 9 запускается синтез «свистов», обозначающих конкретные предметы (шарф, водоросли, мячик), и если дельфин повторяет такой свист, исследователь видит сигнал и реагирует. Это не «перевод», а попытка построить общий мини-словарь, на котором обе стороны хотя бы понимают, о чем речь.

Coller Dolittle Challenge — пятилетний приз от фонда Jeremy Coller и Тель-Авивского университета: 10 миллионов долларов главному победителю, который продемонстрирует настоящую двустороннюю коммуникацию с животным, плюс ежегодные премии по 100 000 долларов командам, которые продвинули поле дальше всех. В мае 2025-го первую такую премию забрала Лаэла Сайих из Woods Hole Oceanographic Institution: ее группа десятилетиями записывает афалин в заливе Сарасота во Флориде и нашла первые серьезные свидетельства того, что «несигнатурные» свисты дельфинов могут работать как слова с общим, контекстно-зависимым значением. В шорт-лист тогда же вошли команды по соловьям, мартышкам-мармозеткам и каракатицам, которые «разговаривают» движениями щупалец. Финал 2026 года уже на подходе.

Отдельно от больших консорциумов сидят академические лаборатории. Команда Рады Михалча из Мичиганского университета в 2024 году показала, что модель Wav2Vec2, изначально обученная на человеческой речи, опознает пол, эмоцию и породу собаки по лаю с точностью около 62%. Лаборатория Кенни Чжу обработала примерно 50 часов записей собачьего лая и нашла повторяющиеся «слоги», соответствующие «кошке», «клетке» и «поводку»; интересно, что у хаски с возрастом «лексикон» словно усложняется. Это не финальная истина, но это первая порция данных, на которую вообще можно опереться.

Народные приложения и ошейники: что покупают прямо сейчас

Если вы вбили в поиск «переводчик с кошачьего» или «перевод лая», вы попадете не в Project CETI, а в App Store, RuStore и на Kickstarter. И вот здесь начинается тот самый зазор между маркетингом и наукой, о котором стоит говорить честно.

MeowTalk — самое известное массовое приложение для кошек. Разработала его компания Akvelon во главе с бывшим инженером Amazon Alexa Хавьером Санчесом. Сайт: meowtalk.app. Внутри — проприетарная модель, которая классифицирует мяу в 11 общих «интенций» (голод, ласка, недовольство, охота и так далее). Запущенный в конце 2020 года, MeowTalk собрал более 3 миллионов скачиваний и работает на iOS и Android, поддерживая в том числе русский и украинский интерфейсы. В лабораторных условиях разработчики заявляли около 90% точности на изученных профилях. На практике многое зависит от того, как долго владелец вручную размечает индивидуальные мяу своей кошки: модель адаптируется. Хорошая ли это «переводилка»? Скорее это калиброванный детектор настроений, чем словарь.

Petpuls — южнокорейский умный ошейник для собак, который CES 2021 представил как «первый эмоциональный переводчик для собак». Сайт: petpuls.net. По данным производителя, алгоритм обучен на 10 000 образцах лая от 50 пород, тестирование выполнял Сеульский национальный университет, заявленная точность по пяти эмоциям (счастье, расслабленность, тревожность, агрессия, грусть) — около 80%. Цена базовой версии стартовала с 99 долларов. Plus есть встроенный акселерометр и трекер активности.

Bowlingual — старая, но все еще живая линейка от Takara Tomy. Японская «школа» подхода: жесткие категории, простая логика, честная маркировка «for entertainment only».

PettiChat — на удивление амбициозная заявка из Гонконга, чья кампания на Kickstarter в апреле-мае 2026 года перепрыгнула 700% от цели. Ошейник весит 27 граммов, работает в обе стороны (переводит звуки питомца и обратно генерирует «звуки, которые животное инстинктивно узнает»), стоит 119 долларов в раннем доступе и 199 в розницу. Заявленная точность — 94,6%, время отклика — 1,2 секунды. Компания утверждает, что обучала модель PETTI («Animal Behavior World Model») на миллионе вокальных и поведенческих образцов и вдохновлялась исследованиями Google DeepMind. К этому стоит относиться так же, как к любым предзаказным цифрам на краудфандинге: верифицируемых внешних тестов пока нет.

Meng Xiaoyi — и, наконец, виновник майского хайпа. Стартап из Ханчжоу, основанный в январе 2026 года, заявил, что собрал миллионы «голосовых отпечатков» поведения животных и натренировал свой переводчик поверх большой языковой модели Qwen от Alibaba Cloud. Семенной раунд — один миллион долларов, 10 000 предзаказов за месяц, ноль научных публикаций, ноль независимых тестов. Китайские СМИ вежливо назвали продукт «тестом на человеческий интеллект»: проверяется в первую очередь интеллект покупателя.

Сравнение: кто что обещает и кому верить

Ниже — таблица, в которой попытался свести самое важное по проектам и продуктам, чтобы было видно, где наука, где консьюмерская электроника, а где маркетинговая поэзия. Цифры — такими, как их заявляют сами разработчики или независимые источники, с пометками, если методики разные.

Проект / продукт Тип Виды Заявленная точность / результат Цена Источник заявленных данных
Project CETI Научный консорциум Кашалоты 156 код в «алфавите», две «гласных» найдены к 2026 Грантовое финансирование Nature Communications, 2024; Nat Geo, 2025
Earth Species Project (NatureLM-audio) Научная НКО, open model Десятки видов Zero-shot работа на ранее невиданных видах; 17 млн $ грантов в 2026 Бесплатно для исследователей earthspecies.org, ESP press releases
Google DolphinGemma + CHAT Исследовательский продукт Атлантические пятнистые дельфины Генерация дельфино-подобных последовательностей; запущена в полевых условиях в 2025-26 Open model, лето 2025 blog.google/innovation-and-ai/products/dolphingemma
Coller Dolittle Prize Премия Любые Главный приз 10 млн $ за двустороннее общение jeremycollerfoundation.org
Wav2Vec2 для лая (Михалча) Академическое исследование Собаки 62% по полу, эмоции, породе arXiv, 2024
MeowTalk (Akvelon) Приложение Кошки 11 интенций, ~90% по лабораторному тесту 2021 Freemium, подписка meowtalk.app
Petpuls Ошейник + приложение Собаки 5 эмоций, ~80% точности (Seoul Nat’l Univ.) от 99 $ petpuls.net
Bowlingual (Takara Tomy) Гаджет Собаки 6 фиксированных эмоций, «для развлечения» ~25-30 $ Производитель
PettiChat Ошейник Собаки и кошки 94,6% заявлено, 1,2 сек отклик от 119 $ (Kickstarter) Kickstarter / yahoo finance, апрель 2026
Meng Xiaoyi Ошейник Собаки и кошки «около 95%», без независимой проверки ~118 $ Odditycentral, Dexerto, май 2026

Источник данных: блог Google, earthspecies.org, projectceti.org, jeremycollerfoundation.org, Nature Communications (2024), National Geographic (2025), eweek.com, Yahoo Finance (апрель 2026), Dexerto (май 2026), Odditycentral (май 2026), отзывы в App Store, материалы CES 2021. Методики измерения «точности» у научных моделей и у потребительских ошейников несопоставимы напрямую: NatureLM-audio оценивается по бенчмарку BEANS-Zero для биоакустики, Petpuls — по классификации эмоций в лаборатории, PettiChat и Meng Xiaoyi — заявления маркетинга без публичных тестов.

Как этим пользоваться, если хочется попробовать самому

Главный вопрос здравомыслящего владельца кошки или собаки звучит так: я положу на стол двадцать-двести долларов, что я получу в ответ. И вот тут полезно отделить три сценария.

Сценарий «развлекательный». Любое приложение со словом «translator» в названии в App Store или Google Play в 99% случаев — симулятор. Запись лая или мяу прогоняется через классификатор, и вам выдается смешная подпись в стиле «почтальон опять представляет угрозу — не благодари». В таких приложениях обычно есть честная отметка «for entertainment purposes only» в описании, и относиться к ним стоит как к снэпчат-фильтру: весело, но не диагноз. Сюда же относится большая часть бесплатных переводчиков из RuStore и Google Play.

Сценарий «трекер настроения». MeowTalk, Petpuls и им подобные занимают середину. Они не «переводят язык», но реально классифицируют тип звука и эмоциональный профиль с какой-то точностью. Это полезно, если у вас, например, тревожная кошка после переезда или собака с непонятным паттерном лая. Через несколько недель использования (и ручной разметки на старте) вы получите более-менее устойчивую модель именно вашего питомца. Это ближе к фитнес-трекеру, чем к Google Translate.

Сценарий «научный энтузиаст». Хотите чего-то по-настоящему интересного — идите на сайт Earth Species Project. Там есть демо NatureLM-audio без кода, в которое можно загрузить запись лесного звука и получить разбор: какой вид, сколько особей, что за тип крика. Project CETI публикует данные по кашалотам в открытом доступе. Wild Dolphin Project выкладывает фрагменты записей через nationalgeographic.org/society/our-programs/ceti. Это уже не «переводчик питомца», это участие в большом сюжете о коммуникации между видами.

Что делать с ошейниками-новинками типа PettiChat или Meng Xiaoyi — вопрос личной терпимости к риску. Краудфандинг — всегда лотерея, особенно с устройствами, у которых нет независимых тестов. Двухсотдолларовая ставка на красивое обещание — дело хозяйское. Но если вы рассчитываете не на любопытство, а на реальный инструмент для понимания своей собаки, разумнее подождать обзоров от ветеринаров и независимых тестов, которые обычно появляются через несколько месяцев после старта продаж.

Где здесь начинаются настоящие риски

Большая часть рисков в этой области — не технические, а психологические и этические. Хотя есть и юридические нюансы.

Антропоморфизм. Приложение, которое выдает фразу «я хочу есть» в ответ на мяу, склоняет владельца к буквальному пониманию. Кошка не строила это предложение в голове, она издала звук, который ее модель привыкла классифицировать как «запрос ресурса». Если интерпретировать перевод буквально, можно пропустить настоящие сигналы боли, страха или болезни, которые модель не видит в своей таксономии. Ветеринары стабильно повторяют: ни одно приложение пока не заменяет наблюдение за поведением и осмотр.

Подмена внимания. Технология может усиливать связь с животным, а может ее подменять. Если вы перестаете смотреть на собаку и начинаете смотреть только в экран с «переводом», вы рискуете построить виртуальные отношения с алгоритмом, а не с живым существом.

Маркетинговые проценты. Цифра «95% точности» без указания, на каком датасете, по каким классам и по сравнению с каким бейзлайном, не значит ничего. Petpuls показывает 80% на пяти классах эмоций в лаборатории Сеульского национального университета. PettiChat и Meng Xiaoyi показывают 94,6% и 95% соответственно в собственных пресс-релизах. Это не одно и то же. Аналогия: автомобиль может разогнаться «до 300 км/ч», но если это под уклон, без груза и с попутным ветром, цифра становится фигурой речи.

Этика двусторонней связи. Все по-настоящему серьезные исследовательские группы (CETI, ESP, Wild Dolphin Project) подчеркивают: цель — не научиться «разговаривать с кашалотом», а понять структуру его коммуникации. Активное вмешательство в общение диких животных через синтетические сигналы — отдельный этический вопрос, особенно если речь идет о популяциях, которые уже находятся под давлением рыболовства, шума судов и климата.

Юридический горизонт. В сентябре 2025 года ESP опубликовала результаты первого глобального опроса об отношении к ИИ и животной коммуникации. Один из выводов: если технологии позволят «услышать» животных, это станет дополнительным аргументом для расширения их юридических прав. То есть переводчик с собачьего — это не только гаджет за 118 долларов, это потенциально новый политический сюжет, который встроится в законодательство о благополучии животных в ближайшие 10-15 лет.

Что будет дальше

Если разложить происходящее по полочкам, картина выглядит примерно так. В научной части мы стоим у самого начала эпохи, в которой биоакустика впервые получает инструмент уровня современных LLM. Модели вроде NatureLM-audio и DolphinGemma делают для звуков животных то же самое, что трансформеры в свое время сделали для текста: переводят отрасль из «ручной разметки специалистами» в «массовый автоматический анализ». Это означает, что в ближайшие пять лет мы узнаем о коммуникации китов, дельфинов, ворон и слонов больше, чем за весь XX век. Звучит как обещание из пресс-релиза, но это редкий случай, когда такое обещание имеет под собой количественные основания: датасеты есть, вычисления дешевеют, методы переносятся.

В потребительской части все будет жестче. Рынок умных ошейников и приложений-переводчиков уже выглядит как рынок витаминов для собак или антивозрастной косметики: огромный спрос, низкий порог входа, заявления на грани, низкая регуляция. К 2027 году, по всем признакам, в каждом крупном маркетплейсе будет десяток «ИИ-ошейников», различающихся не наукой, а упаковкой. Хорошая новость: появятся независимые тестировщики, ветеринарные ассоциации и потребительские издания, которые наведут порядок. Плохая новость: пока этого не произошло, владельцу животного придется быть собственным фактчекером.

И где-то на пересечении этих двух миров живет самый интересный сценарий. Когда ESP, CETI или их аналоги действительно поймут хотя бы один «язык» — дельфиний, кашалотий, вороний, — часть найденных закономерностей неизбежно перетечет в массовые продукты. Не в форме «ваш кот сказал, что хочет тунца», а в виде гораздо более тонких инструментов: распознавание боли по вокализации, ранняя диагностика заболеваний, мониторинг стресса в зоопарках и приютах. Это и есть та часть истории, ради которой стоит следить за полем.

А пока — если ваша собака смотрит на вас многозначительно, по-прежнему самый точный переводчик находится у вас в голове. Просто не отвлекайтесь.

Digital Report
Share.

About Author

Digital-Report.ru — информационно-аналитический портал, который отслеживает изменения цифровой экономики. Мы описываем все технологические тренды, делаем обзоры устройств и технологических событий, которые влияют на жизнь людей.

Leave A Reply