На Android нейросеть Gemini сможет самостоятельно заказывать такси и еду

0

Обнаруженный в коде бета-версии Google App функционал указывает на скорый переход нейросетей от генерации текста к выполнению реальных физических действий в приложениях.

Эпоха, когда искусственный интеллект ограничивался написанием эссе или рисованием картинок, стремительно уходит в прошлое. Google готовится сделать следующий логический шаг в развитии своих технологий, превратив языковую модель Gemini из умного собеседника в активного помощника, способного брать на себя рутинные операции. Утечки из последней бета-версии приложения Google свидетельствуют о том, что компания тестирует функционал так называемого «агентного ИИ» (Agentic AI), который сможет самостоятельно управлять сторонними приложениями на смартфоне.

Информацию о новой возможности обнаружили профильные эксперты портала 9to5Google, проанализировав программный код версии Google App 17.4. В недрах обновления нашлись прямые отсылки к функции с рабочим названием «Выполнение задач с помощью Gemini» (Get tasks done with Gemini). Судя по найденным строкам кода, речь идет не просто о голосовых командах, а о полноценной автоматизации действий на экране. Нейросеть сможет буквально нажимать кнопки за пользователя, открывая нужные приложения и проходя весь путь от выбора услуги до подтверждения заказа.

На практике это обещает кардинально изменить пользовательский опыт владельцев Android-смартфонов, и в первую очередь — обладателей устройств Samsung Galaxy, учитывая глубокую интеграцию Gemini в экосистему южнокорейского гиганта. Сценарий использования выглядит следующим образом: вместо того чтобы самостоятельно искать иконку Uber, вводить адрес и выбирать тариф, пользователь просто говорит ассистенту: «Закажи такси до офиса». ИИ самостоятельно запускает приложение, строит маршрут и, вероятно, останавливается только на этапе финального подтверждения оплаты, ожидая одобрения владельца. Аналогичным образом система сможет работать с сервисами доставки еды, бронируя столик или заказывая любимое блюдо из тайского ресторана через Uber Eats.

Техническая реализация этой идеи опирается на концепцию «экранной автоматизации». Это означает, что Gemini учится «видеть» интерфейс приложений так же, как его видит человек, распознавая кнопки, поля ввода и меню. Такой подход позволяет ИИ взаимодействовать даже с теми сервисами, которые не имеют специальной прямой интеграции с Google Assistant, что теоретически делает список поддерживаемых программ безграничным. Однако на старте, вероятнее всего, компания ограничит функционал набором проверенных партнеров, чтобы отладить технологию.

Внедрение агентного ИИ поднимает серьезные вопросы безопасности и ответственности, которые Google, судя по всему, прекрасно осознает. В обнаруженном коде уже содержатся предупреждения для пользователей: «Вы несете ответственность за действия, совершенные от вашего имени, поэтому внимательно следите за процессом». Это критически важный нюанс. Если текстовая нейросеть «галлюцинирует» и выдает неверный факт, это может вызвать лишь смех или легкое раздражение. Если же агентный ИИ ошибется и закажет доставку пиццы не на тот адрес или выберет такси премиум-класса вместо эконома, это повлечет за собой прямые финансовые потери. Именно поэтому функция, скорее всего, сначала появится в разделе экспериментальных возможностей Google Labs и будет требовать от пользователя визуального контроля на каждом этапе выполнения задачи, с возможностью в любой момент перехватить управление.

Появление таких возможностей на мобильных устройствах — это естественная эволюция технологий, которую эксперты предсказывали с момента бума больших языковых моделей. Рынок движется от чат-ботов к моделям действий (Large Action Models). Для Google и Samsung, чье партнерство в области ИИ становится все более тесным, это шанс опередить конкурентов, предложив пользователям не просто «умный поиск», а реального цифрового секретаря. Пока неизвестно, когда именно функция станет доступна широкой публике, но само наличие готовых инструкций в бета-версии намекает на то, что релиз может состояться в ближайших обновлениях Android.

Для тех, кто хочет первым узнавать о скрытых функциях своих гаджетов и инсайдах из мира технологий, рекомендуем читать наш телеграм-канал Digital Report, где мы оперативно разбираем подобные утечки и анализируем их влияние на цифровую экономику.

Digital Report

Share.

About Author

Digital-Report.ru — информационно-аналитический портал, который отслеживает изменения цифровой экономики. Мы описываем все технологические тренды, делаем обзоры устройств и технологических событий, которые влияют на жизнь людей.

Leave A Reply