Яндекс и Google тестируют ИИ-агентов для управления смартфонамиЯндекс и Google тестируют ИИ-агентов для управления смартфонами

Яндекс и Google тестируют ИИ-агентов для управления смартфонами

14:24
Яндекс и Google начали тестирование ИИ-агентов для смартфонов на базе Android. Агенты способны выполнять многошаговые действия по голосовой команде, такие как отправка сообщений в мессенджерах, поиск информации на устройстве и установка приложений. Яндекс подтвердил тестирование технологии, а Google объявила о запуске функции на...
Текст новости загружается...
LLM-агенты демонстрируют нестабильность при одинаковых входных данныхLLM-агенты демонстрируют нестабильность при одинаковых входных данных

LLM-агенты демонстрируют нестабильность при одинаковых входных данных

13:05
🧪Исследование проверило, насколько стабильно ведут себя LLM-агенты при одинаковых входных данных: Llama 3.1 70B, GPT-4o и Claude Sonnet 4.5 тестировались на HotpotQA в 3000 прогонах. Даже при идентичных вводах агенты часто выбирали разные цепочки действий (2,0–4,2 траектории на 10 запусков, разброс шагов до 55 %). При ≤ 2 траект...
Текст новости загружается...
При загрузке возникла ошибка!