Поддержать команду Зеркала
Беларусы на войне
  1. ГАИ тестирует новую камеру скрытого контроля. Водителям ее заметить очень сложно
  2. «Заставить пользоваться — унизительно». Беларусы ответили чиновникам, которые готовятся ввести ограничения по популярному товару
  3. Кремль заявил, что не будет публично комментировать итоги встречи Путина и Уиткоффа. Эксперты говорят — есть что скрывать
  4. «Всегда был похож на Лукашенко». Посмотрели, что пишут в соцсетях о конфликте Тихановского с Беспаловым
  5. «Беларусбанк» предупредил клиентов об уловке, которую используют мошенники
  6. Россиянка с мужем-военным «перевелась в Беларусь» и показала жилье «чуть дальше Ганцевичей». Новоселы — в шоке, комментаторы — нет
  7. «Это станет исторической ошибкой колоссальных масштабов». В ЕС установили новую «красную линию» для мирного соглашения с Россией
  8. «Ребята принесли свои извинения». Тихановский сообщил о видеоразговоре с советниками Светланы Тихановской
  9. Глава Администрации Лукашенко пожаловался на плохие продажи техники в России и назвал причины
  10. Даже «провластные» переживают из-за «уехавших». Появилось исследование о том, что беларусы думают о политике и войне в Украине
  11. Не лезть в грязное белье? Почему нормально обсуждать личную жизнь Тихановских — мнение
  12. Стало известно, каким будет курс доллара в начале декабря: прогноз по валютам
  13. Симптомы этого рака даже врачи часто принимают за обычную инфекцию, а пациенты — ждут, что «само пройдет». Но нет — рассказываем
  14. Ждать ли климатическую зиму в ближайшее время? Ответили синоптики
  15. В МВД призвали звонить в 102, если вам предложили установить в квартирах это устройство. Кто не послушается — может попасть под «уголовку»


/

Исследователи из Университета Карнеги-Меллон провели эксперимент, в котором создали виртуальную IT-компанию с сотрудниками-роботами. Даже лучший ИИ-работник смог выполнить только четверть поставленных задач, а остальные показали еще более плачевные результаты, пишет издание Futurism.

Изображение: Pexels
Робот. Снимок носит иллюстративный характер. Фото: Pexels.com

Исследователи создали виртуальную компанию под названием TheAgentCompany, где все позиции — от финансовых аналитиков и программистов до проектных менеджеров — занимали не люди, а ИИ-агенты от Google, OpenAI, Anthropic и Meta. Агент — это модель искусственного интеллекта, которая должна самостоятельно выполнять поставленные задачи, подобно человеку.

Виртуальным сотрудникам поручили обычные офисные задания: работать с файлами, совершать виртуальные экскурсии по новым офисным помещениям и писать отзывы на работу коллег.

Результаты оказались катастрофическими. Лучшей моделью стала Claude 3.5 Sonnet от компании Anthropic, но даже она смогла выполнить лишь 24% поставленных задач. При этом ее работа была крайне неэффективной — в среднем на каждую задачу уходило около 30 шагов и более шести долларов.

Gemini 2.0 Flash от Google тратил на каждую задачу около 40 шагов, но успешно завершал только 11,4% заданий. Худшим «сотрудником» оказался Nova Pro v1 от Amazon, который справился лишь с 1,7% поручений.

Исследователи отметили, что цифровым работникам не хватает здравого смысла, социальных навыков и понимания того, как работать в интернете. ИИ-сотрудники часто придумывали нелепые решения проблем — например, когда один робот не смог найти нужного человека в корпоративном чате, он просто переименовал другого пользователя.

Хотя современные ИИ-модели могут неплохо справляться с некоторыми простыми задачами, итоги этого и других исследований показывают, что они пока не готовы к более сложной работе, с которой легко справляются люди. Во многом это связано с тем, что нынешний «искусственный интеллект» — это, по сути, продвинутая версия предиктивного ввода текста в вашем телефоне, а не разумное существо, способное решать проблемы, учиться на опыте и применять его в новых ситуациях, отмечают авторы.