Поддержать команду Зеркала
Беларусы на войне
  1. Пресс-служба Лукашенко заметила на совещании у политика топ-чиновника, который в это время был совсем в другом месте
  2. «Ни на террориста, ни на разжигателя Андрей похож не был». Федута — о политзаключенном, который был найден повешенным в колонии
  3. В Беларуси объявили внезапную масштабную проверку Вооруженных сил
  4. Езда на велосипеде опасна для мужского здоровья или это устаревший миф? Доля правды тут имеется — разбираемся (есть нюансы и для женщин)
  5. Экс-журналистка и сторонница Лукашенко, просившая донаты на еду, оказалась дочерью сотрудника КГБ. У него даже есть паспорт прикрытия
  6. Врача-невролога Руслана Бадамшина приговорили к 2,5 года лишения свободы — «Белые халаты»
  7. Крупный телеграм-канал и все его страницы в соцсетях признали «экстремистскими»
  8. Прилетел с «ссобойкой» и братался с минчанами на площади Победы. Как проходил единственный визит президента США в независимую Беларусь
  9. «Можно было понять, где едет кортеж». Протасевич рассказал о раскрытии «крупной сети радиошпионов»
  10. «Win-win». Спросили у аналитика, какие последствия будет иметь для Беларуси назначение экс-руководителя ГУР главой Офиса президента Украины
  11. Беларусам до 27 лет для получения паспорта потребуется справка из военкомата
  12. Путин открыто заявил, что соглашение по Украине невозможно без реструктуризации НАТО, которая фактически означает разрушение альянса — ISW
  13. Топ-чиновника, который, по словам Лукашенко, должен был «не на ногах ходить», а «на руках или голове», отправили в отставку
  14. На рынке недвижимости в Минске — перемены: нетипичная ситуация с однушками и квартирами большой площади


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.