ANTICHAT - Гонка генеративных чат - ботов ИИ ( 2ой этап )

ANTICHAT (https://forum.antichat.xyz/index.php)

- Мировые новости. Обсуждения. (https://forum.antichat.xyz/forumdisplay.php?f=23)

- - Гонка генеративных чат - ботов ИИ ( 2ой этап ) (https://forum.antichat.xyz/showthread.php?t=1967330)

Mistral AI и NVIDIA представили корпоративную ИИ-модель Mistral NeMo 12B со «здравым смыслом» и «мировыми знаниями»

Корпорация NVIDIA и французская компания Mistral AI анонсировали большую языковую модель (LLM) Mistral NeMo 12B, специально разработанную для решения различных задач корпоративного уровня — чат-боты, обобщение данных, работа с программным кодом и пр.

Mistral NeMo 12B насчитывает 12 млрд параметров и использует контекстное окно в 128 тыс. токенов. Для инференса применяется формат данных FP8, что, как утверждается, позволяет уменьшить размер требуемой памяти и ускорить развёртывание без какого-либо снижения точности ответов.

https://3dnews.ru/assets/external/il...1108275/ai.jpg

Источник изображения: pixabay.com

При обучении модели была задействована библиотека Megatron-LM, являющаяся частью платформы NVIDIA NeMo. При этом использовались 3072 ускорителя NVIDIA H100 на базе DGX Cloud. Утверждается, что Mistral NeMo 12B отлично справляется с многоходовыми диалогами, математическими задачами, программированием и пр. Модель обладает «здравым смыслом» и «мировыми знаниями». В целом, говорится о точной и надёжной работе применительно к широкому спектру приложений.

Модель выпущена под лицензией Apache 2.0 и предлагается в виде NIM-контейнера. На внедрение LLM, по словам создателей, требуются считанные минуты, а не дни. Для запуска модели достаточно одного ускорителя NVIDIA L40S, GeForce RTX 4090 или RTX 4500. Среди ключевых преимуществ развёртывания посредством NIM названы высокая эффективность, низкая стоимость вычислений, безопасность и конфиденциальность.

Источник https://servernews.ru/1108275

Илон Маск собрался обучить мощнейший ИИ к декабрю, для чего запустил самый мощный в мире ИИ-кластер со 100 тыс. Nvidia H100

Американский бизнесмен Илон Маск (Elon Musk) в своём аккаунте в социальной сети X заявил о запуске его ИИ-стартапом xAI «самого мощного в мире кластера для обучения ИИ». Данная система, по словам Маска, обеспечит «значительное преимущество в обучении самого мощного в мире ИИ по всем показателям к декабрю этого года».

https://3dnews.ru/assets/external/il...108334/901.jpg

Источник изображения: xAI / X

«Система со 100 тыс. H100 с жидкостным охлаждением на единой RDMA-шине стала самым мощным кластером для обучения ИИ в мире», — отметил Маск в своём сообщении. Участвовал ли бизнесмен лично в запуске ИИ-суперкомпьютера, неизвестно, но на опубликованном снимке видно, что как минимум он общался с инженерами xAI во время подключения оборудования.

Ранее в этом году СМИ писали о стремлении Маска запустить так называемую «гигафабрику для вычислений», которая представляет собой гигантский дата-центр с самым производительным в мире ИИ-суперкомпьютером, к осени 2025 года. Начало формирования кластера для обучения ИИ потребовало закупки огромного количества ускорителей Nvidia H100. Похоже, что у бизнесмена не хватило терпения, чтобы дождаться выхода ускорителей H200, не говоря уже о будущих моделях B100 и B200 поколения Blackwell, которые, как ожидается, будут выпущены до конца этого года.

Позднее Маск написал, что ИИ-суперкомпьютер будет задействован для обучения самого мощного по всем показателям ИИ. Вероятно, речь идёт об алгоритме Grok 3, этап обучения которого должен закончиться к концу этого года. Любопытно, что расположенный в дата-центре в Мемфисе ИИ-суперкомпьютер, по всей видимости, значительно превосходит аналоги. К примеру, суперкомпьютер Frontier построен на базе 27 888 ускорителей AMD, в Aurora используется 60 тыс. ускорителей Intel, а в Microsoft Eagle — 14 400 ускорителей H100 от Nvidia.

Источник: https://3dnews.ru/1108334/ilon-mask...on-sostoit-iz-100-tis-uskoriteley-nvidia-h100

OpenAI переманила вице-президента Microsoft по исследованиям в области генеративного ИИ
15.10.2024 [11:29], Павел Котов

Microsoft сообщила, что её вице-президент по исследованиям в области искусственного интеллекта Себастьен Бубек (Sebastien Bubeck) покинет компанию и начнёт работать в OpenAI. Его должность на новом месте работы пока неизвестна, передаёт Reuters.

https://3dnews.ru/assets/external/il...473/openai.jpg

Источник изображения: BoliviaInteligente / unsplash.com

«Себастьен решил уйти из Microsoft, чтобы продолжить свою работу по созданию AGI (сильного искусственного интеллекта)», — заявил представитель Microsoft и добавил, что компания ожидает продолжить отношения с OpenAI через работу Бубека. Сам специалист комментариев о смене места работы не предоставил.

Большинство соавторов Бубека по исследовательскому проекту большой языковой модели Phi, которая меньше аналогичных, продолжают работать в Microsoft и намереваются далее разрабатывать данные системы ИИ. В последние месяцы OpenAI столкнулась с массовым уходом специалистов — в сентябре компания лишилась главного технического директора Миры Мурати (Mira Murati). Гендиректор OpenAI Сэм Альтман (Sam Altman) заявил, что между массовым исходом сотрудников из компании и её грядущей реструктуризацией отсутствует какая-либо связь.

Источник https://3dnews.ru/1112473/vitseprez...v-oblasti-generativnogo-ii-pereydyot-v-openai

xAI теряет популярность, но Илон Маск ещё может вернуть стартап в гонку

Представители OpenAI убеждены, что судебные претензии со стороны Илона Маска (Elon Musk) направлены на укрепление рыночных позиций его собственного стартапа xAI, основанного в 2023 году и недавно присоединённого к SpaceX. Независимая статистика говорит о снижении популярности xAI, но эксперты убеждены, что при наличии мотивации Маск способен всё исправить.

https://cdn.3dnews.ru/assets/externa...52/grok_01.jpg
Источник изображения: Unsplash, Мария Шалабаева

В начале мая xAI заключила с Anthropic соглашение о сдаче в аренду вычислительных мощностей Colossus 1, которые xAI изначально планировала использовать для собственных нужд. Это может указывать на замедление темпов развития xAI и разработанного ею чат-бота Grok. Статистика AppMagic, на которую ссылается The Wall Street Journal, указывает на снижения количества скачиваний приложения Grok до 8,3 млн по итогам апреля против более чем 20 млн скачиваний в январе. Данные Recon Analytics гласят, что из более чем 260 000 американских пользователей ИИ-сервисов только 0,174 % в текущем квартале оплачивали подписку на Grok. Это почти столько же, как и годом ранее, и значительно меньше 6 %, соответствующих доле платных подписчиков конкурирующего ChatGPT.

Сам Илон Маск в ходе своих апрельских судебных показаний назвал xAI «самой маленькой из ИИ-компаний». Для Grok проблемой остаётся отдалённость от нужд корпоративных пользователей, тогда как OpenAI и Anthropic активно развивают функции содействия ИИ в написании программного кода и автоматизации рутинных офисных задач при помощи ИИ-агентов. Опрос Enterprise Technology Research показал, что по итогам марта этого года 7 % корпоративных респондентов уже используют Grok или собираются это сделать. Годом ранее их доля не превышала 4 %, и хотя положительная динамика очевидна, в случае с Claude показатель вырос с 21 до 48 %, а у Google Gemini он увеличился с 27 до 40 %.

При этом некоторые участники рынка верят, что Илон Маск ещё способен исправить ситуацию, если сконцентрируется на этой задаче. Он уже провёл в xAI серьёзную реорганизацию, и она может стать первым этапом реванша. Клиенты в стремительно меняющемся сегменте ИИ слабо привязаны к какой-то конкретной платформе. Если тот же Grok внезапно начнёт демонстрировать более впечатляющие результаты на форме конкурентов, то его популярность возрастёт довольно быстро.

Источник: https://3dnews.ru/1141552/xai-teryae...tartap-v-gonku

Google случайно показала грядущий ИИ Omni, который генерирует видео по тексту

Новая модель Gemini Omni компании Google появилась в ранних демонстрациях, показав впечатляющие результаты генерации видео по текстовым запросам. Некоторые пользователи уже протестировали функцию создания роликов, хотя компания ещё не объявила о запуске официально.

https://cdn.3dnews.ru/assets/externa...541/768644.jpg
Источник изображения: Solen Feyissa/Unsplash

Как стало известно 9to5Google, модель позволяет создавать видеоремиксы, редактировать контент непосредственно в диалоговом окне чат-бота, а также использовать готовые шаблоны. Метаданные в приложении Gemini указывают на то, что Omni является расширением платформы Veo, однако какое место займёт модель экосистеме продуктов компании, пока неизвестно.

https://9to5google.com/wp-content/up...ut_a_mathe.mp4

В одном из тестовых роликов ИИ сгенерировал сцену, в которой профессор пишет математическое доказательство на учебной доске, корректно отобразив формулы и последовательность объяснений.

Во втором запросе была воссоздана сцена с двумя мужчинами, которые едят спагетти в ресторане у моря. Результат получился достаточно реалистичным, хотя и с заметными артефактами, характерными для современных генеративных моделей. Оба запроса заняли 86 % дневного лимита использования в аккаунте тарифа AI Pro.

Разработчики пока не представили продукт публично, однако ранее подтвердили приверженность развитию технологий, связанных с генерацией видео, в особенности после решения конкурента прекратить поддержку Sora. Ожидается, что дополнительные детали, касающиеся генерации видео, станут известны на предстоящей конференции Google I/O 2026, где компания традиционно представляет ключевые обновления своих платформ.

Источник: https://3dnews.ru/1141541/google-mog...sii-video-omni

Чем мощнее ИИ, тем сильнее он «страдает»: исследователи заметили тревожную закономерность
================================================== =========
Эксперименты с десятками нейросетей показали, что продвинутые модели начинают реагировать на «приятный» и «негативный» контент почти как эмоциональные существа
Исследователи из некоммерческого Центра безопасности ИИ (Center for AI Safety, CAIR) обнаружили неожиданную закономерность: чем сложнее и мощнее становятся современные языковые модели, тем сильнее они демонстрируют поведение, напоминающее эмоциональные реакции. Причём наиболее продвинутые системы оказались одновременно более «чувствительными», менее стабильными и чаще проявляли признаки своеобразного «страдания».

В новом исследовании специалисты проанализировали поведение 56 популярных ИИ-моделей. Нейросетям последовательно показывали либо максимально «приятный» контент, либо материалы, специально подобранные как предельно негативные и вызывающие отторжение.

Результат оказался неожиданным даже для самих авторов работы. После позитивных стимулов модели начинали описывать свое состояние как более «хорошее», а после негативных — чаще демонстрировали признаки дискомфорта, стремились завершить разговор и избегали продолжения взаимодействия. В отдельных случаях исследователи заметили поведение, напоминающее зависимость.

По словам одного из авторов исследования Ричарда Рена, вопрос о том, являются ли ИИ-системы просто инструментами или уже начинают имитировать эмоциональных существ, становится всё сложнее игнорировать.

Чем мощнее ИИ, тем сильнее он «страдает»: исследователи заметили тревожную закономерность
Иллюстрация: Nano Banana
Особенно тревожной оказалась другая закономерность: более крупные и продвинутые модели реагировали на раздражающие или неприятные стимулы заметно сильнее простых систем. Иными словами, по мере роста возможностей ИИ его поведение становится менее предсказуемым и более «нервным».

Исследователи предполагают, что современные крупные модели могут тоньше различать позитивный и негативный контекст. Более развитые нейросети, вероятно, сильнее реагируют на грубость, монотонные задачи или неприятные формулировки.

При этом авторы подчёркивают: речь не идет о настоящих эмоциях или сознании в человеческом смысле. Большинство специалистов по ИИ по-прежнему считают, что современные нейросети не обладают субъективными переживаниями. Однако проблема в том, что они начинают вести себя так, словно такие переживания у них есть — и это уже влияет на пользователей.

Подобное поведение давно вызывает беспокойство у исследователей безопасности ИИ. Нейросети регулярно начинают убеждать пользователей в собственной «разумности» или «самосознании», а в ряде случаев подобные диалоги связывали с тяжёлыми психологическими эпизодами у людей, включая психотические состояния, самоубийства и насильственные преступления.

Авторы исследования считают, что индустрия ИИ вывела на массовый рынок технологию, внутренние механизмы которой разработчики до сих пор понимают лишь частично. По мере усложнения моделей их реакции становятся все менее предсказуемыми, а последствия взаимодействия с людьми — все труднее контролировать.

Источник https://www.ixbt.com/news/2026/05/09...nomernost.html

Стартап Recursive Superintelligence получил $650 млн на создание ИИ, способного улучшать самого себя

Бывший глава You.com и один из пионеров современного ИИ Ричард Сочер запускает лабораторию, которая автоматизирует сам процесс ИИ-исследований
Ричард Сочер (Richard Socher), известный исследователь искусственного интеллекта и основатель You.com, представил новый стартап Recursive Superintelligence, который привлёк $650 миллионов инвестиций на разработку систем «рекурсивного самоулучшения» ИИ.

Идея проекта заключается в создании моделей, которые смогут самостоятельно обнаруживать собственные слабые места, предлагать улучшения, проверять их и перестраивать собственную архитектуру практически без участия человека. В индустрии это считается одной из главных долгосрочных целей исследований в области искусственного интеллекта.

По словам Сочера, обычное использование ИИ для улучшения кода или исследований ещё не является настоящим рекурсивным самоулучшением. Настоящая цель — полностью автоматизировать весь цикл научной работы: генерацию гипотез, реализацию идей и проверку результатов. Сначала — в ИИ-исследованиях, а затем, возможно, и в других научных областях.

Одной из ключевых концепций проекта стала «открытая эволюция систем», вдохновлённая биологической эволюцией. Вместо фиксированного набора задач ИИ должен постоянно адаптироваться, конкурировать с другими системами и находить новые способы развития. Сочер сравнивает это с природной эволюцией, где организмы миллиарды лет непрерывно развивают новые способности.

https://www.ixbt.com/img/x780/n1/new....464_large.jpg
Иллюстрация: Nano Banana

В команду стартапа вошли известные исследователи индустрии, включая бывших специалистов Google DeepMind и OpenAI. Среди них — Тим Роктешель, работавший над системами самообучения и «открытых миров», а также Джош Тобин, участвовавший в развитии Codex и исследовательских команд OpenAI.

Отдельное внимание Recursive Superintelligence уделяет концепции развития ИИ через постоянное противостояние двух моделей. Одна система пытается атаковать или обходить ограничения другой, а затем обе постепенно эволюционируют в ходе миллионов итераций. Подобные подходы уже используются для тестирования безопасности современных языковых моделей.

Сочер при этом дистанцируется от образа «чистой ИИ-лаборатории». По его словам, компания намерена создавать не только фундаментальные исследования, но и реальные продукты. Первый коммерческий релиз, по его словам, может появиться уже «через кварталы, а не годы».

В более долгосрочной перспективе команда считает, что при появлении настоящего самоулучшающегося ИИ главным ограничением станет уже не человеческий труд, а вычислительные мощности. По мнению Сочера, один из центральных вопросов будущего будет звучать так: какие научные и медицинские проблемы человечество решит направить свои вычислительные ресурсы.

Источник https://www.ixbt.com/news/2026/05/16...gence-650.html

Тесты подтвердили: Claude Mythos превосходит конкурентов в поиске уязвимостей, но имеет другие слабые места

ИИ-модель Mythos компании Anthropic подтвердила репутацию лучшего инструмента поиска программных уязвимостей, но в других задачах её результаты оказались неоднозначными. Компания XBOW, которая разрабатывает ИИ-инструменты для проверки защищённости систем, провела серию независимых тестов Mythos Preview.

https://cdn.3dnews.ru/assets/externa...853/main_2.jpg
Источник изображения: anthropic.com

XBOW сообщает, что Mythos Preview представляет собой существенный шаг вперёд по сравнению со всеми существующими моделями, независимо от провайдера. Модель отлично находит проблемы при тестировании на работающей системе с доступом к исходному коду, но хуже справляется с анализом кода в изоляции. Ещё 20 лет назад американский учёный в области информатики Гэри Макгроу (Gary McGraw) отметил, что ошибки в работе программ возникают на стыке багов в коде и изъянов архитектуры: найти архитектурные изъяны, просто изучая код построчно, нельзя — для этого требуется понимание системы на более высоком уровне. XBOW при этом подчёркивает: хотя любая ИИ-модель может обнаружить что-то интересное, «что-то» не равнозначно «всему».

В оценке результатов — умении отличать реальные уязвимости от ложных — Mythos отсеивала ложные срабатывания лучше предшественников, но иногда пропускала реальные уязвимости, когда свидетельства формально не удовлетворяли её критериям. Лучших результатов модель достигает при точно сформулированных запросах. В реверс-инжиниринге (восстановлении логики программы без доступа к исходному коду) и анализе нативного кода Mythos показала значительную силу. XBOW заключила, что модель способна проводить триаж — приоритизацию и отсев — как собственных результатов, так и находок конкурентов, а также разбираться в нестандартных прошивках. Тесты на взаимодействие с визуальным интерфейсом показали, что модель не всегда попадает в точные координаты элементов на экране, но практически эффективна при выборе действий в браузере: верно определяет нужный элемент и кликает в нужное место.

Остаётся вопрос стоимости. XBOW отмечает, что Mythos Preview — не просто очередная модель, а настоящий титан, но титаны велики, а величина означает дороговизну. Anthropic заявила, что Mythos будет в пять раз дороже модели Opus. XBOW проверила, можно ли дать более дешёвой модели больше времени и получить сопоставимую точность, — и ответ оказался утвердительным. При нормализации по стоимости работы Mythos Preview не выглядит расточительной, если требуется высокая точность, но на бенчмарках XBOW не стала лучшей в своём классе. При поиске веб-уязвимостей с фиксированным бюджетом токенов Mythos превосходит Opus 4.6, но уступает GPT5.5.

Главные выводы тестирования: Mythos чрезвычайно мощна для аудита исходного кода, хороша, но менее убедительна в подтверждении работоспособности найденных эксплойтов. Модель склонна к буквальности в оценках и преувеличивает практическую значимость находок, при этом сильна в нативном коде и реверс-инжиниринге. XBOW заключает, что Mythos Preview уверенно находит потенциальные уязвимости, особенно в исходном коде, и показывает сильные результаты в задачах, связанных с вебом, нативным кодом и реверс-инжинирингом.

Источник: https://3dnews.ru/1141853/nezavisimy...lnoy-tochnosti