![]() |
ветка новостей про ИИ - электронные внедряемые устройства вынесена в отдельную тему https://nulled.in/threads/ii-ehlektronnye-ustrojstva.313550/#post-3002156
--------------------------------редакция шапки 03.12.23---------------------------------------- ================================================== ======================= Google Pixel 8 смогут силами ИИ менять лица людей на фото, убирать размытость, двигать объекты и не только Компания Google сегодня представила новые функции на базе искусственного интеллекта Magic Editor и Best Take, призванные расширить возможности редактирования фотографий на новых смартфонах серии Pixel 8. Также появится функция Zoom Enhance для улучшения масштабирования фото и другие новые ИИ-функции. https://3dnews.ru/assets/external/il...pixel_8_01.jpg Источник изображений: Google С помощью Magic Editor пользователи могут перемещать объекты на фото, изменять их размер, удалять ненужные элементы или, например, заменить пасмурное небо солнечным. Функция также позволяет менять фоны на фотографиях при помощи несколько заранее заготовленных пресетов. Magic Editor будет самостоятельно предлагать контекстуальные изменения на фото с учётом освещения и фона при которых были сделаны снимки. Функция подготовит несколько вариантов отредактированных фотографий, предложив выбрать нужный. Впервые Magic Editor была анонсирована на конференции Google I/O в мае. https://3dnews.ru/assets/external/il...016d87c1b3.gif Magic Editor Компания Google отмечает, что Magic Editor находится «на ранней стадии разработки», поэтому полученные результаты редактирования фотографий могут не всегда удовлетворять потребности пользователя. Функция Best Take в свою очередь комбинирует множество групповых фотографий, позволяя создавать наиболее удачный снимок, на котором люди не моргают или не смотрят в камеру. Функция позволяет заменить лица людей на снимке их же лицами с других, более удачных фотографий. https://3dnews.ru/assets/external/il.../Best-take.gif Best Take Best Take может работать как в автоматическом, так и ручном режиме. Во втором случае позволяется самостоятельно подбирать нужные эмоции на лицах тех или иных людей на фото, а затем объединять все результаты на конечном снимке. Функции Both Best Take и Magic Editor станут доступны на смартфонах серии Pixel 8 с 12 октября. Вероятно, в будущем эти функции появятся и на других смартфонах на базе Android. Новые смартфоны Pixel 8 также предложат такие функции редактирования, как Magic Eraser и Photo Unblur. Первая позволяет удалять со снимка нежелательные детали и объекты. Вторая предназначена для исправления размытости изображений. В Google отмечают, что смартфон Pixel 8 Pro получит продвинутую версию Magic Eraser, которая позволит удалять с фото более крупные объекты. https://3dnews.ru/assets/external/il...ance-Pixel.gif Zoom Enchance Позже в этом году у смартфонов Pixel 8 Pro также появится функция Zoom Enhance, которая посредством генеративного ИИ улучшает качество фотографий и снижает расстояние между пикселями при фотографировании с увеличением, чтобы на фото присутствовало меньше шума. Источник: https://3dnews.ru/1094014/google-pr...ic-editor-i-best-take-dlya-smartfonov-pixel-8 |
В Android 14 появился ИИ-генератор обоев
Сегодня состоялась презентация смартфонов Pixel 8 и Pixel 8 Pro, а также других аппаратных и программных новинок компании Google. Вместе с этим состоялся релиз мобильной операционной системы Android 14, которая имеет немало новых функций, включая генератор обоев на базе нейросети. https://3dnews.ru/assets/external/il...094013/205.jpg Источник изображения: Google Впервые эта функция была анонсирована в рамках мероприятия Google I/O в мае этого года. Взаимодействие с генератором обоев начинается с выбора категории, например, классического искусства, после чего нужно задать требуемые параметры и алгоритм представит несколько вариантов изображений на их основе. В одном из примеров Google выбирается категория Dreamscape, после чего отмечаются варианты структуры, материала и цвета. В конечном итоге формируется запрос «Дом из растений цвета индиго», после обработки которого алгоритм выдаёт несколько изображений покрытых растениями построек с входной дверью и фиолетовым оттенком. Первыми функцию генерации обоев смогут испытать в деле обладатели смартфонов Pixel 8 и Pixel 8 Pro. Когда она может появиться на других смартфонах с Android 14, не уточняется. Однако формулировка Google предполагает, что в конечном счёте это всё же произойдёт. ИИ-генератор обоев — это лишь одна из многих новых функций Android 14. Программная платформа предоставит широкие возможности в плане настройки пользовательского интерфейса, включая экран блокировки, возможность выбора разных шрифтов и цветов, ситуативные виджеты и др. Хотя Android в целом опережает iOS в плане возможностей визуальной настройки, пользователям не всегда легко привести интерфейс к желаемому виду. С выходом Android 14 сделать это будет проще. Источник: https://3dnews.ru/1094013/v-android-14-poyavilsya-iigenerator-oboev |
Google Pixel Fold принёс субтитры в реальное общение с новым режимом двухэкранного переводчика
Периодически разработчики создают новые функции программного обеспечения, которые делают тот или иной аппаратный формфактор значительно более полезным. Одной из таких функций может стать режим двухэкранного переводчика, который в скором времени станет доступен владельцам складных смартфонов Google Pixel Fold. https://3dnews.ru/assets/external/il...094011/204.jpg Источник изображения: Google Полностью раскрыв смартфон, пользователь может говорить с кем-то, кто говорит на другом языке, при этом переводы фраз каждого из собеседников будут отображаться по обе стороны. Таким образом, собеседник будет видеть, что вы говорите на его языке, и наоборот. Такие вот синхронные субтитры в реальной жизни. В настоящее время система доступна на 45 языках. Напомним, выпущенный в середине того года смартфон Pixel Fold является первым устройством Google с гибким дисплеем. Аппарат оснащён 7,6-дюймовым основным дисплеем и 5,8-дюймовым внешним экраном. Его аппаратной основой стал фирменный микропроцессор Google Tensor 2, аналогичный тому, что использовался в Pixel 7 и Pixel 7 Pro. В конструкции задействован прочный шарнирный механизм, способный выдержать 200 тыс. складываний. Что касается цены, то приобрести Pixel Fold можно за $1800. Источник: https://3dnews.ru/1094011/regim-dvu...e-pixel-fold-perenosit-subtitri-v-realniy-mir |
ИИ-генератор изображений DALL-E 3 появился в Bing, но опробовать его трудно из-за ажиотажа
Всем пользователям служб Bing Chat и Bing Image Creator стала доступна новейшая модель искусственного интеллекта — генератор изображений OpenAI DALL-E 3. На прошлой неделе система была развёрнута для пользователей Bing Enterprise, затем к ним присоединились пользователи Bing Image Creator, а теперь она открыта для всех. https://3dnews.ru/assets/external/il...9/dall-e-3.jpg Источник изображения: blogs.bing.com Таким образом, поисковая машина Bing получила доступ к DALL-E 3 даже раньше, чем OpenAI ChatGPT — это должно случиться до конца месяца, но только для пользователей, оформивших платную подписку. Система лучше понимает команды, а также генерирует более креативные и фотореалистичные изображения. Кроме того, она спроектирована так, чтобы её было проще использовать: DALL-E 3 интегрировали в Bing Chat и ChatGPT, а не стали делать отдельным продуктом. Пользователи могут постепенно совершенствовать изображение с чат-ботом, а не бесконечно упражняться в составлении запросов. К сожалению, на текущий момент пользоваться DALL-E 3 через Bing довольно затруднительно: генератор изображений вызвал большой ажиотаж, и сейчас его серверы перегружены, а служба сообщает о «невозможности обрабатывать новые запросы». Это подтвердил и сотрудник Microsoft Михаил Парахин: «Мы ожидали большого интереса, но не ожидали, что он будет настолько большим». Одной из ключевых особенностей генератора изображений в новом интерфейсе является его способность не только создавать картинки, но и предлагать варианты дальнейших действий. К примеру, в диалоге появляются шаблоны вроде «Можешь добавить радугу на заднем плане?», «Сделай его кошкой вместо собаки» или «Добавь птиц вокруг водопада». Источник: https://3dnews.ru/1093999/generator...-v-bing-no-oprobovat-ego-trudno-izza-agiotaga |
ИИ-генератор стикеров заработал в Instagram и Facebook, и пользователи тут же заставили его создавать непристойности
В Instagram✴ и Facebook✴ Messenger появилась возможность генерировать стикеры по текстовым запросам с помощью ИИ. Некоторые пользователи, получившие доступ к новому инструменту компании Meta, уже начали экспериментировать с ним, в результате чего появилось множество забавных, но сомнительных творений. https://3dnews.ru/assets/external/il...uigi-rifle.jpg Источник изображения: twitter.com/Pioldes Пользователь соцсети X под ником Pioldes, у которого ИИ-генератор стикеров появился в приложении Facebook Messenger, попытался совместить несовместимое, и его творения оказались подчас непристойными: это вооружённый сантехник Луиджи, брат того самого Марио; дети-солдаты; Микки Маус в уборной; крайне сомнительные воплощения канадского премьер-министра Джастина Трюдо (Justin Trudeau), Карла Маркса и ёжика Соника; и даже женщина, которая кормит грудью покемона Пикачу. Meta представила работающий на основе алгоритмов ИИ генератор стикеров на прошлой неделе. Изображения создаются большой языковой моделью Llama 2 — она, как заявил разработчик, позволяет выдавать десятки качественных стикеров за считанные секунды. Инструмент будет доступен в личных сообщениях и в разделе Stories в Facebook и Instagram, а также в Facebook Messenger и WhatsApp. Пока пользоваться им может лишь ограниченная англоязычная аудитория. В компании не уточнили круг пользователей, которые получили доступ к генератору стикеров. Но уже удалось установить, что некоторые слова в описаниях заблокированы: при попытке их ввести в поле описания стикеров выводится предупреждение, что данная лексика нарушает правила сообщества Meta. Выяснилось также, что генерировать неприемлемый контент можно, используя запрещённые слова с опечатками или подменяя их описаниями. Такого рода сбои характерны при запуске ИИ-инструментов, поэтому в Meta, видимо, и решили на начальном этапе ограничить доступ к генератору стикеров. Отладив его на этих ошибках, компания сможет выпустить общедоступную версию. Источник: https://3dnews.ru/1093996/ushlie-po...igenerator-stikerov-ot-meta-na-nepristoynosti |
Браузер Arc обзавёлся функциями ИИ, но не такими, как у всех и только на 30 дней
Компания под названием The Browser Company, ответственная за разработку браузера Arc, рассказала о внедрении в него функций искусственного интеллекта. Разработчики принципиально отказались делать это по образцу других проектов, в которых ограничиваются преимущественно кнопкой ChatGPT на боковой панели или чем-то аналогичным. https://3dnews.ru/assets/external/il...3993/arc_1.jpg Источник изображений: The Browser Company В The Browser Company решили придерживаться иного подхода с учётом того, что ресурсов на разработку собственной большой языковой модели у них нет. Поэтому разработчики начали экспериментировать, создавая один прототип за другим, пока их не оказалось более двух десятков. После этого были отобраны пять ключевых функций, получивших общее название Arc Max — работают они на платформах GPT-3.5 и Anthropic. Ниже приводится список этих функций. «Спроси ChatGPT» (Tidy Tab Titles). Пожалуй, наиболее очевидная и наименее интересная функция, которая предусматривает возможность задать ChatGPT вопрос прямо из командной строки Arc. «Аккуратные заголовки вкладок» (Tidy Tab Titles). Когда пользователь закрепляет вкладку в Arc, браузер автоматически её переименовывает, основываясь на содержимом, чтобы вкладку было проще найти на боковой панели. «Аккуратные загрузки» (Tidy Downloads). Аналогичная функция, только для загрузок. Вместо вывода зачастую бессмысленных имён файлов браузер переименовывает их таким образом, чтобы они соответствовали содержимому. «Пятисекундный предварительный просмотр» (Five-Second Previews). Функция позволяет навести указатель мыши на ссылку и нажать клавишу Shift, чтобы получить краткое описание содержимого страницы по этой ссылке. «Спроси о странице» (Ask on Page). Если пользователю не удаётся найти на странице интересующее его содержимое по полному совпадению, можно задать ИИ вопрос, ограничившись контекстом только этой страницы. https://3dnews.ru/assets/external/il...3993/arc_2.jpg The Browser Company рассказала и о других прототипах, которые впоследствии были отвергнуты. Один из прототипов, например, представлял собой браузер, работающий только на ИИ: при запросе «Поездка в Италию на поезде» он составлял полный план поездки, включая советы путешественникам, ссылки на достопримечательности, задавал дополнительные вопросы и решал множество прочих задач. Но функция оказалась менее полезной, когда речь не шла о путешествиях. Не сработала и идея с кнопкой «Спросить», которая возникала в нижней части каждой открытой страницы — нечто подобное есть и в других браузерах, да и функция, как выяснилось, быстро утомляет. Была отвергнута идея с упорядочиванием заметок, а также автоматическим составлением списков покупок на основе открытых вкладок — это любопытно, но едва ли функции оказались бы популярными. Крайне перспективной казалось развитие кнопки «Вперёд», по нажатии на которую ИИ рекомендовал бы новые страницы на основе истории просмотра. Проблема оказалась в принципиально неверном подходе: данная функция увеличила бы время пребывания пользователя в интернете, а задача разработчиков браузера, напротив, в том, чтобы его сократить. Наконец, пришлось отказаться и от упорядочивания вкладок при помощи ИИ — функция действительно полезная, но работала она слишком медленно. Выбранные разработчиками пять функций Arc Max будут присутствовать в браузере только ближайшие 30 дней, а его пользователям предложено проголосовать за то, какие из них оставить. В The Browser Company отметили, что выбор в пользу той или иной из них является вопросом конфиденциальности, поскольку их работа предполагает отправку тех или иных данных разработчикам моделей ИИ. Единого мнения об их дальнейшей судьбе нет даже у сотрудников самой компании. Источник: https://3dnews.ru/1093993/v-brauzere-arc-poyavilis-nestandartnie-funktsii-ii-no-tolko-na-30-dney |
Google объявила интеграцию «Ассистента» и ИИ-бота Bard — голосовой помощник выйдет на новый уровень
В рамках сегодняшнего мероприятия Made by Google были объявлены планы по интеграции ИИ-чат-бота Bard в состав голосового помощника Google Ассистент». По словам компании, сочетание «генеративного мышления» чат-бота Bard с «персонализированной помощью» «Ассистента» позволит давать более контекстно-ориентированные ответы на запросы пользователей. Усовершенствованного цифрового помощника собираются выпустить в течение ближайших месяцев. https://3dnews.ru/assets/external/il...ab6d0-62c8.jpg Источник изображений: Google «Хотя голосовой помощник "Google Ассистент" отлично справляется с быстрыми задачами, такими как установка таймеров, показ прогноза погоды, а также с быстрыми звонками, мы всегда считали, что личный цифровой помощник с продвинутыми возможностями должен уметь делать гораздо больше. Однако технологий, которые позволили бы это реализовать, до этого не существовало», — заявила в рамках своего доклада на мероприятии Made by Google вице-президент отдела разработки голосового помощника «Ассистент» и чат-бота Bard Сисси Сяо (Sissie Hsiao). https://3dnews.ru/assets/external/il...31b359e47e.jpg Аналогично недавно обновлённому голосовому помощнику Alexa от компании Amazon новый голосовой помощник Google с чат-ботом Bard сможет давать более персонализированные ответы на запросы пользователей. Например, он сможет помогать в планировании поездок, с поиском и сортировкой электронной почты, созданием списка покупок, а также с отправкой сообщений. Взаимодействовать с ним можно будет посредством текста, голосовых команд или изображений, при этом более непринуждённо и с учётом более контекстуально-насыщенных запросов по сравнению с актуальной версией «Google Ассистента». В рамках анонса обновлённого Google Assistant с чат-ботом Bard представитель компании в качестве примера описала следующую ситуацию: «Представьте, что вы компанией отправились на прогулку с собакой и дошли до развилки на дороге. Сделайте фотографию указателя рядом с развилкой и спросите голосового помощника: какой путь ты порекомендуешь группе людей с маленькой собакой? Помощник, сможет предложить, например, северное направление на развилке, посчитав его наиболее оптимальным в такой ситуации». Google отмечает, что новая функция находится на ранней стадии разработки и скоро будет предоставлена для закрытого тестирования. Первыми обновлённый ассистент получат владельцы смартфонов Pixel 8 и Pixel 8 Pro. В перспективе она появится на всех Android-устройствах, а также на iOS. Источник https://3dnews.ru/1094017/google-in...rd-v-tsifrovogo-pomoshchnika-google-assistant |
«Яндекс Браузер» научился кратко пересказывать видео
Теперь можно быстро узнать содержание и сразу перемотать на нужный фрагмент Пользователи «Яндекс Браузера» и «Яндекс Поиска» теперь смогут прочитать пересказы русскоязычных видео. По мнению разработчиков, новая функция позволит пользователям быстро ознакомиться с содержанием ролика, а авторам контента привлечь больше зрителей. Используя таймкод в пересказе видео, можно сразу перейти к интересующему фрагменту. Например, в обзоре нового смартфона сразу перемотать на характеристики камеры. Кроме того, функция пригодится, если нужно быстро узнать содержание длинного видео. https://www.ixbt.com/img/n1/news/202...skaz_large.jpg Пересказ видео работает на базе нейросети YandexGPT, она обобщает русскоязычные ролики длиной от двух минут до четырёх часов и пересказывает те фрагменты, где есть речь. Сначала алгоритм превращает аудиодорожку в текст с помощью распознавания речи, а затем разбивает его на смысловые фрагменты, обобщает каждый из них и указывает таймкод начала каждого блока. Краткий пересказ также доступен в «Поиске» Яндекса в любом браузере. Сейчас функция работает для популярных роликов — например, для рецептов приготовления блюд, хендмейда, видео с решением школьных заданий или записей телепередач. Кроме того, можно получить текстовую выжимку из YouTube-роликов, загрузив ссылку на клип на сервис 300.ya.ru. Чтобы получить пересказ ролика, нужно открыть видео и нажать на кнопку «Краткий пересказ». Источник https://www.ixbt.com/news/2023/10/06/jandeks-brauzer-nauchilsja-kratko-pereskazyvat-video.html |
В Германии изобрели миниатюрный спектрограф с ИИ, который может определять состав текстиля
Исследователи из Института фотонных микросистем Фраунгофера разработали миниатюрный спектрограф, способный анализировать текстильные ткани и определять их состав. https://3dnews.ru/assets/external/il...fraunhofer.jpg Источник изображения: fraunhofer.de Сканер работает в ближнем инфракрасном диапазоне и анализирует свет, который отражается от волокон ткани — устройство раскладывает его на диапазоны в длинах волн от 950 до 1900 нм, конвертирует результат в электрические сигналы, которые затем при помощи алгоритмов искусственного интеллекта обрабатывает анализатор. Сравнивая результаты с подготовленной базой данных, ИИ-платформа быстро выдаёт ответ, из каких материалов состоит изучаемый фрагмент ткани. Оптическое разрешение составляет 10 нм — это значит, что спектрометру под силу идентификация смешанных тканей, например, сочетаний полиэстера и хлопка, пояснил один из авторов изобретения Генрих Грюгер (Heinrich Grüger). Сканер представляет собой устройство со стороной 10 мм и толщиной 6,5 мм. По мнению разработчиков, оно поможет текстильным предприятиям в сортировке материалов для их более эффективной обработки. Связав такой сканер с камерой мобильного телефона, потребитель получил бы возможность на месте определять, соответствуют ли заявления производителей текстиля действительности. Кроме того, анализатор помог бы выбрать необходимую программу стирки для старой вещи, у которой утеряны бирки. Исследователи говорят, что вместе с цифровыми камерами будут развиваться и спектрометры: характеристики камеры, которая 10 лет назад стоила €500, уступает возможностям модулей на современных телефонах. Источник: https://3dnews.ru/1094119/v-germanii-izobreli-miniatyurniy-analizator-tekstilya |
ИИ-помощник Copilot в Windows 11 начал показывать рекламу
В конце прошлого месяца Microsoft выпустила функциональное обновление для операционной системы Windows 11. Одной из главных особенностей пакета стал ИИ-помощник Copilot, который построен на базе нейросети и в будущем станет доступен всем пользователям платформы. Теперь же пользователи, которые уже получили доступ к новому инструменту, стали видеть в результатах запросов стороннюю рекламу. https://3dnews.ru/assets/external/il...94110/1053.jpg Источник изображения: Microsoft Если раньше Microsoft встраивала в Windows рекламу собственных продуктов, то теперь речь идёт об объявлениях на основе пользовательских запросов. Например, если попросить Copilot дать рекомендации по выбору процессорного кулера, то ИИ-помощник выдаст результаты поиска материалов по популярным тематическим сайтам в Bing вместе с партнёрскими ссылками на продукты, подобранные по ключевым словам запроса. В ходе тестирования Copilot один из пользователей указал в запросе следующее: «Какой кулер для процессора считается хорошим?». В ответе Copilot указал модели от Noctua, Corsair и Cooler Master. При этом в блоке ниже появилось несколько рекламных объявлений, продвигающих продукты от DeepCool, Thermalight, MSI и др. Другими словами, характер демонстрируемых объявлений зависит от пользовательского запроса. https://3dnews.ru/assets/external/il...94110/1054.jpg Источник изображения: extremetech.com В целом, этот шаг Microsoft не является чем-то удивительным, поскольку в прошлом софтверный гигант уже пытался демонстрировать рекламу в проводнике, меню настроек и даже на экране входа в систему. Отличие заключается в том, что прежде всегда речь шла о рекламе продуктов Microsoft, а не объявлениях сторонних компаний. Несмотря на наличие рекламы, текстовая часть в ответах Copilot формируется корректно и представляет собой полезную информацию, которую алгоритм собирает с популярных сайтов соответствующей тематики. Также отмечается, что Copilot требует непрерывного доступа в интернет даже для выполнения локальных задач, таких как активация тёмной темы Windows. Вероятно, это связано с желанием Microsoft знать, как именно люди используют ИИ-алгоритм компании, чтобы развивать его в дальнейшем. Тем не менее, необходимость в постоянном интернет-подключении выглядит странно, когда речь идёт о выполнении задач на локальном компьютере. Источник: https://3dnews.ru/1094110/iipomoshchnik-microsoft-copilot-v-windows-11-nachal-pokazivat-reklamu |
Microsoft выпустила полностью переработанное настольное приложение Teams — с ИИ и до двух раз быстрее
Компания Microsoft выпустила новую версию приложения для совместной работы Teams для устройств с Windows и macOS. Разработчики полностью переработали продукт, чтобы сделать его более быстрым и простым в использовании. Новая версия Teams находилась на стадии бета-тестирования с марта этого года, но теперь она стала доступна для широкого круга пользователей. https://3dnews.ru/assets/external/il...094083/206.jpg Источник изображений: Microsoft По данным Microsoft, новая версия Teams работает до двух раз быстрее и использует на 50 % меньше памяти по сравнению с предшественницей. Это хорошая новость для людей, которые используют для взаимодействия с сервисом не самые производительные устройства. Отмечается, что новое приложение устанавливается в три раза быстрее, а запуск собраний или присоединение к ним происходит вдвое быстрее. При этом Teams теперь занимает на 70 % меньше дискового пространства. Добиться существенного прироста производительности удалось благодаря отказу от использования платформы Electron в качестве основы для Teams. На смену ей пришла технологий Microsoft Edge WebView2. Microsoft также перешла на использование библиотеки React JavaScript и сосредоточилась на улучшении интерфейсе Teams в стиле Fluent Design. В дальнейшем новые функции будут появляться исключительно в новом клиенте Teams, поэтому разработчики рекомендуют клиентам не затягивать с переходом на его использование. https://3dnews.ru/assets/external/il...094083/209.jpg На момент выхода бета-версии Teams в марте новое приложение не было доступно пользователям компьютеров Apple Mac. Однако с запуском стабильной версии приложения также вышла версия продукта для macOS, которая не лишена улучшений. «Мы наблюдаем значительное повышение производительности на Mac, включая возможность быстрее переключаться между чатами и каналами, а также быстро и эффективно получать доступ к соответствующей информации с помощью более быстрой прокрутки. Teams поддерживает работу на всех устройствах Mac, включая компьютеры с процессорами Apple, предоставляя пользователям Mac улучшенный опыт работы с приложениями», — говорится в заявлении Microsoft. https://3dnews.ru/assets/external/il...094083/210.jpg Отметим также, что новый клиент Teams является основой для интеграции ИИ-инструмента Copilot. Пользователи смогут задействовать Copilot для подведения итогов собраний, повышения продуктивности работы и др. Источник: https://3dnews.ru/1094083/microsoft-vipustila-pererabotannoe-prilogenie-teams-dlya-windows-i-macos |
Тотальное увольнение программистов откладывается.
Пишущий код сервис GitHub Copilot приносит Microsoft многомиллионные убытки ИТ-гиганты пытаются конвертировать «хайп» вокруг технологий генеративного искусственного интеллекта в прибыль, но выходит это пока не у всех. Microsoft, к примеру, по некоторым данным, потеряла несколько десятков миллионов долларов лишь на одном ассистенте программиста GitHub Copilot и, вероятно, продолжает нести убытки. Американская корпорация принимает целый ряд мер, призванных коренным образом изменить ситуацию. Начать зарабатывать на ИИ Крупные технологические компании, вложившие огромные средства в продукты и сервисы на основе технологий искусственного интеллекта (ИИ), предпринимают попытки заставить плоды своего труда приносить прибыль – с разной степенью успешности. По данным источника Wall Street Journal, один из первых ИИ-сервисов, запущенных корпорацией Microsoft, оказался убыточным. Теперь компания планирует обогатить уже существующие продукты дополнительными платными ИИ-функциями, которые будут предложены клиентам по уже более высокой цене, нежели их предшественники. Корпорация Google выбрала похожий подход. Сервис видеоконференцсвязи Zoom, также недавно запустивший ИИ-помощника Zoom AI Companion, пытается сократить издержки, связанные с сервисом, за счет привлечения к обработке пользовательских запросов собственной, значительно более дешевой в эксплуатации языковой модели, когда это целесообразно. Zoom, как ранее сообщил CNews, весной 2024 г. запустит собственный аналог сервиса «Google документы» (Google Docs), который будет тесно интегрирован с основным продуктом компании, а также получит функции генеративного ИИ. https://filearchive.cnews.ru/img/new...openai-750.jpg Эксплуатация модели GPT-4 компании OpenAI обходится разработчикам ИИ-инструментов в немалые суммы Adobe и некоторые другие компании прибегают к месячным лимитам на объем получаемых от ИИ услуг или взимают плату за сервисы в зависимости от затраченных на поддержание их работы вычислительных ресурсов. Генеративный ИИ – удовольствие дорогое Создание продуктов на базе генеративного ИИ предполагает колоссальные расходы, не сравнимые с инвестициями в разработку иных видов программного обеспечения. На построение и обучение модели могут уйти годы и миллионы долларов, отмечает WSJ. Корпорация Nvidia, производитель крайне востребованных GPU A100 и H100, применяемых в обучении ИИ, к примеру, только на компаниях из Китая по состоянию на август 2023 г. заработала около $5 млрд. Дальнейшая эксплуатация ИИ-продуктов также связана с серьезными издержками, поскольку инференс модели (формирование ответа на запрос пользователя) требуют значительных вычислительных ресурсов. Причем чем чаще пользователи прибегают к услугам таких ИИ-сервисов, тем большими оказываются расходы их поставщика на инфраструктуру. Таким образом, компании, которые предлагают фиксированные тарифы на свои ИИ-сервисы, рискуют не заработать на своих услугах, а потерять деньги, во всяком случае, в краткосрочной перспективе. Как Microsoft на ИИ-сервисе деньги теряла Как отмечает WSJ, корпорация Microsoft теряла огромные деньги на одном из своих первых ИИ-сервисов – помощнике программиста GitHub Copilot. В течение первых нескольких месяцев 2023 г. убытки компании в среднем составляли около $20 в месяц с человека, а в некоторых случаях могли достигать $80 в месяц. Сервис GitHub Copilot for Business, запущенный в феврале 2023 г., доступен по цене $19 в месяц за одного человека. Для частных лиц тариф ниже – всего $10 в месяц. По данным издания, аудитория сервиса насчитывает около 1,5 млн пользователей. Таким образом, ежемесячные убытки Microsoft от GitHub Copilot можно оценить примерно в $30 млн. Работу ИИ-сервисов Microsoft обеспечивает новейшая версия большой языковой модели компании OpenAI, давнего партнера «Гиганта из Редмонда», – GPT-4. Microsoft и GitHub не ответили на вопрос WSJ, касающийся прибыльности сервиса GitHub Pilot. Вполне вероятно, что ИИ-помощник по-прежнему остается убыточным. Впрочем, со снижением расходов на вычислительную инфраструктуру ситуация может перемениться. Есть шанс все исправить Компенсировать убытки, принесенные GitHub Copilot, вероятно, сможет новый корпоративный сервис Microsoft 365 Copilot, запуск которого ожидается 1 ноября 2023 г. Благодаря ему функции текстового генеративного ИИ появятся в приложениях Word, Excel, Outlook, PowerPoint и др. На старте опция Copilot обойдется подписчикам Microsoft 365 в $30 в месяц. Microsoft также ищет способы сэкономить на приобретении «железа» для обучения и инференса ИИ. По сведениям The Information, американская корпорация представит ИИ-чип собственной разработки в рамках конференции Ignite, которая состоится в середине ноябре 2023 г. Он позволит в меньшей степени полагаться на продукцию Nvidia, Intel и других поставщиков GPU, широко применяемых в задачах машинного обучения. Кроме того, Microsoft рассматривала возможность перевода своего обновленного поисковика Bing с возможностями ИИ на более дешевую в эксплуатации языковую модель, нежели GPT-4. Источник https://www.cnews.ru/news/top/2023-10-10_u_it-gigantov_problemy_s |
Adobe обновила ИИ в Photoshop и анонсировала нейросети для создания векторной графики в Illustrator и макетов в Express
На мероприятии Adobe Max представлена модель Firefly Image 2 — обновлённая версия генератора изображений в Photoshop научилась создавать изображения более высокого качества. Собственные генеративные ИИ-модели появились в векторном редакторе Illustrator и в облачной платформе Adobe Express. https://3dnews.ru/assets/external/il...be-firefly.jpg Источник изображения: adobe.com Firefly Image 2 генерирует более качественные изображения по сравнению с предшественницей — наиболее ярко это проявляется в мелких деталях, таких как листва, текстура кожи, волосы, руки и черты лица при прорисовке фотореалистичных картинок. Созданные с Firefly Image 2 изображения отличают более высокое разрешение, более яркие цвета и высокий контраст. Модель также предлагает расширенные возможности редактирования картинок при помощи ИИ — можно вручную или автоматически регулировать глубину резкости, эффект размытия при движении и даже поле зрения, как при ручном управлении камерой. https://3dnews.ru/assets/external/il...tive_match.jpg Функция Generative Match (генеративное сопоставление) позволяет стилизовать генерируемое ИИ изображение под представленный образец — таковым может служить картинка из предустановленного набора или загруженный пользователем файл, причём степень схожести можно регулировать при помощи ползунка. Все созданные ИИ изображения маркируются соответствующими метаданными, чтобы избежать злоупотреблений. Во избежание злоупотреблений пользователь также каждый раз при загрузке собственной картинки даёт согласие на условия использования инструмента, подтверждая, что у него есть права на работу с этим образцом, миниатюра которого сохраняется на серверах Adobe и не применяется для обучения ИИ. Firefly Image 2 пока доступна как автономная модель в веб-версии, и в обозримом будущем она будет интегрирована в приложения Creative Cloud. https://3dnews.ru/assets/external/il...strator_AI.jpg Собственная ИИ-модель Firefly Vector появится и в Adobe Illustrator — как заявил разработчик, это «первая в мире генеративная модель искусственного интеллекта для векторной графики». Она создаёт векторные изображения по текстовым описаниям, разбивая их на «логические» слои. Firefly Vector, утверждают в Adobe, по выходе из бета-тестирования сможет использоваться в коммерческих целях, поскольку она была обучена на лицензионном контенте, включая Adobe Stock, а также на бесплатных материалах, авторские права на который считаются истекшими. Генератор Firefly Vector уже можно опробовать в бета-версии Adobe Illustrator, включая дополнительные функции: Retype — генератор 3D-моделей, и Retype — редактор векторных шрифтов. https://3dnews.ru/assets/external/il...express_AI.jpg Наконец, собственной генеративной моделью Firefly Design обзавелась платформа Adobe Express, на которой теперь можно генерировать различные дизайнерские шаблоны также по текстовому описанию. The Next Generation of Creativity, Powered by AI Check this... 👀 All-new AI-powered features are here to revolutionize your creative workflow. https://adobe.ly/3Q2ZbqySubscribe: http://www.youtube.com/user... www.youtube.com В Adobe похвастались, что оригинальным генератором Firefly уже воспользовались для создания 3 млрд изображений, а вторая версия появилась ещё до того, как первой исполнился один год. Источник: https://3dnews.ru/1094301/adobe-obn...avila-novie-modeli-dlya-illustrator-i-express |
Mozilla объявила войну фейковым отзывам: Firefox научат распознавать манипуляции с рейтингами товаров в интернете
Mozilla, разработчик браузера Firefox, будет бороться с фальшивыми отзывами в интернете. Компания анонсировала функцию, способную распознавать фальшивые отзывы на товары и услуги. В основе этого инструмента лежит технология стартапа Fakespot, приобретённого Mozilla в мае этого года. Нововведение обещает существенно затруднить манипуляции с рейтингами на таких платформах, как Amazon и Yelp, особенно для тех, кто применяет ИИ для создания фальшивых отзывов. Появление функции ожидается 21 ноября текущего года. https://3dnews.ru/assets/external/il...zivov-main.jpg Источник изображения: Mozilla С приобретением стартапа Fakespot компания Mozilla сделала значимое вложение в свою технологическую экосистему. Fakespot уже успел зарекомендовать себя как надёжный инструмент в борьбе с фальшивыми отзывами и манипуляциями в интернете. Этот стартап предлагает веб-сервис и браузерное расширение, которые анализируют отзывы на платформах типа Amazon, Yelp, TripAdvisor, Walmart и eBay, применяя для этого оценочную шкалу от «A» до «F». Согласно источнику, функция распознавания фальшивых отзывов, получившая название Review Checker, будет интегрирована в браузер Firefox версии 120. Пользователям десктопов и Android эта функция станет доступна 21 ноября. Эта инновация представляет угрозу для всех, кто планировал использовать ИИ для создания фальшивых отзывов. Это особенно актуально для генеративных ИИ-технологий вроде ChatGPT. Основатель Fakespot Сауд Халифа (Saoud Khalifah) подчеркнул, что при покупке товаров онлайн, когда покупатель не может посмотреть товар «вживую», отзывы приобретают критическую важность. Стив Тейшейра (Steve Teixeira), директор по продуктам в Mozilla, добавил, что алгоритмы ИИ и машинного обучения, применяемые в Fakespot, обеспечивают высокую точность в выявлении поддельных или искажённых отзывов. Источник: https://3dnews.ru/1094309/mozilla-i...firefox-dlya-raspoznavaniya-falshivih-otzivov |
Adobe показала ИИ-технологию Res-Upдля качественного повышения разрешения у видео
Компания Adobe на своём мероприятии Adobe Max продемонстрировала работу технологии Res-Up, которая позволяет значительно улучшить качество анимированных GIF-изображений и видео с низким разрешением. Решение пока не является общедоступным, и опробовать его всем желающим не получится, но его потенциал впечатляет. Технология Adobe Res-Up предлагает увеличение изображения за счёт диффузии — одного из методов генеративного искусственного интеллекта; она позволяет повышать резкость и детализацию картинки. В одном из примеров Adobe продемонстрировала работу с фрагментом фильма «Красный дом» (The Red House) 1947 года — его разрешение было увеличено с 480 × 360 до 1280 × 960 пикселей. Полученные при помощи ИИ кадры стали намного чётче: алгоритм убрал большую часть размытости и даже добавил новые детали, такие как пряди волос и блики. Картинка смотрится немного неестественно, что, впрочем, свойственно многим изображениям и видеороликам, полученным с ИИ, но это заметный шаг вперёд по сравнению технологией Video Super Resolution от Microsoft. Достоин внимания ещё один пример с небольшим фрагментом видео, на котором изображён слонёнок: алгоритм сделал видео намного более чётким и снова добавил новые детали, в том числе морщины на коже. Только на этот раз картинка смотрится более естественной — подрисованные морщины органично двигаются вместе с животным. Adobe пока не готова сделать технологию Res-Up общедоступной, но не исключено, что она в перспективе будет интегрирована в программы Adobe Premiere Pro или Express. Источник: https://3dnews.ru/1094327/adobe-prodemonstrirovala-tehnologiyu-resup-dlya-iimasshtabirovaniya-video |
Microsoft запустит ИИ-помощника в OneNote в ноябре — он будет создавать списки дел и обрабатывать заметки
В ноябре Microsoft добавит в OneNote своего нового ИИ-помощника Microsoft 365 Copilot. Copilot в OneNote сможет создавать списки дел, составлять планы, делать выборки и самостоятельно переписывать заметки. Microsoft 365 Copilot станет доступен с 1 ноября для клиентов Microsoft 365 с определёнными корпоративными тарифными планами, а OneNote станет частью линейки Microsoft 365, согласно дорожной карте компании. https://3dnews.ru/assets/external/il...t-one-note.jpg Источник изображений: Microsoft Некоторые клиенты Microsoft 365 Enterprise уже тестировали новую систему Copilot в течение последних шести месяцев в таких приложениях, как Word, Excel и PowerPoint. В июле Microsoft объявила, что планирует взимать $30 в месяц за одного пользователя пользователя за доступ к Copilot после его запуска в ноябре. За функции ИИ придётся заплатить высокую цену, но Microsoft утверждает, что использование ИИ фундаментально изменит способ создания документов Office. Copilot в OneNote будет отображаться в виде боковой панели справа в домашней ленте приложения. По утверждению Microsoft, ИИ-помощник сможет суммировать страницы, разделы заметок или составлять тезисы на основе текста пользователя. Copilot также будет создавать списки дел на основе заметок, планировать мероприятия и встречи или выступать в роли чат-бота, отвечая на запросы пользователя. https://3dnews.ru/assets/external/il...-side-pane.gif Microsoft планирует в следующем году внедрить Copilot в потребительскую версию Microsoft 365. Учитывая, сколько студентов и других «физических» лиц используют OneNote, можно предположить, что это будет одно из первых приложений, в котором Copilot станет массово доступен конечным потребителям. Похоже, что OneDrive претерпит серьёзные изменения благодаря интеграции Copilot в будущем, хотя и не все пользователи останутся этим довольны. Источник: https://3dnews.ru/1094337/iipomoshc...net-obrabativat-zametki-i-sozdavat-spiski-del |
Сам себе аниматор: нейросеть Kandinsky от Сбера теперь может создавать видеоролики на основе текстового описания
По одному описанию генерируется 4-секундное видео c выбранным эффектом анимации Команда СберБанка поделилась свежими новостями о развитии проекта фирменной нейросети — бесплатной генеративной модели Kandinsky. У пользователей Kandinsky 2.2 появилась возможность создавать видеоролики по текстовому описанию в режиме анимации. https://www.ixbt.com/img/x780/n1/new.../kandinsky.png По одному текстовому описанию генерируется 4-секундное видео c выбранным эффектом анимации, с частотой 24 кадра в секунду и разрешением 640 × 640 пикселей. Генерация одной секунды видео в среднем занимает около 20 секунд. https://www.ixbt.com/img/x780/n1/new.../kandinsky.gif Новый сервис пока работает в тестовом режиме и доступен самым активным пользователям Kandinsky 2.2, которые получат приглашение в ближайшее время. До конца года оценить новые возможности нейросети смогут все желающие. Те пользователи, которые хотят попробовать новые возможности модели сейчас, могут оставить заявку на получение доступа в Telegram-боте. Чтобы сгенерировать видео в режиме анимации, нужно описать письменно то, что хочется увидеть. Далее бот предложит на выбор 16 вариантов анимации сцены, а после этого нейросеть сгенерирует анимированный видеоролик. Также доступна генерация составных сцен: пользователь может ввести несколько текстовых описаний (до трёх), затем выбрать для каждого свою механику анимации, а после этого модель создаст «мини-фильм». Источник https://www.ixbt.com/news/2023/10/1...deoroliki-na-osnove-tekstovogo-opisanija.html |
Adobe представила интерактивное платье с анимацией и ряд перспективных ИИ-технологий
На ежегодной конференции Adobe Max компания Adobe представила не только коммерческие продукты, которыми её клиенты смогут воспользоваться в обозримом будущем, но и 11 перспективный решений, которые пока находятся на стадии разработки — все они объединяются её программой Sneak. https://3dnews.ru/assets/external/il...80/adobe_1.jpg Источник изображения: Adobe Решение под названием Project Stardust позволяет взаимодействовать с объектами на растровом изображении — они идентифицируются алгоритмом, как если бы находились на отдельных слоях. А это, в свою очередь, позволяет их захватывать и перемещать, не пользуясь традиционным инструментом «Лассо». Фон за удалёнными объектами автоматически дорисовывается в соответствии с окружением. Концепт под названием Project Primrose выбивается среди прочих решений, потому что это не алгоритм, который когда-нибудь появится в одной из программ Adobe, а вполне осязаемый предмет — интерактивное платье из «гибких текстильных дисплеев», которые позволяют выводить узоры на вкус своей хозяйки. Едва ли это изобретение можно назвать практичным, но в эстетичности ему не откажешь. https://3dnews.ru/assets/external/il...80/adobe_3.jpg Алгоритм Project Poseable характеризуется Adobe как «прорыв в создании моделей на основе ИИ». Пользователь задаёт образец в виде обычного двухмерного изображения, например, фотографии — алгоритм его анализирует и соответствующим образом корректирует позицию 3D-модели. Получается своего рода аналог технологии захвата движения, только образцом служит не живой человек с сенсорами на теле, а его снимок. Технология Project Dub Dub Dub не связана с изображениями — это переводчик, который поддерживает несколько языков и озвучивает перевод языком говорящего. То есть можно услышать самого себя, только говорящим на другом языке, причём реплики автоматически подстраиваются под исходный темп речи. Получается полноценный дубляж, который, возможно, избавит от необходимости привлекать для этого актёров, если, конечно, перевод будет достаточно точным. https://3dnews.ru/assets/external/il...80/adobe_4.jpg Наконец, ещё одно заслуживающее внимания решение получило название Project See Through. Этот алгоритм позволяет корректировать снимки, которые были сделаны сквозь окно — он достаточно эффективно удаляет полупрозрачные отражения в стекле. Такой инструмент однозначно окажется востребованным в программах Photoshop или Adobe Express, если в Adobe решат сделать его общедоступным. Источник: https://3dnews.ru/1094380/adobe-predstavila-plate-s-animatsiey-i-ryad-perspektivnih-iitehnologiy |
Adobe предложила значок для маркировки ИИ-контента
Adobe представила логотип, который будет применяться для обозначения контента, созданного или отредактированного с использованием инструментов искусственного интеллекта. https://3dnews.ru/assets/external/il...tials_lead.jpg Источник изображений: contentcredentials.org Решение Content Credentials было разработано Adobe при участии ряда партнёров, в том числе BBC, Microsoft, Nikon и Truepic. Информация о происхождении изображения, видеозаписи или PDF-файла добавляется в его метаданные цифровой камерой или графическим редактором и записывается в массив метаданных, где указывается, использовались ли при его создании либо редактировании алгоритмы искусственного интеллекта. Соответствующая информация добавляется автоматически в Adobe Photoshop и Premiere, а скоро её поддержка появится и в Bing Image Creator — Microsoft пока использует собственную технологию маркировки, но планирует перейти на Content Credentials. https://3dnews.ru/assets/external/il...redentials.jpg Далее, когда контент выводится поддерживающим данную функцию приложением или браузером (реализуется при помощи JavaScript), в правом верхнем углу изображения появляется логотип в виде строчных букв «cr», клик по которому выводит всплывающее окно с информацией об изображении. Вызывающий сомнения файл можно будет также загрузить на специальный сайт, который покажет необходимые метаданные. See How Content Credentials Can Verify Content and Promote Transparency | Adobe Creative Cloud Learn how to verify content and promote transparency with Content Credentials today in Adobe Firefly and Photoshop -- and a preview of our vision ahead. Cont... www.youtube.com Adobe — не единственная компания, которая, следуя своему обязательству, предложила маркировку ИИ-контента. Ранее собственное решение под названием SynthID представила Google, которая предпочла внедрение водяных знаков, не видных человеческому глазу, но читаемых компьютерами — недавно американские учёные опровергли эффективность такого метода. Едва ли более сложной задачей окажется и подделка метаданных. Источник: https://3dnews.ru/1094382/adobe-predlogila-sposob-markirovki-iikontenta |
Google запустила ИИ-генератор картинок прямо в адресной строке — пока в тестовом режиме
Основанная на алгоритмах искусственного интеллекта поисковая служба Google Search Generative Experience (SGE) обзавелась функцией генерации изображений. Аналогичную возможность ещё с марта предлагает Microsoft в Bing Chat на базе модели OpenAI DALL-E, так что неудивительно, что Google последовала примеру конкурента. https://3dnews.ru/assets/external/il...8/google_1.jpg Источник изображений: blog.google Пользователи Google, активировавшие в разделе Google Search Labs функцию SGE, могут задавать описание изображения прямо в поисковой строке, и система генерирует на его основе несколько изображений, из которых можно выбрать наиболее подходящее. В основу функции положена ИИ-модель Imagen, рассказал представитель Google ресурсу The Verge. Созданное нейросетью изображение можно отредактировать при помощи текстовых команд. Генератор доступен также в разделе поиска по картинкам в Google —поисковый запрос можно превратить в команду для него, и результат появится в боковой панели. Разработчик подчеркнул, что старается ответственно подходить к внедрению инструментов создания изображений — система, по его словам, откажется генерировать картинки, нарушающие политику компании. Каждое созданное при помощи SGE изображение получает соответствующую маркировку метаданными и водяными знаками, указывающую, что оно было создано ИИ. Отключена возможность создания фотореалистичных изображений человеческих лиц, нельзя создавать картинки со знаменитостями. Недавно Google открыла доступ к SGE для подростков, но генератор изображений будет работать только у пользователей старше 18 лет. https://3dnews.ru/assets/external/il...8/google_2.jpg Компания также сообщила, что SGE теперь может по запросу генерировать черновые варианты различных текстов в разных стилях изложения — понравившийся пользователю вариант можно экспортировать в Google Docs или Gmail. Источник: https://3dnews.ru/1094438/iipoiskovik-google-sge-nauchilsya-generirovat-kartinki |
Logitech представила гарнитуру Zone Wireless 2 с шумоподавлением и ИИ-технологиями для повышения комфорта работы в шумном офисе и дома
Компания Logitech официально представила аудиогарнитуру Zone Wireless 2, которая поможет сосредоточиться на работе даже в условиях шумного офиса. Новинка может похвастаться активным шумоподавлением и другими функциями, в том числе на базе ИИ, полезными для людей, которым приходится работать в шумных офисах. https://3dnews.ru/assets/external/il...094527/233.jpg Источник изображений: Logitech Zone Wireless 2 разработана специально для повышения качества общения в гибридных рабочих пространствах. Гарнитура использует технологии на базе искусственного интеллекта для обеспечения качественной двухсторонней связи без помех и позволяет работать эффективно даже в шумной обстановке. Новинка отличается современным дизайном с мягкими амбушюрами. Кроме того, пластиковые элементы конструкции на 20 % состоят из переработанного пластика, а декоративное алюминиевое кольцо и дуга наушников созданы с использованием возобновляемых источников энергии. https://3dnews.ru/assets/external/il...094527/234.jpg Одна из особенностей новинки заключается в том, что она способна подавлять окружающий шум со стороны собеседника даже если он не использует гарнитуру с шумоподавлением. Устройство поддерживает функцию Advanced Call Clarity, которая активируется через Logi Time и позволяет отделить голос собеседника от фонового шума. В конструкции также предусмотрены микрофоны с шумоподавлением, которые эффективно убирают посторонние шумы и выделяют голос пользователя. За счёт этого формируется динамическая двусторонняя система подавления шума. Гибридное активное шумоподавление гарнитуры эффективно блокирует окружающий шум, включая клацанье клавиш, разговоры коллег поблизости, шумы, создаваемые системами отопления и вентиляции и др. Для обеспечения надёжного соединения с ПК пользователя используется Bluetooth и запатентованная технология контроля расстояния от приёмника до гарнитуры. Пользователь может использовать для подключения встроенный модуль Bluetooth или же задействовать фирменный приёмопередатчик с интерфейсом USB Type-C. Время автономной работы Zone Wireless 2 составляет до 40 часов в режиме разговора и прослушивания, в зависимости от того, как долго используется функция шумоподавления. Кроме того, быстрая зарядка в течение пяти минут может обеспечить до часа работы в режиме разговора. https://3dnews.ru/assets/external/il...094527/232.jpg «Zone Wireless 2 — это первоклассная гарнитура Logitech для квалифицированных специалистов, которым нужны технологии, обеспечивающие высокую степень контроля, точности и инноваций. Мы создали Zone Wireless 2 с использованием передовых технологий, обеспечивающих бескомпромиссную производительность и одновременно позволяющих снизить выбросы в атмосферу углекислого газа», — сказано в сообщении Logitech. Гарнитура Logitech Zone Wireless 2 доступна в графитовом и розовом вариантах цветового исполнения. Желающим стать её обладателем придётся потратить $300. Источник: https://3dnews.ru/1094527/predstavl...nologii-dlya-komfortnoy-raboti-v-ofise-i-doma |
PwC объявила об использовании генеративного ИИ для консалтинга
https://d-russia.ru/wp-content/uploa...1/12/etika.jpg Международная сеть компаний PwC, предлагающих услуги в области консалтинга и аудита, договорилась о сотрудничестве с OpenAI (разработчик сервиса ChatGPT) для оказания консалтинговых услуг своим клиентам посредством технологий генеративного искусственного интеллекта (ИИ), сообщает во вторник Bloomberg. Компания таким образом намерена сократить издержки и повысить производительность труда сотрудников. Ожидается, что PwC задействует ИИ-технологии для проведения консультаций по сложным вопросам в области налогообложения, юриспруденции и кадровой политики. В частности, ИИ будет проводить комплексную оценку объекта инвестирования, идентифицировать проблемы в области соблюдения законодательства и давать рекомендации по проведению сделок. PwC уже начала тестирование ИИ-инструмента в Великобритании. В ближайшие несколько месяцев планируется задействовать новые технологии в более 50 странах мира, где работают специалисты компании. Аудитор рассчитывает, что это также позволит осуществить масштабные проекты, которые ранее считались либо слишком дорогими, либо слишком долгими. Отмечается, что PwC не собирается как-либо использовать ChatGPT. Компания пообещала не сокращать сотрудников в связи с внедрением новой технологии в ближайшей перспективе. Отметим, что ИИ-технологии пробуют внедрить в свою деятельность различные компании — от издателей до юристов. Результаты экспериментов неоднозначны. Так, техасский судья запретил адвокатам предоставлять подготовленные ИИ материалы без человеческой проверки. Источник https://d-russia.ru/pwc-objavila-ob-ispolzovanii-generativnogo-ii-dlja-konsaltinga.html |
ИИ помог техногигантам увеличить рыночную капитализацию на $2,4 триллиона за год
Стоимость акций крупнейших технологических компаний — Apple, Microsoft, Alphabet, Amazon и NVIDIA — за год выросла в среднем на 36 % или на $2,4 трлн. Об этом говорится в ежегодном докладе Euroscape (PDF), который представила венчурная компания Accel. https://3dnews.ru/assets/external/il...44/accel_1.jpg Источник изображений: accel.com Наиболее заметным шагом вперёд отметилась NVIDIA, которая присоединилась к клубу «триллионеров»: сейчас рыночная капитализация компании составляет более $1 трлн. Производитель достиг такого результата благодаря ускорителям, которые используются во многих передовых моделях генеративного искусственного интеллекта. С начала года на 29 % вырос индекс компаний, предлагающих облачные услуги и работающих по схеме SaaS, в том числе Salesforce, Palantir и Unity. Прошлый год выдался для этого сегмента крайне неудачным: из-за оттока инвесторов они потеряли $1,6 трлн. Рынок восстанавливается намного быстрее, чем после краха доткомов: технологический индекс Nasdaq Composite уже отыграл 80 % от своего максимального значения за 18 месяцев. https://3dnews.ru/assets/external/il...44/accel_2.jpg Основным фактором роста облака и SaaS стали технологии ИИ: больше всех здесь привлекла OpenAI — $10 млрд, на втором месте с большим отрывом оказалась Inflection с $1,3 млрд. В Европе крупнейшими разработчиками генеративного ИИ оказались французские компании Hugging Face ($235 млн), Poolside ($126 млн) и Mistral AI ($113 млн). Число «единорогов» вернулось к допандемийному уровню, но среди них выросла доля разработчиков ИИ: 40 % в Европе и Израиле и 80 % в США. Для технологической отрасли этот год, однако, выдался нелёгким: компании привлекают меньше средств, а их оценки резко упали. Сами игроки теперь уделяют больше внимания росту и расширению, а не краткосрочным прибылям, а капитал на фоне роста процентных ставок подорожал. В результате темпы роста в списке Euroscape упали в среднем с 68 % в I квартале 2021 года до 23 % во II квартале 2023 года. Наконец, резко сократилось число поглощений с участием крупных технологических компаний. В 2021 году количество сделок с их участием было 27, в 2022 году оно составило 26, а в этом году — лишь 10. Недавно сделку по поглощению крупнейшего игрового издателя Activision Blizzard закрыла Microsoft: слияние далось компаниям нелегко, и приходилось преодолевать сопротивление регулирующих органов по всему миру. Источник: https://3dnews.ru/1094644/ii-pomog-...chnuyu-kapitalizatsiyu-na-24-trilliona-za-god |
«Яндекс» представил YandexART — новую нейросеть для создания изображений
Команда разработчиков «Яндекса» представила новую диффузионную нейросеть Yandex AI Rendering Technology (YandexART), которая создаёт изображения и анимацию в ответ на текстовые запросы пользователей. https://3dnews.ru/assets/external/il...yandex1810.png Примеры созданных YandexART изображений (источник: пресс-служба «Яндекса») YandexART формирует изображения и анимацию методом каскадной диффузии: сначала нейросеть генерирует картинки и кадры в соответствии с запросом пользователя, а затем поэтапно увеличивает их разрешение, насыщая деталями. В качестве обучающего набора данных были задействованы 330 млн изображений с текстовым описанием. Также разработчиками был реализован новый алгоритм распознавания текстов, помогающий нейросети лучше понимать пожелания пользователей. Отличительной особенностью YandexART является понимание российского культурного кода — нейросеть знает известные места и города страны, выдающихся личностей разных эпох и знакомых с детства персонажей мультфильмов и сказок. Например, Чебурашку, богатырей и Бабу-Ягу. Нейросеть уже интегрирована в мобильное приложение «Шедеврум» и помогает иллюстрировать рекламные объявления в «Яндекс Бизнесе». Вскоре YandexART появится в «Яндекс Клавиатуре» и других сервисах компании. Источник: https://3dnews.ru/1094632/yandeks-predstavil-yandexart-novuyu-neyroset-dlya-sozdaniya-izobrageniy |
Adobe добавила ИИ-функции в Photoshop и Premiere Elements 2024
Adobe обновила свои флагманские решения для редактирования фотографий и видео — Photoshop и Premiere Elements 2024, интегрировав в них ряд функций на основе искусственного интеллекта. Теперь фирменная платформа компании Sensei AI полноценно задействована в творческом процессе пользователей, начиная от автоматического выделения сложных объектов и заканчивая монтированием роликов профессионального уровня. https://3dnews.ru/assets/external/il...-2024-main.jpg Источник изображений: Adobe В Photoshop Elements 2024 появился инструмент, который автоматически выделяет объекты и фоны для их удаления, редактирования или замены. Эта функция является улучшенной версией аналогичной технологии Pixel Magic Eraser компании Google. По словам Adobe, с помощью этого инструмента можно, например, заменить небо, что будет полезно тем пользователям, которые хотят превратить обыденные фотографии на открытом воздухе в завораживающие воображение изображения. https://3dnews.ru/assets/external/il...024-select.jpg Инструменты на основе ИИ позволяют сгладить кожу человека на фотографии и выполнить ряд автоматических умных исправлений. Также в Photoshop Elements задействована новая функция Artistic Effect, позволяющая преобразить изображение в нечто, напоминающее известное произведение искусства. https://3dnews.ru/assets/external/il...tic-effect.jpg Платформа Adobe Sensei AI также позволяет увеличивать масштаб изображений и удалять артефакты, придавая объектам на фотографиях более естественный вид. https://3dnews.ru/assets/external/il...24-enlarge.jpg Что касается Premiere Elements 2024, то в этом видеоредакторе ИИ задействован для автоматического создания роликов с яркими моментами из предоставленного пользователем видеоматериала. Компания утверждает, что ролики, созданные с помощью ИИ, привлекают внимание зрителей, акцентируя его на движении людей и объектов в кадре, крупных планах и высоком качестве отснятого материала. https://www.youtube.com/watch?v=MTuMl9mBIqo Разумеется, нововведения Adobe не ограничиваются только использованием ИИ. В Photoshop Elements добавлены новые цветовые и тональные пресеты, а также слайды, которые можно сохранять в форматах MP4 и GIF. Premiere Elements обзавёлся набором новых аудиоэффектов, таких как реверберация, и несколькими встроенными пресетами для создания уникальной атмосферы. Как и Photoshop, Premiere получил новый дизайн и доступ к коллекции учебных пособий Guided Edits, которые помогут пользователям освоить различные действия в процессе работы. Источник: https://3dnews.ru/1094757/adobe-integrirovala-ii-v-photoshop-i-premiere-elements-2024 |
OpenAI открыла доступ к генератору изображений DALL-E 3 для подписчиков ChatGPT Plus и Enterprise
OpenAI расширяет доступность своего новейшего генератора изображений по текстовому описанию DALL-E 3. Компания объявила, что на этой неделе ИИ-алгоритм станет доступен подписчикам ChatGPT Plus и ChatGPT Enterprise. Разработчики заявили, что для этой модели был подготовлен пакет мер по повышению уровня безопасности, что указывает на её готовность к расширенному запуску. https://3dnews.ru/assets/external/il...94734/1095.jpg Источник изображения: OpenAI Модель DALL-E 3 была анонсирована в прошлом месяце, и разработчики показали, насколько она лучше справляется с генерацией картинок по сравнению с предыдущей версией алгоритма DALL-E 2. Пользователи могли убедиться в этом, составляя в ChatGPT более длинные и детальные описания изображений, которые должен создать генератор. Ранее в этом месяце модель DALL-E 3 была интегрирована в службы Bing Chat и Bing Image Creator. Разработчики признают, что предыдущие версии генератора вызывали опасения, поскольку могли использоваться для создания фейковых изображений с целью распространения дезинформации или ведения другой неправомерной деятельности. В DALL-E 3 реализованы инструменты для ограничения генерации картинок определённых тематик. К примеру, алгоритм будет отклонять запросы, содержащие имена общественных деятелей или какие-либо «вредные побуждения». Разработчики ввели ограничения, которые не позволят DALL-E создавать изображения в стиле живущих ныне художников. OpenAI также заявила о наличии классификатора изображений, который позволяет с точностью до 99 % определить, была ли та или иная картинка сгенерирована с помощью DALL-E. Источник: https://3dnews.ru/1094734/openai-ot...3-dlya-podpischikov-chatgpt-plus-i-enterprise |
В ChromeOS добавят управление глазами и мимикой — вместо клавиатуры и мыши
В ближайшее время Google в рамках использования искусственного интеллекта добавит в ChromeOS функцию Face Tracking для отслеживания лица пользователя. Эта функция сделает возможным управление хромбуком при помощи движения глаз. В первую очередь Face Tracking существенно облегчит управление компьютером для пользователей, которые по каким-то причинам не могут или не хотят использовать мышь и клавиатуру. https://3dnews.ru/assets/external/il...ixabay-com.jpg Источник изображения: Pixabay Функция Face Tracking появилась в ChromeOS версии 120 в разделе специальных возможностей на странице настроек курсора и сенсорной панели, но пока остаётся неработоспособной. https://3dnews.ru/assets/external/il...e-tracking.jpg Источник изображения: X / C2 Productions Можно только гадать, как именно будет работать Face Tracking, но эксперты склонны проводить аналогию с уже существующим на Chromebook инструментом специальных возможностей ChromeVox, который в настоящее время позволяет помечать каждый элемент на экране номером. Затем, произнеся этот номер голосом, пользователь может выбрать его так же, как если бы щёлкнул по нему мышью. На сегодняшний день это уже вполне рабочий способ навигации по всей операционной системе Google. https://3dnews.ru/assets/external/il...chrome-vox.jpg Источник изображения: Google Если Google позволит пользователям делать что-то подобное с помощью глаз, просто взглянув на число или точку на экране, это может существенно повысить привлекательность Chomebook для многих клиентов и резко увеличить число желающих приобрести Chromebook или использовать его более эффективно. Добавление дополнительных инструментов доступности позволит миллионам людей более эффективно использовать технологии не только сегодняшнего, но и завтрашнего дня. Возможно, с помощью Face Tracking компании Google удастся дать доступ к современным информационным технологиям людям с ограниченными возможностями и тем самым кардинально улучшить их жизнь. Источник: https://3dnews.ru/1094934/sostroiv-...vlyat-mishyu-i-klaviaturoy-s-pomoshchyu-litsa |
Новые чипы Snapdragon позволят перенести ИИ-модели на локальные устройства — разработчики софта толькоза
На мероприятии Snapdragon Summit компания Qualcomm представила передовые процессоры, предназначенные как для ПК, так и для телефонов. Их отличительной особенностью являются встроенные ускорители для алгоритмов искусственного интеллекта — разработчик делает акцент на локальной работе нейросетей. https://3dnews.ru/assets/external/il...ragon-ai_1.jpg Источник изображений: Qualcomm Платформы Snapdragon X Elite для ПК и Snapdragon 8 Gen 3 для телефонов оборудованы мощными нейропроцессорами (NPU), при помощи которых можно локально запускать ИИ-модели Snapdragon X Elite для ПК и Snapdragon 8 Gen 3класса Stable Diffusion. «Мы вступаем в эру ИИ, [где] генеративный ИИ на устройствах будет играть решающую роль в обеспечении мощных, быстрых, персонализированных, эффективных, безопасных и высокооптимизированных функций. Snapdragon располагает уникальными возможностями для формирования и получения преимуществ от потенциала ИИ на устройствах, и вы увидите применение генеративного ИИ практически везде, где есть Snapdragon», — заявил глава Qualcomm Криштиано Амон (Cristiano Amon). https://3dnews.ru/assets/external/il...ragon-ai_2.jpg На ПК под Windows разработчик продемонстрировал локальный запуск чат-ботов с производительностью 30 токенов в секунду. На смартфонах генератор изображений на основе модели Stable Diffusion локально создаёт картинку примерно за одну секунду. Эту технологию компания демонстрировала на прототипе устройства ещё раньше — минувшей зимой. Запуск генеративных ИИ-моделей локально на устройстве, по словам Qualcomm, обеспечивает персонализацию, конфиденциальность, безопасность, экономию энергии, оперативность работы и низкую себестоимость. В случае со Stable Diffusion это означает одну секунду на генерацию изображения вместо минуты в облаке, а также конфиденциальность, поскольку не происходит обмена данными с внешними ресурсами. https://3dnews.ru/assets/external/il...ragon-ai_3.jpg Свои платформы ИИ для чипов Qualcomm пообещали оптимизировать многочисленные партнёры компании, в том числе Baidu, Bloom, Meta✴, Microsoft, OpenAI, RWKV и Youdao. На рынок устройства на платформах Snapdragon X Elite и Snapdragon 8 Gen 3 выйдут в начале будущего года. Источник: https://3dnews.ru/1094984/qualcomm-vnedrit-iiuskoriteli-v-telefoni-i-pk |
Глава Microsoft намекнул, что Copilot заменит кнопку «Пуск» в будущих версиях Windows
Microsoft настолько высоко оценивает роль искусственного интеллекта, что Copilot может занять место кнопки «Пуск» в следующей версии Windows. Генеральный директор компании Сатья Наделла (Satya Nadella), похоже, считает Copilot более эффективным способом взаимодействия с операционной системой, чем привычный список приложений. Он дал это понять во время видеочата с исполнительным директором Qualcomm Криштиану Амоном (Cristiano Amon). https://3dnews.ru/assets/external/il...lot_banner.jpg Источник изображения: Microsoft «Copilot похож на кнопку «Пуск, — заявил Наделла. — Он становится организатором всего вашего взаимодействия с приложением. Так, например, я просто захожу в систему и выражаю своё намерение, и либо попадаю в нужное приложение, либо приложение обрабатывается Copilot, что помогает мне учиться, запрашивать и создавать — и, я думаю, полностью меняет привычки пользователей». Наделла сделал это заявление во время обсуждения с Амоном перспектив нового процессора Qualcomm Snapdragon X Elite. До этого руководители долгое время тесно сотрудничали, чтобы позволить Windows полноценно использовать возможности нового чипа и стимулировать создание программного обеспечения, использующего преимущества современных нейронных процессоров (NPU). Microsoft сделала серьёзную ставку на использование ИИ, центральным элементом которого стал Copilot, работающий как в самой ОС Windows, так и в приложениях. «И поэтому в некотором смысле существует новое поколение компьютеров с искусственным интеллектом, которое, я думаю, уже создаётся, — уверен Наделла. — Итак, работа, которую мы делаем, объединит этот опыт, который невозможно выполнить без какой-то новой системной архитектуры». Возможно, Наделла имел в виду следующую итерацию Windows, предположительно под номером 12. Пока что имеется лишь информация о высокой степени модульности будущей ОС и глубокой интеграции с технологиями искусственного интеллекта Microsoft. Наделла, похоже, предполагает, что при использовании Copilot пользователи не будут просить ИИ открыть конкретное приложение, а просто захотят «отредактировать фотографию» или «получить помощь с финансовым планированием». Copilot может стать как способом запуска приложений, так и способом предложить решение стоящей перед пользователем задачи. Сможет ли он когда-нибудь заменить культовую кнопку «Пуск» Windows? Будущее покажет… Источник: https://3dnews.ru/1095000/microsoft-copilot-moget-zamenit-knopku-pusk-v-sleduyushchey-versii-windows |
ИИ помог дозаписать новую песню The Beatles с вокалом Джона Леннона — она выйдет 2 ноября
Стало известно, что 2 ноября состоится релиз последней песни легендарной группы The Beatles с вокалом Джона Леннона под названием Now and Then. В процессе её создания использовался ИИ-алгоритм компании WingNut Films, который применялся для обработки голоса Леннона на демо-записи этой песни, сделанной несколько десятилетий назад. https://3dnews.ru/assets/external/il...95125/1134.jpg Источник изображения: Business Wire Джон Леннон записал демо-версию Now and Then на аудиокассету в 1970-х годах, но она никогда официально не издавалась. В 2021 году режиссёр Питер Джексон снял документальный сериал The Beatles: Get Back, в процессе работы над которым для обработки партий музыкальных инструментов и голосов людей использовалась технология компании WingNut. Теперь же этот алгоритм задействовали для обработки голоса Леннона на демо-записи, благодаря чему удалось сохранить чёткость оригинального вокала, отделив его от играющей на записи музыки. Спустя несколько десятилетий после создания демо трек будет выпущен как официальная спродюсированная песня вместе с 12-минутным документальным фильмом The Last Beatles Song, посвящённым рассказу о создании этой музыкальной композиции. В него вошли комментарии Пола Маккартни, Ринго Стара, Джорджа Харрисона, а также сына Леннона Шона Оно-Леннона и Питера Джексона. В пресс-релизе, посвящённом предстоящей премьере, Пол Маккартни сказал, что был «весьма взволнован», услышав голос Леннона на «настоящей записи The Beatles» в 2023 году, а Ринго Старр описал процесс создания песни как «самый близкий к тому», чтобы вернуть Леннона в комнату. Документальный фильм The Last Beatles Song выйдет 1 ноября, песня Now and Then — 2 ноября, а видеоклип на неё — 3 ноября. Источник: https://3dnews.ru/1095125/poslednya...oyabrya-ona-zapisana-s-pomoshchyu-iialgoritma |
К робопсу Boston Dynamics Spot подключили ChatGPT и превратили его в экскурсовода
Компания Boston Dynamics обучила робопса Spot выступать в роли гида по своей лаборатории и проводить экскурсии от имени разных персонажей — для этого к машине подключили чат-бот на базе искусственного интеллекта ChatGPT. https://3dnews.ru/assets/external/il...72/bd-spot.jpg Источник изображения: bostondynamics.com К роботу-собаке Spot подключили динамки, микрофон и API ChatGPT, который превратил его в интересного собеседника. Чтобы ещё больше оживить образ машины, разработчики добавили к ней вместо рта роботизированный манипулятор, на котором закрепили небольшой головной убор и пару пластиковых глаз. В качестве образца экскурсии разработчики написали базовые сценарии для каждого помещения в лаборатории — к примеру, робот показывал посетителям свою зарядную док-станцию. Spot также обучили делать снимки помещений и отвечать на вопросы о том, что он видит. Наконец, ему предложили проводить экскурсии от имени разных персонажей: гида-британца времён Шекспира, девочки-подростка и саркастичного Джоша (Josh). https://www.youtube.com/watch?v=djzOBZUFzTw Spot говорил людям комплименты, на ходу сочинял стихи и успешно отвечал на вопросы, которых даже не было в сценарии: когда его попросили показать родителей, они привёл посетителя к выставленным роботам Spot предыдущего поколения. Не обошлось и без сбоев: иногда он говорил не соответствующие действительности вещи; а один раз проигнорировал реплику собеседника, продолжил свой рассказ и отреагировал лишь спустя какое-то время. Источник: https://3dnews.ru/1095172/boston-dy...gpt-k-robotu-spot-i-sdelala-ego-ekskursovodom |
Загадочный заменитель смартфона Humane Ai Pin будет стоить $1000 и получит ИИ-модель GPT — анонс состоится 9 ноября
Загадочное носимое устройство Ai Pin на базе искусственного интеллекта может получить ценник в $1000 и, возможно, будет требовать дополнительной ежемесячной подписки за услуги сотовой связи, сообщает издание The Information. Напомним, что разработкой данного гаджета занимается стартап Humane, созданный выходцами из Apple. https://3dnews.ru/assets/external/il...173/humane.jpg Источник изображения: TED Разработка устройства ведётся уже несколько лет. Однако первые детали о нём стали известны в апреле этого года, в рамках конференции TED. Тогда соучредитель компании Humane Имран Чаудри (Imran Chaudhri) мельком показал загадочное устройство в нагрудном кармане своей куртки и продемонстрировал его работу. Он ответил на телефонный звонок своей жены и соучредителя компании Бетани Бонджорно (Bethany Bongiorno), для чего не пришлось нажимать никаких кнопок — достаточно было простого «алло». Гаджет перевёл произнесённую своим владельцем фразу на французский язык, озвучив перевод его же голосом. Наконец, устройство показало, что умеет следить за электронной почтой, сообщениями и событиям календаря, правда, изобретатель тогда не уточнил, как именно это работает. Предполагалось, что больше деталей об Ai Pin будет раскрыто 14 октября. Однако дата презентации устройства была перенесена на 9 ноября. Теперь выяснились свежие подробности. https://3dnews.ru/assets/external/il...edae81.800.jpg Источник изображения: The Information Судя по всему, это Ai Pin будет представлять собой не кольцо, как можно было предположить исходя из фотографий с апрельской презентации TED. Издание описывает гаджет, как «небольшое устройство без экрана размером с солёный крекер». Гаджет «получит камеру, микрофон и динамик, множество сенсоров, а также лазерный проектор». В начале октября устройство показывали на Неделе моды в Париже. https://3dnews.ru/assets/external/il...gfwgwegweg.jpg Гаджет предполагается крепить к одежде. Устройство работает на базе мобильного процессора Qualcomm Snapdragon, «который обеспечивает производительность, скорость беспроводного соединения и возможности камеры, а также безопасности, уровня смартфона». Humane планирует стать виртуальным оператором сотовой связи (то есть будет работать на базе инфраструктуры другого оператора связи) для предоставления сотового подключения для Ai Pin. Другой соучредитель компании Бетани Бонджорно (Bethany Bongiorno) описала устройство, как «телефон, контекстуальный компьютер и программная платформа». https://3dnews.ru/assets/external/il...ai-pin.800.jpg Источник изображения: Time По данным The Information, работа ИИ-функций Ai Pin будут обеспечиваться проприетарной большой языковой моделью. Согласно статье издания Time, это будет GPT-модель от компании OpenAI. К слову, крупнейшим инвестором компании Humane является Сэм Альтман (Sam Altman), гендиректор OpenAI. К разработке самого устройства, предположительно, приложил руку Джони Айв (Jony Ive), бывший главный дизайнер продуктов Apple, покинувший её в 2019 году и после этого основавший свою собственную дизайнерскую фирму LoveFrom. В изначальной версии статьи Time утверждалось, что Ai Pin будет использовать GPT-4, однако в отредактированной версии статьи версия языковой модели была убрана. Публикация Time также описывает наличие у устройства индикатора, который включается при активации камеры, микрофона и «сенсоров ввода». Многие детали об Ai Pin, а также о планах самой Humane по-прежнему неизвестны. По мнению источников The Information, у компании грандиозное видение технологий и её цели не ограничиваются одним Ai Pin. «Они предполагают, что Humane надеется добиться полной смены парадигмы в сегменте потребительских вычислений», — пишет издание. Как бы то ни было, больше подробностей об Ai Pin можно будет узнать 9 ноября. Источник: https://3dnews.ru/1095173/stoimost-...-pin-ot-humane-kotoroe-predstavyat-9-noyabrya |
Samsung рассказала о технологии ISOCELL Zoom Anyplace для масштабирование кадра при видеосъёмке без потери качества
Одной из интересных новых возможностей процессора Qualcomm Snapdragon 8 Gen 3 стала поддержка функции ISOCELL Zoom Anyplace — её разработала компания Samsung для смартфонов с 200-мегапиксельными сенсорами. Это решение позволяет автоматически отслеживать движущиеся объекты при видеосъёмке и масштабировать картинку без потери качества. https://3dnews.ru/assets/external/il...m-anyplace.jpg Источник изображения: samsung.com Технология ISOCELL Zoom Anyplace позволяет пользователю во время съёмки видео на смартфон выбрать интересующий объект, чтобы камера самостоятельно его отслеживала — фокусироваться на объекте самостоятельно больше не требуется. Функция основана на алгоритме искусственного интеллекта и поддерживается процессором Qualcomm Snapdragon 8 Gen 3. Даже если объект движется очень быстро, он остаётся в кадре, а оператору не требуется перемещать смартфон самостоятельно, значит, изображение не дёргается. Ещё одним преимуществом ISOCELL Zoom Anyplace является динамическое масштабирование картинки прямо во время видеосъёмки: если раньше увеличенный объект проигрывал в качестве полному кадру, то с новой функцией это в обоих случаях настоящее разрешение 4K без ущерба качеству. Более того, поддерживается одновременная съёмка полной сцены и её фрагмента в высоком разрешении, то есть в большем числе ракурсов. Поддерживается и динамическое масштабирование: можно начать съёмку с «наезда» на объект, после чего постепенно уменьшить его в кадре или сделать наоборот. https://www.youtube.com/watch?v=qNVOysZsJfE Функция ISOCELL Zoom Anyplace поддерживает масштабирование без ущерба для качества: прежде цифровой четырёхкратный зум для 12,5-мегапиксельной картинки приводил к изображению с разрешением 0,78 мегапикселя (12,5 Мп / 16), но с 200-мегапиксельным сенсором таких жертв уже не требуется. Нужная оператору область выбирается из всего кадра и перерисовывается, а сенсор работает в исходном разрешении. Не потребуется и смена камеры, которая ранее производилась при масштабировании более трёхкратного — из-за этого менялись качество картинки и угол обзора. Сенсору на 200 мегапикселей это не требуется ни при двух-, ни при четырёхкратном увеличении. Qualcomm Snapdragon 8 Gen 3 обеспечит Samsung работу ещё одной технологии под названием End-to-End (E2E) AI Remosaic. Традиционная схема съёмки включает несколько этапов: получение исходного изображения с сенсора, его обработка ISP (Image Signal Processor) и вывод результата в формате JPEG — все они выполняются последовательно. E2E AI Remosaic предполагает выстраивание и обработку изображения параллельно, то есть готовый результат получается вдвое быстрее. Пользователи делают снимки оперативнее, а качество фото страдает меньше, поскольку из-за задержек больше нет потери данных. Новые функции, вероятно, дебютируют с выходом смартфонов серии Samsung Galaxy S24 — их анонс ожидается в начале 2024 года. Источник: https://3dnews.ru/1095171/samsung-p...om-anyplace-ona-poyavitsya-u-galaxy-s24-ultra |
Создан искусственный интеллект, который будет участвовать в конференциях за вас.
Едва появившись на свет, он уже нарушает законы 1 ноября пользователям Microsoft 365 станет доступен виртуальный ИИ-помощник, который способен подготовить выжимку из почтовой переписке и написать ответ за считанные секунды, а также легко готовит презентации в PowerPoint. Ответственное отношение Microsoft внедрила в свои офисные приложения помощника с искусственным интеллектом (ИИ), напоминающего по своим возможностям ChatGPT, - Microsoft 365 Copilot. Среди его возможностей - суммирование содержания встреч в Microsoft Teams, подготовка презентаций и восторженных ответов в почте. В Microsoft утверждают, что это поможет снизить рутинную нагрузку на работников, однако уже раздаются голоса о том, что такой ИИ очень скоро сможет претендовать на замену многих работников собой. https://static.cnews.ru/img/news/202...opilot_700.jpg Фото: kenshinstock / Фотобанк Фрипик Искусственный интеллект выполняет функции офисного работника Мало того, в его нынешнем виде этот ИИ может противоречить требованиям законодательства и ЕС, и Китая - о том, в частности, что при общении с искусственным интеллектом, человек должен сразу получать информацию о том, кто является его или ее собеседником. Руководитель подразделения Microsoft 365 Колетт Столлбаумер (Colette Stallbaumer) заявила, что Copilot - это лишь инструмент, и что за ответственное его использование отвечает тот, кто им пользуется. «Я, быть может, не стану уточнять, что для подготовки ответа на ваш запрос я использовала ИИ-помощника. В этом уравнении всегда присутствует человек, и именно он все контролирует», - дополнила Колетт Столлбаумер. Европейские регуляторы, однако, считают иначе: по их представлениям, эту задачу должны решать вендоры ИИ-технологий. Возврат инвестиций С технической точки зрения Copilot базируется на той же технологии, на которой и OpenAI ChatGPT, благо Microsoft инвестировала в нее миллиарды долларов. Как пишет журналист BBC Зоуи Клайнман (Zoe Kleinman), Copilot оставляет двойственное впечатление: с одной стороны, это эффективный инструмент, а с другой - конкурентная опасность для многих офисных работников. В особенности в тех компаниях, которые стремятся сократить издержки. Copilot с успехом справляется с такими задачами, как суммирование содержания длинной цепочки электронных сообщений, посвященных запуску (вымышленного) продукта, а затем предлагает короткий ответ. На все уходят секунды. «Мы воспользовались простым выпадающим меню и проинструктировали чатбота написать более длинное и казуальное сообщение, и он сгенерировал очень теплый ответ с выражением восхищения высказанными в переписке идеями и радости от участия в проекте - хотя никто из нас не прочитал ни одного сообщения», - говорится в публикации BBC. Предложенный роботом вариант можно было отредактировать или отправить как есть. Никаких упоминаний о том, что основной контент был сгенерирован роботом, в письме не было. Copilot также всего за 43 секунды подготовил многостраничную презентацию в PowerPoint на основе документа в Word. В качестве иллюстраций робот может использовать изображения в исходном документе или найти подходящие в собственной коллекции изображений (очищенных в плане копирайта). Инструкцию сделать презентацию более яркой робот не понял. Что же касается работы с Microsoft Teams, то здесь Copilot может не только суммировать сразу несколько тем, по которым производились высказывания, но и законспектировать слова одного конкретного пользователя, а также выделить главное в разгоревшемся споре, приведя основные аргументы обеих сторон. На данный момент робот способен отличить спикеров только если они используют уникальные устройства каждый. Если за одним устройством - сразу два человека, то Copilot отличит, кто есть кто, лишь в том случае, если они называют друг друга вслух. На вопрос к сотруднику Microsoft, не приведет ли использование этого робота к тому, что работники просто перестанут участвовать в подобных голосовых конференциях, тот отшутился, что тогда, вероятно, множество таких мероприятий превратятся в вебинары. И что дальше? Критики разработки уже говорят о том, что он сильно изменит ситуацию с офисной и административной работой, а кроме того, может вызвать излишнюю зависимость людей от себя. «Что случится, если в инструменте произойдет сбой или его взломают? - задается вопросом Карисса Велиз (Carissa Veliz), доцент Института этики искусственного интеллекта при Оксфордском университете. «Это может стать кратковременным сбоем, а может - причиной новых ограничений, которые вам не понравятся. Ну, и что будет, если вы поймете, что уже настолько привыкли к системе, что не можете без нее обходиться вовсе? Что тогда?», - продолжает Карисса Велиз. По мнению генерального директора компании «Информационные технологии будущего» Дмитрия Гвоздева, одной из сложнейших проблем с искусственным интеллектом, о которой ученые и фантасты говорят на протяжении десятилетий является возможная «замена» человека машиной. «И хотя есть большой соблазн сравнить нынешнее положение дел с любой из предыдущих промышленных революций (а напуганных такой перспективой - с членами, например, луддитского движения), ИИ делает отличия довольно существенными», - развивает мысль Дмитрий Гвоздев. Он считает, что на этот раз машина избавляет человека не столько от физической, сколько от интеллектуальной нагрузки, а человек устроен так, что без нагрузки его органы и конечности быстро деградируют и мозга это тоже касается. «Сейчас, конечно, удобнее думать, что речь идет только о рутинных, монотонных и не требующих серьезных умственных усилий задач. Но, если гипертрофировать ситуацию, легко представить, что даже некоторыми базовыми навыками в общении (к примеру) следующее поколение офисных работников обладать просто не будет», - подытожил Дмитрий Гвоздев. Copilot станет доступен пользователям Microsoft 365 с 1 ноября. Ежемесячная плата за него составит 30 долларов. Источник https://www.cnews.ru/news/top/2023-10-27_chatbot_microsoft_gotov_uchastvovat |
Искусственный интеллект может привести к гибели информации, заявил Пушков
Искусственный интеллект может привести к гибели информации. Еще сложнее будет отличить фейки от правдивых и объективных материалов (объективные только из отдела пропаганды Кремля). Так считает глава Комиссии СФ по информационной политике и взаимодействию со СМИ Алексей Пушков. |
TECNO представила Universal Tone — технологию для корректной передачи оттенков и текстуры кожи при съёмке на смартфон
TECNO представила свою последнюю разработку в области мобильной съёмки — технологию TECNO Universal Tone, созданную для корректной передачи оттенков и текстуры кожи при съёмке на смартфон. https://3dnews.ru/assets/external/il...29/image_1.jpg Источник изображения: TECNO TECNO Universal Tone объединяет обновлённую базу спектральных и аналитических данных, позволяя отразить особенности различных национальностей, обеспечивая возможность создания портретных снимков в соответствии с индивидуальными ожиданиями пользователей по всему миру. Для усовершенствования технологии были привлечены ученые-колористы из различных университетов мира. По словам Джека Гуо (Jack Guo), гендиректора TECNO, в технологии используется строгий научный подход, основанный на данных, для создания более точных и качественных изображений и обеспечения более естественного отображения красоты пользователей по всему миру. TECNO Universal Tone использует алгоритмы на базе искусственного интеллекта: Multi-Skin Tone Restoration Engine — ИИ-алгоритм визуализации тона кожи, основанный на диверсифицированной спектральной базе данных. Local-Tuning Engine — алгоритм, предназначенный для настройки камер под различные сценарии, который анализирует окружающую среду, условия освещения, геоморфологические ландшафты и температуру, чтобы создать гармоничный кадр с учётом специфики региона. AI-Powered Computational Portrait Engine — ИИ-алгоритм, который персонализирует изображение в соответствии с эстетическими элементами бьютификации, повышая точность определения тона кожи и оптимизируя его отображение, а также предлагая персонализированные улучшения портрета. В процессе съёмки алгоритм Multi-Skin Tone Restoration Engine настраивает камеру для более точного и естественного отображения различных оттенков кожи, затем Local-Tuning Engine анализирует окружающую среду для восстановления теней с учётом региона и сценария и, наконец, AI-Powered Computational Portrait Engine применяет персонализированный алгоритм, соответствующий эстетическим и культурным предпочтениям разных стран. Технология TECNO Universal Tone позволит подчеркнуть индивидуальность пользователей по всему миру, а также улучшить опыт при создании портретов. Источник: https://3dnews.ru/1095229/tecno-pre...enkov-i-teksturi-kogi-pri-syomke-so-smartfona |
NVIDIA наделит сотрудников сверхспособностями с помощью ИИ, который будет помогать в разработке чипов
Компания NVIDIA не только активно продвигает системы генеративного искусственного интеллекта среди клиентов, но и использует их для оптимизации собственных бизнес-процессов. Использующий накопленный разработчиками компании за 30 лет опыт ИИ-чат-бот помогает начинающим инженерам получать ответы на часто задаваемые вопросы, не отвлекая от работы более опытных коллег. Кроме того ИИ предложено использовать для генерации программного кода и работы с ошибками в чипах. https://3dnews.ru/assets/external/il.../nvidia_01.jpg Источник изображения: NVIDIA О данной сфере применения ИИ на этой неделе рассказал ведущий научный сотрудник NVIDIA Билл Дэлли (Bill Dally). В опубликованной статье подробно рассказывается о том, как инженеры NVIDIA создали для внутреннего использования собственную большую языковую модель под названием ChipNeMo, обученную на внутренних данных компании для генерации и оптимизации программного обеспечения и помощи людям, занимающимся проектированием чипов. Компания загрузила в языковую модель собственные архивы документации за 30 лет, связанные с разработкой полупроводниковых компонентов. Как пояснил научный руководитель NVIDIA, на практике опытные разработчики достаточно много времени уделяют ответам на вопрос своих младших коллег, и если эту функцию поручить искусственному интеллекту, то у наиболее ценных сотрудников высвободится больше времени на разработку чипов. По словам представителя NVIDIA, такой чат-бот может добиться достаточно высокой эффективности при умеренных затратах на его развитие, если в систему будет подгружаться более узконаправленная информация, учитывающая предыдущий опыт компании. Разумный подход к расходованию системных ресурсов позволяет снизить затраты на реализацию соответствующих проектов. Чат-бот помогает инженерам искать необходимую документацию в архиве, не отвлекая своих коллег. Ещё одна перспективная сфера применения генеративного искусственного интеллекта при разработке чипов NVIDIA — это написание фрагментов программного кода. ИИ-генератор кода уже разрабатывается, и его планируется интегрировать в существующие инструменты разработки чипов. Также ИИ способен помочь в документировании найденных дефектов в разработанных чипах. Система искусственного интеллекта будет достаточно быстро справляться с этой задачей и высвобождать ресурсы разработчиков для других операций. «Наша задача заключается не в том, чтобы автоматизировать процесс или заменить людей, но наделить имеющихся у нас сотрудников сверхспособностями с целью повышения производительности их работы», — пояснил Билл Дэлли. А Марк Рен (Mark Ren), директор по исследованиям NVIDIA и ведущий автор статьи, отметил: «Я считаю, что со временем большие языковые модели помогут всем процессам [разработки чипов]». На этом примере NVIDIA показала возможности применения экосистемы NeMo для оптимизации больших языковых моделей, используемых в полупроводниковой отрасли и других сферах промышленности. Клиенты и партнёры NVIDIA могут взять на вооружение данные средства, чтобы повысить эффективность собственных бизнес-процессов. Тонко настраиваемые специализированные языковые модели могут демонстрировать гораздо более высокую производительность, чем более ресурсоёмкие модели общего назначения. Источник: https://3dnews.ru/1095257/nvidia-primenyaet-chatbot-pri-razrabotke-sobstvennih-chipov |
Unity представила Muse — ИИ-инструменты, которые избавят разработчиков игр от рутины
Разработчики игрового движка Unity на сегодняшней конференции Unite Unite объявили, что их ИИ-платформа Muse стала официально доступна для общего использования в формате раннего доступа. Muse представляет собой пакет инструментов на базе ИИ, предназначенный для оптимизации процесса разработки игр и снижения количества «ручного» кодирования. Пакет был представлен ещё в июле 2023 года, а теперь стал доступен по подписке за $30 в месяц. https://3dnews.ru/assets/external/il...unity-muse.jpg Источник изображения: Unity Unity Muse описывается компанией как «постоянно расширяющийся набор функций на базе искусственного интеллекта» и предназначен для разработчиков всех уровней квалификации. Платформа позволяет генерировать программный код в процессе взаимодействия с чат-ботом. Бот также может прогнозировать и предлагать дальнейшие шаги разработки, поскольку располагает полным доступом к библиотеке ресурсов платформы. В качестве примера можно упомянуть инструмент, специально разработанный для помощи начинающим дизайнерам Metroidvania при создании 2D-спрайтов. Он автоматически генерирует спрайты, соответствующие заранее заданным параметрам, и предлагает пользователю несколько вариантов на выбор. Muse предлагает аналогичный процесс для создания спрайтов и текстур, применяемых как в 2D-, так и в 3D-проектах. Все эти инструменты обучены исключительно на данных и изображениях, которыми владеет или лицензирует Unity, поэтому разработчики не столкнутся с претензиями от правообладателей. Кроме того, Unity заявляет, что результаты Muse никогда не будут содержать «людей, логотипы или узнаваемые художественные стили». https://www.youtube.com/watch?v=dR4IuN2tF78 По утверждению Unity, инструменты генерации спрайтов и текстур — это только начало. В ближайшие месяцы пакет Muse, среди прочего, будет дополнен механизмами ИИ для анимации персонажей и настройки поведения NPC. Подписчики Muse также получат доступ к платформе быстрого прототипирования и совместной работы под названием Sketch. На конференции Unite Unite компания также подробно рассказала о будущем нейронном движке Sentis, который выходит далеко за рамки генерирования спрайтов и текстур, поскольку может решать сложные проблемы кодирования и даже создавать новые внутриигровые функции с нуля. Sentis в настоящее время находится на стадии открытого бета-тестирования и будет представлен публике в следующем году. Компания также анонсировала набор облачных инструментов для совместной работы и пообещала выпустить долгожданную шестую версию Unity в 2024 году. Похоже, что скоро чат-боты и другие помощники на базе ИИ станут ключевыми инструментами разработки в арсенале гейм-дизайнера. Написание кода уходит в прошлое и, как не грустно, это становится главной тенденцией в отрасли. Не исключено, что скоро ИИ начнёт выпускать игры исключительно для других ИИ. ИИ станут играть в компьютерные блокбастеры, а мы вспомним лапту, городки и другие забавы на свежем воздухе. Источник: https://3dnews.ru/1096092/unity-zap...ta-muse-kotoriy-zametno-uprostit-sozdanie-igr |
Meta✴ представила ИИ-инструменты для создания и редактирования видео
Meta✴ представила два новых инструмента, в основу которых положены алгоритмы искусственного интеллекта — они позволяют генерировать и редактировать видеоролики по простому текстовому описанию. Впоследствии эти материалы могут публиковаться на принадлежащих компании платформах Instagram✴ или Facebook✴. https://3dnews.ru/assets/external/il...u_Video_01.jpg Источник изображения: Meta✴ Первый инструмент получил название Emu Video — он генерирует видеоролики продолжительностью до четырёх секунд, основываясь на простом текстовом описании, фотографии, рисунке или сочетании этих исходных данных. Второй назвали Emu Edit, и он помогает пользователям так же по текстовому описанию редактировать уже имеющиеся видеоролики. https://giphy.com/gifs/t75wahD8DRQsgKAa3y https://giphy.com/gifs/t75wahD8DRQsgKAa3y Оба инструмента основаны на ИИ-модели Emu, первоначально предназначавшейся для генерации изображений по текстовому описанию. Нейросеть Emu также легла в основу некоторых функций генеративного ИИ, позволяющих редактировать изображения перед их публикацией в Instagram✴ — к примеру, они позволяют изменять визуальный стиль или фон фотографии. С момента запуска службы ChatGPT большое число компаний начало активно внедрять продукты с использованием технологий генеративного ИИ. Наибольших успехов добились технологические гиганты в лице Amazon, Google, Microsoft и Meta✴. Гигант соцсетей начал активно развивать направление ИИ и внедрять функции на основе генеративных моделей. Источник: https://3dnews.ru/1096143/meta-predstavila-iiinstrumenti-dlya-sozdaniya-i-redaktirovaniya-video |
DeepMind представила передовой ИИ для создания музыки и песен
Британская команда разработчиков утверждает, что ее модель способна генерировать высококачественный вокал, тексты песен и музыкальное сопровождение, имитирующее стиль исполнения популярных артистов. Экспериментировать с Lyria можно будет в рамках двух проектов, который запускают на YouTube. По мнению DeepMind, он станет «открытой игровой площадкой для творчества». «Сегодня в партнерстве с YouTube мы анонсируем Lyria, самую передовую модель ИИ для генерации музыки, созданную Google DeepMind, и два эксперимента, формирующих новую площадку для творчества», — говорится в блоге компании. Эксперимент Dream Track «поможет углубить связь музыкантов с публикой», а Music AI tools предоставляет им набор инструментов для творчества. DeepMind не раскрывает технических подробностей ИИ Lyria, разве что называет ее «самой передовой» музыкальной системой искусственного интеллекта. «Модель Lyria превосходно справляется с генерацией высококачественной музыки с аранжировкой и вокалом, выполняет задачи трансформации и продолжения, дает пользователям больше рычагов управления стилем и исполнением», — сказано в описании модели. В эксперименте Dream Track сможет принять участие ограниченный круг пользователей, которым разрешат создать уникальные музыкальные композиции, выдержанные в стиле популярных исполнителей, давших свое согласие на использование своих песен для обучения модели Lyria. Участники эксперимента смогут записывать саундтреки длиной 30 секунд, которые потом будут выложены в виде коротких роликов в YouTube Shorts. Ниже — пара примеров. https://www.youtube.com/watch?v=1gjuHUy0IMM https://www.youtube.com/watch?v=F4Ngs4mZ5cY Кроме того, выступая за ответственное использование технологий ИИ, DeepMind использует SynthID для нанесения «водяных знаков» на созданные Lyria музыкальные материалы. И призывает деятелей искусства и представителей музыкальной индустрии сформулировать стандарты ответственной разработки и распространения инструментов генерации музыки. Lyria и другие музыкальные ИИ могут совершить революцию в музыкальной индустрии, утверждает Venture Beat. Вооружив исполнителей и композиторов передовыми инструментами, Google может демократизировать процесс производства музыки, сделав его более простым и доступным. Он же, вероятно, лишит заработка тысячи музыкантов. В любом случае, появление мощного ИИ на YouTube укрепит позиции Google в сфере передовых технологии для творчества. Весной Google выпустила MusicLM — ИИ-инструмент, который превращает текстовые описания в музыку. Приложение позволяет пользователям вводить запрос, например «душевный джаз для званого обеда» или «гипнотический индустриальный техно-звук». Источник https://hightech.plus/2023/11/17/deepmind-predstavila-peredovoi-ii-dlya-sozdaniya-muziki-i-pesen |
| Время: 05:59 |