Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.
Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.
Неделя выдалась насыщенной: xAI выкатила дешёвый и быстрый Grok 4 Fast, новые релизы от Alibaba и Luma. Figma и Google Chrome теперь с нейросетями, Meta* представила очки с ИИ-фильтром, а хакеры в Корее вовсю используют ИИ.
Всё самое важное — в одном месте. Поехали!
📋 В этом выпуске:
🧠 Модели и LLM
Grok 4 Fast — дешёвый и быстрый
DeepResearch от китайцев на уровне OpenAI
🎨 Генеративные нейросети
Wan 2.2 Animate — дипфейки на максималках
ComfyUI в облаке
Reve — ещё один конкурент NanoBanana
Luma Labs Ray 3 — думающий генератор видео
🔧 AI-инструменты и платформы
Figma теперь с ИИ
В Google Chrome встроили Gemini
Gamma 3.0 — обновление ИИ для презентаций
🧩 AI в обществе и исследованиях
ИИ смог бы обзвонить всю планету за 6 суток
AI очки от Meta*
Хакеры из КНДР начали использовать ИИ-картинки для атак
xAI представила модель Grok 4 Fast — гибридную модель с 2 млн токенов контекста и скоростью 300 токенов в секунду.
Цены приятные: $0.2/$0.5 за 1М токенов при контексте до 128k и $0.4/$1 за 1М токенов, если контекст длиннее.
И это в 50 раз дешевле Grok 4.
Две недели модель прятали под названиями Sonoma Sky/Dusk на OpenRouter.
По другим тестам:
— в 4 раза дешевле DeepSeek V3.1
— в 6 раз дешевле Gemini 2.5 Flash
— reasoning Grok 4 Fast в 2 раза дешевле GPT-OSS 120B и Grok 3 Mini.
Сейчас модель доступна бесплатно на OpenRouter.
🔗 OpenRouter 🔗 Artificial Analysis
Alibaba представила Tongyi DeepResearch — первую открытую модель, которая по качеству догнала оригинальный Deep Research от OpenAI.
Она создана для глубокого сбора фактов из интернета: на вход поступает вопрос, а модель сама планирует шаги, ищет информацию в источниках, синтезирует промежуточные данные и выдает финальный отчет.
По бенчмаркам:
В обычном режиме модель выдаёт 32.9 балла на бенчмарке Humanity's Last Exam.
Существует Heavy Mode, в котором несколько агентов вместе работают над одним отчётом. С ним результаты на том же бенчмарке вырастают до 38.3.
Модель основана на Qwen 30B-A3B, поэтому её запуск на локальных машинах не должен быть проблемой. Код и веса уже выложены в открытый доступ.
🔗 Официальный релиз Alibaba 🔗 Код 🔗 Веса
Alibaba представила Wan 2.2 Animate — новую открытую модель, которая умеет переносить движения из видео на персонажа и заменять его в кадре. Для анимации достаточно загрузить изображение персонажа и эталонное видео — модель повторит все движения и мимику источника.
Работает в двух режимах:
Animation Mode — переносит движения из референсного видео на статичного персонажа.
Replacement Mode — полностью заменяет персонажа в оригинальном ролике, автоматически подстраиваясь под освещение и окружение.
Модель имеет 14 млрд активных параметров (27 млрд — общих, благодаря MoE-архитектуре) и генерирует видео в качестве до 720p при 24fps.
Она точно копирует мимику, движения пальцев и работает с любыми персонажами, от реальных людей до аниме.
Для генерации видео требуется мощное железо: на A100 80GB процесс занимает около 3 минут, но с оптимизациями модель можно запустить и на RTX 4090.
🔗 HuggingFace 🔗 GitHub 🔗 Официальный сайт 🔗 Веса для ComfyUI
ComfyUI запустили облачную платформу для генерации контента прямо в браузере. Теперь не нужно ничего скачивать и обновлять — всё работает на любом устройстве.
Принцип простой: вы собираете нужные узлы (пайплайны) в визуальном редакторе, а система сама обрабатывает схему и выдаёт результат без необходимости писать код.
Например, можно собрать цепочку: узел «Промпт» → Модель для генерации изображений → Сохранение.
Обещают бесплатный доступ, но пока платформа работает в режиме закрытого тестирования.
Вышел Reve — новый ИИ-редактор изображений с щедрыми лимитами. Его генеративная модель ещё в марте заняла первое место на арене, обогнав Midjourney и Google Imagine.
Ключевые фичи:
Генерирует 4 варианта картинки и сам объясняет текстом, что именно поменял.
Drag-and-drop редактор, в котором можно двигать объекты по сцене, как в Photoshop.
Вместо сложных промптов для правок используется чат-ассистент.
Есть функция Edit, которая раскладывает картинку на составные части для удобного редактирования.
Доступен API для интеграции в другие сервисы.
Цензура в редакторе почти отсутствует, а кредиты для генерации выдают ежедневно. Если вам нравятся NanoBanana и SeeDream, Reve точно стоит попробовать.
Luma Labs выпустила новую видеомодель Ray 3, которая генерирует ролики длиной 5 или 9 секунд в качестве 1080p 16-bit HDR.
Реальные результаты пользователей пока далеки от официальных примеров. Лица и детализация плывут.
Как работает:
Сначала LLM-модель переписывает и детализирует ваш промпт.
При генерации 9-секундного видео сначала создаётся 5-секундный фрагмент, который затем расширяется ещё на 5 секунд с перехлёстом в одну секунду. Это говорит о том, что базовая модель, скорее всего, ограничена пятью секундами.
Есть Draft Mode, который генерирует быстрее, но в качестве 640×352.
Бесплатно можно генерировать только в нём. На платной подписке за $10 в месяц можно создать примерно шесть 9-секундных роликов в 1080p, после чего придётся доплачивать. Генерация одного такого видео занимает 5–6 минут.
Figma запустила революционную функцию «Prompt to edit». Больше никакого ручного пиксель-пушинга — теперь редактировать дизайны можно обычными текстовыми командами.
Что можно делать:
Массово редактировать несколько фреймов одновременно.
Добавлять контент — вставлять картинки и текст по описанию.
Быстро делать ресайзы, например, генерировать мобильные версии из desktop-макетов.
Создавать вариации, переключаясь между светлой и тёмной темой одним промптом.
Собирать новый UI с нуля, создавая компоненты текстовыми командами.
Функция пока в закрытой альфе для 5000 пользователей на платных тарифах, но является частью большой стратегии Figma по интеграции ИИ.
Дизайн больше никогда не будет прежним.
Google выпустил одно из самых крупных обновлений для Chrome, встроив в браузер нейросеть Gemini. Общаться с ИИ теперь можно прямо в адресной строке.
Главное из обновления:
Скоро появится возможность бронировать услуги, оформлять заказы и собирать информацию из нескольких вкладок.
Встроенный Gemini Nano отвечает за безопасность: он детектит скам и фишинг.
Появится смена паролей в один клик и поиск по истории.
Обновление доступно бесплатно и не требует подписки Google AI. Пока работает только на Windows и Mac в США и на английском языке.
🔗 Источник
Вышло крупное обновление Gamma 3.0 — популярной нейронки для создания презентаций, документов и сайтов.
Теперь сервис работает с полноценным ИИ-агентом, который сам ищет информацию в интернете, работает с референсами и вносит правки по текстовому промпту.
Платформа превращает идею в готовый визуальный проект с текстом и оформлением по одному запросу, а также поддерживает русский язык.
В бесплатной версии пользователи получают 400 кредитов при регистрации, которых хватит на несколько проектов. В платных тарифах увеличили лимиты и добавили доступ к API для автоматизации задач.
Современные голосовые ИИ-ассистенты способны обзвонить 8,2 млрд человек примерно за шесть суток. Такой оценкой поделилась директор по разработке компании Neuro.net Мария Бых.
Расчёт основан на том, что ИИ вроде GPT-4 отвечает быстрее человека (менее 100 мс против 200 мс) и может вести миллион параллельных разговоров.
Однако эксперт отмечает, что это чисто математическая гипотеза. На практике задача займёт несколько месяцев из-за множества ограничений: не у всех есть телефоны, часть звонков не пройдёт, а законы многих стран, разница в часовых поясах и необходимость повторных попыток сильно усложняют процесс.
Для реализации такого проекта потребовалась бы инфраструктура, сопоставимая с мощностями крупнейших мировых IT-гигантов. Пока глобальный обзвон остаётся мифом, но национальные системы оповещения уже эффективно работают.
🔗 Источник
Meta* представила умные очки Ray-Ban Display со встроенным дисплеем. Марк Цукерберг назвал их «идеальным форм-фактором для персонального суперинтеллекта», который позволит получать доступ ко всем возможностям ИИ, оставаясь в настоящем моменте.
Новые очки за $800 оснащены небольшим цифровым дисплеем в правой линзе для просмотра уведомлений, камерами, динамиками и микрофонами. Они работают до 6 часов (до 30 часов с чехлом), весят всего 69 граммов и имеют 32 ГБ памяти.
*Meta признана экстремистской организацией и запрещена в РФ
🔗 Источник
Северокорейские хакеры из группировки Kimsuky применили ChatGPT для генерации поддельных удостоверений личности, которые затем использовались в фишинговых кампаниях против граждан Южной Кореи. Об этом говорится в отчете южнокорейской компании Genians.
Злоумышленники создавали фальшивые изображения документов с помощью чат-бота, а затем рассылали их в письмах, содержащих ссылки на вредоносное ПО для кражи данных. Целями атак стали южнокорейские журналисты, исследователи и правозащитники, чья деятельность связана с Северной Кореей.
Исследователи Genians подтвердили, что, несмотря на запреты ChatGPT на создание госудостоверений, эти ограничения можно обойти, изменив формулировку запроса. Ранее северокорейские хакеры уже использовали ИИ для получения удаленной работы в американских технологических компаниях. OpenAI заявляла о блокировке подозрительных аккаунтов из КНДР, однако, как видно, эти меры оказались не до конца эффективными.
🔗 Источник
На этой неделе всё! Grok 4 Fast от Маска задал новый тренд: гонка теперь идёт не только за мощностью, но и за максимальной эффективностью. Китайцы из Alibaba продолжают радовать крутыми опенсорс-релизами, от дипфейков в Wan 2.2 до исследовательского агента Tongyi DeepResearch.
Инструменты для профи становятся умнее: ИИ в Figma и Gamma уже меняет правила игры для дизайнеров, а облачный ComfyUI делает генерацию доступнее. В то же время история с хакерами из КНДР напоминает, что у каждой технологии есть и тёмная сторона.
До встречи в следующем выпуске!
Новости, обзоры продуктов и конкурсы от команды Timeweb.Cloud — в нашем Telegram-канале ↩