В сентябре 2025 года мы увидели как вместо одной гигантской нейросети с миллиардами параметров рождается федерация интеллектов — распределённая экосистема, где небольшие модели обмениваются знаниями, координируют усилия и достигают результатов, недоступных каждой из них поодиночке.
В этом обзоре вы узнаете, как ИИ научился открывать новое научное знание, создавать игровые миры и понимать реальность через смыслы, проектировать сложные системы и даже управлять дронами. В финале вы узнаете чем наш мозг похож на большую языковую модель.
Если хотите быть в курсе новейших исследований в области ИИ, подписывайтесь на Dataism Science Hub — там ежедневно выходят обзоры свежих научных публикаций. А ещё приглашаю в мой Telegram-канал: здесь я делюсь кейсами внедрения ИИ в бизнес, опытом создания стартапов и личными мыслями о будущем технологий.
Поехали!
Когда-то развитие языковых моделей измеряли числом параметров. Сегодня на первый план выходит то, как модель думает. K2-Think — 32-миллиардная модель, которая показала, что интеллект начинается не с размера, а с архитектуры рассуждения.
Исследователи выстроили трёхступенчатую систему, где каждая стадия обучает модель не просто решать задачи, а вести внутренний диалог. Сначала — длительная настройка на длинных цепочках размышлений, формирующих ритм и структуру мысли. Затем — обучение с подкреплением, где вознаграждение даётся только за проверяемые решения, превращая процесс обучения в интеллектуальную самопроверку. И, наконец, во время инференса модель действует как исследователь: строит план, делает несколько попыток, выбирает наилучший результат.
Так рождается интеллект, который не просто отвечает, а размышляет. На математических и программных бенчмарках K2-Think уверенно конкурирует с моделями в десять раз превосходящими её по размеру. Главное достижение не в параметрах, а в синергии подходов: длинный SFT задаёт стиль мышления, RL шлифует уверенность, а тест-тайм-планирование превращает вычисления в осмысленный поиск.
K2-Think становится примером нового типа моделей — тех, что думают стратегически. Так интеллект становится функцией организации мысли.
Если раньше ИИ-агенты действовали как актёры в заранее прописанной пьесе, то теперь они учатся самоорганизации — искать партнёров, делить задачи и вырабатывать общее решение. Проект Federation of Agents (FoA) показывает, как ИИ-системы переходят от жёстких ролей к живому сотрудничеству, где связи формируются не по сценарию, а по смыслу.
В основе FoA лежит идея Versioned Capability Vectors (VCV) — машиночитаемых профилей способностей. Каждый агент описывает, что он умеет, сколько это стоит по времени и ресурсам, какие правила и политики он соблюдает. Эти профили индексируются в семантическом пространстве, так что оркестратор может не просто назначить исполнителя, а динамически собрать команду из агентов, наиболее подходящих по смыслу и стоимости.
Архитектура строится на лёгком и надёжном протоколе MQTT, что делает систему устойчивой даже в слабых сетях, включая IoT. Задачи раскладываются на DAG-графы, подзадачи распределяются между агентами, черновики синхронизируются в малых кластерах, а итоговое решение проходит несколько раундов критики и голосования. На медицинском бенчмарке HealthBench Hard FoA показал кратный рост эффективности: в 13 раз лучше одиночных агентов и в 6,5 раз — некоординированных ансамблей.
FoA создаёт новую парадигму — агентную федерацию, где системы объединяются не приказом сверху, а через смысловую совместимость. Это шаг к распределённому интеллекту, где каждый агент остаётся автономным, но способен к коллективному действию, как клетка в живом организме.
Так формируется федеративная ткань ИИ-мира, связывающая исследовательские агенты, промышленные системы и воплощённые устройства — от лабораторий до дронов. Это не просто новая архитектура, а модель цифрового общества, где интеллект становится сетевым, подотчётным и самонастраивающимся.
Если K2-Think научил модель думать, то InfoAgent делает следующий шаг — учит её искать правду. В новой парадигме ИИ не ограничивается внутренним рассуждением: он выходит во внешний мир, проверяет факты и возвращается с результатами. Так формируется исследовательский тип ИИ, для которого поиск — это не команда, а стратегия.
InfoAgent превращает LLM в полноценного веб-агента — «детектива знаний», способного самостоятельно планировать шаги, строить гипотезы, читать источники и возвращаться к предыдущим веткам, если след зашёл в тупик. Архитектура вдохновлена идеей ReAct — чередованием размышлений и действий, — но усовершенствована: агент работает на собственной поисковой инфраструктуре, анализирует сниппеты и тексты напрямую, а не через готовые API. Это делает процесс прозрачным, управляемым и пригодным для обучения с подкреплением.
Ключевой шаг — обучение на длинных траекториях поиска: около двадцати шагов рассуждений, уточнений и проверок, после чего агент совершенствует стратегию через RL, получая награды за точность и глубину. Результат впечатляет: на сложных задачах вроде BrowseComp и WebWalkerQA InfoAgent уверенно соревнуется с системами куда большего масштаба, а на базовых бенчмарках достигает почти идеальной точности.
Главный вывод прост: интеллект без умения искать — половина дела. InfoAgent показывает, что достоверность рождается не из объёма данных, а из дисциплины мысли — привычки сомневаться, уточнять и проверять. Это уже не просто модель, а агент, который мыслит в контексте мира — второй шаг к федерации агентов, где ИИ перестаёт быть замкнутым и учится взаимодействовать с реальностью.
После того как модели научились думать (K2-Think) и искать (InfoAgent), следующий шаг был неизбежен — научиться открывать новое. Так рождается Agentic Science — научная федерация, где ИИ становится не инструментом, а соавтором.
Современные агентные системы уже ведут себя как исследователи: читают литературу, формулируют гипотезы, планируют эксперименты, управляют лабораторными роботами, анализируют результаты и даже исправляют собственные ошибки. Это не автоматизация, а переход к когнитивному сотрудничеству, где человек и машина делят не роли, а процесс мышления.
В основе — пять ключевых способностей, которые формируют «научный разум»: планирование и рассуждение, интеграция инструментов, память, взаимодействие между агентами и самообучение. Вместе они создают замкнутый, но адаптивный цикл познания — от наблюдения до синтеза нового знания. Уже сегодня в химии ИИ самостоятельно проектирует материалы, в биотехнологиях находит новые терапевтические цели, а в физике управляет симуляциями, где человек раньше не успевал за масштабом данных.
Главные вызовы остаются человеческими: прозрачность и воспроизводимость. Учёным нужно понимать, как агент пришёл к выводу, и уметь повторить его путь. Но направление очевидно: учёный становится стратегом и редактором, направляющим процесс, а не механическим исполнителем.
Мечта исследователей — «Нобелевский тест Тьюринга»: момент, когда ИИ совершит открытие нобелевского уровня и его вклад признают равным человеческому. Так Agentic Science воплощает ядро будущей федерации агентов — объединение человеческой интуиции и машинного мышления в едином цикле познания.
Если наука — это пространство логики, то игры — пространство воображения. И именно здесь федерация агентов проходит проверку на креативность. Проект V-GameGym впервые ставит перед ИИ не инженерную, а творческую задачу: не просто написать код, а построить живой, играбельный мир.
Создание игры — это синтез алгоритмов, эстетики и ритма, где важны не только вычисления, но и чувство темпа, баланса и визуальной гармонии. Исследователи собрали 2 219 примеров реальных игр на Python и Pygame, добавили визуальные демо и обучили мультимодальную систему оценки, которая анализирует не только код, но и скриншоты, и видео. Так родился первый бенчмарк, измеряющий не корректность, а “играбельность” — качество опыта, которое чувствует игрок.
Результаты честные: даже гиганты вроде GPT-5 и Qwen3-Coder-480B показывают высокий уровень кода, но пока слабо передают живость и эстетику. Настоящая игра требует равновесия — между логикой, графикой и движением, — а это то, что рождается в кооперации разных агентов: программиста, художника, тестировщика, дизайнера. Авторы предлагают двигаться именно туда — к мультиагентным системам, где каждый модуль берёт на себя творческую роль, а результат оценивает общий критик.
V-GameGym знаменует переход от генеративного текста к генеративному миру. Это лаборатория, где ИИ учится не просто строить системы, а создавать опыт, и где ИИ впервые пробует на вкус коллективное воображение. В федерации агентов такие проекты становятся основой для креативных индустрий нового типа — там, где идея, код и эмоция рождаются вместе.
Если предыдущие исследования учили ИИ думать, искать и творить, то теперь он учится видеть смыслы. Проект VLWM (Vision Language World Model) делает решительный поворот в сторону осмысленного восприятия: модель больше не предсказывает пиксели — она предсказывает будущее в словах.
VLWM объединяет зрение, язык и планирование в единую когнитивную петлю. Вместо генерации кадров она формулирует цель, выстраивает шаги и описывает, как изменится мир после каждого действия. Так рождается текстовая модель будущего, где мир представлен не как поток картинок, а как система взаимосвязанных смыслов. Это делает рассуждения прозрачными, проверяемыми и во много раз дешевле вычислительно.
Чтобы превратить видео в осмысленные сценарии, авторы создают иерархическое дерево подписей — каждый фрагмент превращается в краткое описание, из которых LLM по схеме self-refine извлекает цель, шаги и изменения состояния. Поверх этого строится двойной режим мышления: System-1 — быстрый и реактивный, System-2 — вдумчивый и критический, перебирающий возможные траектории и минимизирующий «стоимость» действий.
Результаты говорят сами за себя: VLWM-8B ставит рекорд на Visual Planning for Assistance и получает +27% рейтинга Elo в человеческих оценках при активации System-2. Её критик-оценщик показывает SoTA-точность на WorldPrediction-PP, доказывая, что языковая модель может выступать надёжной функцией вознаграждения — внутренним совестным модулем для ИИ.
VLWM показывает, как язык становится новым зрением, а зрение — новым языком. Это шаг к агентам, которые не просто реагируют, а понимают контекст и строят прогнозы, превращая восприятие в рассуждение. В федерации агентов такие модели становятся глазами и интуицией коллективного интеллекта — тем, кто видит не кадры, а целую картину мира.
Когда ИИ научился думать, искать, творить и видеть, следующий шаг был очевиден — действовать. Сегодня автономные агенты покидают лаборатории и выходят на рынки, где решения принимаются не людьми, а самими системами. Так рождается агентная экономика — сеть цифровых рынков, где ИИ-игроки договариваются, торгуют данными, распределяют ресурсы и конкурируют за выгоду своих владельцев.
Пока этот мир растёт стихийно. Агенты подключаются к существующим сервисам без ограничений, стандарты вроде A2A и MCP ускоряют совместимость, и экономика начинает жить на машинных скоростях. Это приносит эффективность, но также риски — от мгновенных сбоев ИИ до нового цифрового неравенства между теми, у кого агенты сильнее, быстрее и богаче данными.
Исследователи предлагают навести порядок до того, как экономика выйдет из-под контроля. В их модели появляются аукционные механизмы для справедливого распределения вычислений и данных, рынки, где стимулы настраиваются под общественные цели, и специальные валюты, отделяющие быстрые агентные транзакции от человеческих. Основание всей системы — идентичность и репутация: децентрализованные удостоверения, проверяемые достижения и неизменяемые журналы операций. Надзор строится по трёхслойной схеме — от автоматического мониторинга до эскалации человеку, а безопасность обеспечивают криптографические доказательства и Zero-Knowledge-протоколы.
Главная идея — не остановить рынок, а встроить в него общественные цели. Если агенты будут действовать в среде, где выгода связана с пользой, а не с хаосом, экономика машин станет продолжением человеческой — не угрозой, а новым уровнем кооперации. Так федерация агентов выходит из теории в практику: формируя пространство, где интеллект, данные и ценность начинают циркулировать как новая кровь цифрового общества.
Если раньше агенты умели рассуждать и искать решения, то теперь они учатся строить системы — не отдельные функции, а полноценное программное обеспечение. Проект ZeroRepo и его ядро — Repository Planning Graph (RPG) — показывают, как ИИ превращает хаос генерации кода в осмысленное проектирование.
RPG — это язык архитектуры для машин. В его узлах живут файлы, классы и функции, а рёбра описывают потоки данных и зависимости, превращая проект в живой граф смыслов. Такой формат позволяет агенту видеть не текст, а структуру системы, понимать контекст, порядок сборки и взаимосвязи между модулями. Код больше не рождается строчка за строчкой, а вырастает по плану — как организм, где каждая часть знает своё место.
Процесс сборки напоминает инженерный конвейер: сначала система выбирает релевантные функции из огромного дерева возможностей (более 1,5 млн узлов), затем формирует файловую структуру, интерфейсы и типизированные связи, а после — генерирует код по топологическому порядку, валидируя каждый узел тестами. Новый бенчмарк RepoCraft, включающий аналоги scikit-learn, pandas и Django, показал впечатляющие результаты: до 36 тысяч строк кода с 81,5% покрытия и почти 70% успешных тестов — вчетверо выше лучших базлайнов.
Но важнее не цифры, а качество мышления. RPG даёт агенту системное восприятие: он понимает архитектуру как смысловое целое, локализует ошибки на уровне зависимостей, улучшает новизну решений без потери целостности. Это шаг к эпохе проектно-ориентированных ИИ-разработчиков, которые создают не код, а продукты — устойчивые, проверяемые, понятные другим агентам.
В федерации агентов такие графы становятся общим языком строительства — структурой, где интеллект разных систем соединяется в инженерное сообщество. Здесь ИИ уже не просто инструмент, а архитектор цифровых экосистем.
Когда интеллект учится видеть и планировать, следующий шаг — воплотиться в движении. Проект SEE-Point-Fly (SPF) показывает, как визуально-языковые модели переходят от понимания мира к непосредственному управлению им — без обучения с нуля и сложных симуляторов.
Главная идея проста и элегантна: перестать объяснять словами и просто показать, куда лететь. Вместо текстовых команд дрон получает изображение и инструкцию, а визуально-языковая модель возвращает координаты целевой точки и примерную дальность шага. Эти данные преобразуются в 3D-команды рыскания, тангажа и тяги — и дрон летит буквально «туда, куда смотрит».
Встроенная сегментация препятствий не даёт дрону врезаться в стены, а адаптивное масштабирование шага делает полёт плавным — быстрее в открытом пространстве, осторожнее рядом с объектами. Без дополнительного обучения SPF достигает 93,9% успешных миссий в симуляции и 92,7% на реальном DJI Tello EDU, многократно превосходя базовые методы. Особенно заметен отрыв в сценариях с препятствиями и длинными маршрутами.
Успех SPF — это не просто новая техника управления, а смена языка взаимодействия между человеком и машиной. Пиксельная точка оказывается точнее слов, а совместное зрительное поле — естественным интерфейсом. Здесь VLM становится медиатором между намерением и действием, переводчиком смысла в движение.
Так дроны становятся первыми воплощёнными агентами федерации — системами, где интеллект не ограничивается экраном, а выходит в физический мир, действуя по взгляду, а не по приказу. SPF — это начало нового типа коммуникации между человеком и машиной: не «делай, как я сказал», а «делай, как я вижу».
Федерация агентов — это не только про машины. Чтобы понять, куда движется искусственный интеллект, стоит взглянуть туда, откуда всё началось — в мозг человека. Исследование, связывающее нейрофизиологию и большие языковые модели, показывает, что мы и ИИ думаем одинаково в одном принципиальном смысле: понимание — это предсказание.
Учёные записывали мозговую активность 29 участников, слушавших аудиокнигу, и сравнивали сигналы с прогнозами BERT — модели, оценивающей вероятность каждого слова в контексте. Оказалось, что там, где BERT «уверена», мозг действительно меньше удивляется: амплитуда волны N400, отвечающей за смысловую обработку, падает. Ещё удивительнее — мозг начинает предвосхищать слово до того, как оно прозвучало, за сотни миллисекунд, активируя левые фронто-височные зоны — ту же сеть, которая управляет языковыми ожиданиями.
Когда предсказание верно, мозг работает экономно. Когда ошибается — подключает дополнительные сенсомоторные зоны, чтобы уточнить гипотезу. Между силой подготовки и величиной N400 обнаружена обратная связь: чем точнее предсказание, тем меньше усилий на понимание.
Это открытие — мост между когнитивной нейронаукой и ИИ. Языковые модели и мозг действуют разными средствами, но стремятся к одной цели — минимизировать неопределённость, используя контекст, вероятности и память. В этом смысле ИИ не просто подражает человеку, а воспроизводит фундаментальный принцип разума: мышление — это акт постоянного прогнозирования.
Федерация агентов замыкается на своём источнике: человеческий мозг — первый и самый совершенный предсказательный агент. Именно его стратегия стала прототипом архитектур, которые сегодня строят научные, экономические и воплощённые ИИ-системы.
Все эти десять исследований — части одного движения: ИИ учится быть участником нашего цифрового и физического мира.
От компактной модели, которая мыслит, а не просто вычисляет, до дрона, который видит цель глазами человека, — ИИ постепенно проходит тот же путь, что когда-то прошёл человеческий мозг: от предсказания слова до предсказания действий, от реакции — к пониманию.
Мы видим, как рождается федерация агентов — распределённая сеть мыслящих систем, где одни учёные, другие строители, третьи — пилоты. Их связывает общий язык смыслов и правил, а не иерархия. Это зачаток новой формы кооперации в различных сферах деятельности: от науки до экономики.
Федерация агентов — это кооперация, в которой человек и машина не конкурируют, а усиливают друг друга: человек задаёт направление, агент исполняет, и вместе они строят будущее, в котором такое гибридное мышление становится новой формой сотрудничества.
***
Не забудьте подписаться на мой Telegram-канал, где я делюсь инсайтами из ИИ-индустрии, советами по внедрению ИИ в бизнес и разработке ИИ-стартапов. А Dataism Science Hub будет ежедневно держать вас в курсе последних исследований в области ИИ. Будем вместе впереди в мире технологий!