
Перевод на русский полного текста свежего (20 марта 2026) интервью Дваркешу Пателю интересного собеседника, Теренса Тао, величайшего математика нашего времени (разумеется, величайшего наряду с Григорием Перельманом) о том, чему нас учит история великих астрономических открытий и как ИИ даёт возможность ускорить математические исследования. Настоятельно рекомендуется всем, интересующимся математикой, физикой, астрономией, ИИ, историей науки и тем, как на самом деле делаются научные открытия...
"And what those stories teach us about how AI will revolutionize math”
Dwarkesh Patel, Mar 20, 2026
«И чему эти истории учат нас, пока мы наблюдаем, как ИИ совершает переворот в математике»
Дваркеш Патель, 20 марта 2026 г.
Мы начинаем этот эпизод с гениального и неожиданного способа, которым Кеплер открыл законы движения планет.
Иногда говорят, что ИИ будет особенно быстро прогрессировать в области научных открытий благодаря постоянным циклам верификации.
Но история открытия формы нашей Солнечной системы показывает, что цикл проверки правильных идей может растянуться на десятилетия (а то и на тысячелетия).
В течение этого времени теория, которую мы сегодня считаем [более] верной, на практике часто давала худшие предсказания (модель Коперника с круговыми орбитами вокруг Солнца на самом деле была менее точной, чем геоцентрическая модель Птолемея).
И причина, по которой новая теория выживает в этом «эпистемическом аду», — это некая смесь суждений и эвристик, которые мы сами не до конца понимаем, не говоря уже о том, чтобы чётко сформулировать их или закодировать в цикл обучения с подкреплением (RL).
Надеемся, вам понравится!
(00:00:00) — Кеплер как высокотемпературная языковая модель
(00:11:44) — Как мы поймём, что среди груды ИИ-«шлака» появилось новое объединяющее понятие?
(00:26:10) — Дедуктивный навес (deductive overhang)
(00:30:31) — Ошибка отбора в публикуемых ИИ-открытиях
(00:46:43) — ИИ делает статьи богаче и шире, но не глубже
(00:53:00) — Если ИИ решит задачу, смогут ли люди извлечь из этого понимание?
(00:59:20) — Нам нужен полуформальный язык для понимания того, как учёные на самом деле общаются друг с другом
(01:09:48) — Как Терри распределяет своё время
(01:17:05) — Гибриды «человек + ИИ» будут доминировать в математике ещё очень долго
Дваркеш Патель:
Сегодня я беседую с Теренсом Тао, который не нуждается в представлении. Теренс, я хотел бы начать с того, чтобы вы ещё раз рассказали историю о том, как Кеплер открыл законы движения планет, потому что это, как мне кажется, отличная отправная точка для разговора об ИИ в математике.
Теренс Тао:
У меня всегда был любительский интерес к астрономии, я обожал истории о том, как первые астрономы постигали устройство Вселенной. Кеплер опирался на работы Коперника, который, в свою очередь, опирался на труды Аристарха. Коперник, как всем известно, предложил гелиоцентрическую модель: взамен представлению, будто планеты и Солнце вращались вокруг Земли, он поставил Солнце в центр Солнечной системы, где остальные планеты вращаются вокруг Солнца.
Коперник предположил, что орбиты планет представляют собой идеальные окружности. Его теория в целом согласовывалась с наблюдениями, которые греки, арабы и индийцы накапливали на протяжении столетий. Кеплер познакомился с этими теориями в ходе своих исследований и заметил, что соотношения размеров орбит, предсказанные Коперником, по-видимому, имеют некий геометрический смысл.
Кеплер начал выдвигать гипотезы, что если взять, скажем, орбиту Земли и вписать её в куб, то внешняя сфера, описанная вокруг этого куба, почти идеально совпадёт с орбитой Марса, и так далее. В то время было известно шесть планет, и между ними было пять промежутков, как раз столько, сколько существует правильных платоновых тел: куб, тетраэдр, икосаэдр, октаэдр и додекаэдр.
Так у него возникла теория, которую он считал абсолютной и прекрасной: можно вписать эти платоновы тела между сферами планетных орбит. Это казалось идеальной моделью, и ему представлялось, что божественный замысел устройства планет отражает математическое совершенство платоновых тел.
Кеплеру нужны были данные для подтверждения этой теории. В то время существовал лишь один по-настоящему качественный набор данных. Тихо Браге, очень состоятельный и эксцентричный датский астроном сумел убедить датское правительство профинансировать чрезвычайно дорогую обсерваторию. Фактически, это был целый остров, где он на протяжении десятилетий вёл наблюдения за всеми планетами — Марсом, Юпитером и другими. Каждую ясную ночь, невооружённым глазом. Он был последним из астрономов, работавших без оптических приборов.
Итак, у Браге были данные, которые Кеплер мог использовать для проверки своей теории. Кеплер начал сотрудничать с Тихо, но тот очень ревностно относился к своим данным и выдавал их лишь небольшими порциями. В конце концов Кеплер просто похитил данные: скопировал их, после чего ему пришлось вести тяжбу с наследниками Браге.
В итоге он получил данные но, к своему разочарованию, обнаружил, что его прекрасная теория не совсем работает. Данные отклонялись от его теории с платоновыми телами примерно на 10%. Он пробовал всевозможные ухищрения: смещал окружности, подгонял параметры, но ничего не помогало. Он работал над этой задачей годами и в конце концов понял, как использовать данные для вычисления реальных орбит планет.
Это был невероятно изобретательный, гениальный способ анализа данных. В результате он установил, что орбиты на самом деле являются эллипсами, а не окружностями, и это стало для него шоком. Так он сформулировал два закона движения планет: закон эллиптических орбит и закон равных площадей (равные площади заметаются за равные промежутки времени).
Затем, ещё через десять лет, собрав ещё больше данных (самые удалённые планеты, Сатурн и Юпитер, давались ему труднее всего), он наконец вывел свой третий закон: время, за которое планета совершает полный оборот, пропорционально некоторой степени расстояния до Солнца. Это и есть три знаменитых закона Кеплера. У него не было объяснения, почему они работают, поскольку всё было основано на эксперименте. Лишь спустя столетие Ньютон создал теорию, которая объяснила все три закона.
Дваркеш Патель:
Я хочу предложить вам такую интерпретацию: Кеплер был своего рода высокотемпературной языковой моделью. Ньютон пришёл и объяснил, почему три закона движения планет должны быть истинными. Разумеется, способ, которым Кеплер открыл эти законы, или определил относительные орбиты разных планет, как вы и сказали, был проявлением гения. Но на протяжении своей карьеры он по сути перебирал случайные соотношения.
Более того, в книге, где он записывает свой третий закон, это лишь побочное замечание в труде «Гармония мира», книге о том, как разные планеты создают разные «гармонии». И причина, по которой на Земле столько голода и страданий, по его мнению, в том, что Земля звучит как «ми-фа-ми», это «нота» Земли. Всё это, своего рода случайная астрология, но именно там, среди этих рассуждений, появляется закон кубов и квадратов, который указывает на связь между периодом обращения планеты и её расстоянием до Солнца. Как вы уже отмечали, если добавить к этому ньютоновское F=ma и формулу для центростремительного ускорения, получается закон обратных квадратов. И Ньютон это выводит.
Но причина, по которой эта история кажется мне интересной, в том, что, как мне представляется, языковые модели способны делать нечто похожее: перебирать случайные соотношения на протяжении двадцати лет, причём многие из них не будут иметь смысла. Но при условии, что есть верифицируемая база данных, подобная набору данных Тихо Браге. «Хорошо, я попробую случайные гипотезы про музыкальные ноты, платоновы тела или разные геометрии; у меня есть предубеждение, что в геометрии этих орбит кроется нечто важное».
И вот одна из гипотез срабатывает. Пока есть возможность верификации, такие эмпирические закономерности способны двигать вперёд подлинную научную мысль.
Теренс Тао:
Традиционно, когда мы говорим об истории науки, генерация идей всегда считалась самой престижной частью научной деятельности. Научная проблема предполагает множество этапов: нужно выявить проблему, затем выбрать действительно плодотворную задачу для работы над ней. Затем нужно собрать данные, разработать стратегию их анализа, сформулировать гипотезу. На этом этапе требуется предложить качественную гипотезу, затем её проверить. После нужно описать результаты и объяснить их. Здесь можно насчитать с десяток различных компонентов.
Те моменты, которые мы прославляем, — это озарения, гениальные вспышки генерации идей. Кеплеру, безусловно, пришлось перебрать множество гипотез, и многие из них не сработали. Готов поспорить, что немало идей он даже не публиковал, потому что они просто не подходили. Это важная часть процесса — пробовать всевозможные случайные вещи и смотреть, сработают ли они.
Но, как вы верно заметили, это должно уравновешиваться сопоставимым объёмом верификации, иначе получится «шлак». Мы прославляем Кеплера, но стоит также воздать должное Тихо Браге за его скрупулёзный сбор данных, которые были в десять раз точнее любых предыдущих наблюдений. Этот лишний знак точности после запятой оказался решающим для того, чтобы Кеплер получил свои результаты. Он использовал евклидову геометрию и самую передовую математику, доступную в его время, чтобы согласовать свои модели с данными. Все аспекты должны были работать в совокупности: данные, теория и генерация гипотез.
Не уверен, что сегодня генерация гипотез по-прежнему является «узким местом». Наука изменилась за прошедшее столетие. Классически существовало две основные парадигмы науки: теория и эксперимент. Затем в XX веке появились численные симуляции, то есть возможность проверять теории с помощью компьютерного моделирования. Наконец, в конце XX века наступила эра больших данных, эпоха анализа данных.
Сегодня значительная часть прогресса достигается именно за счёт предварительного анализа массивных наборов данных. Сначала собираются большие данные, затем в них выявляются закономерности, из которых выводятся гипотезы. Это несколько отличается от того, как наука работала раньше: вы делали несколько наблюдений или рождали внезапную идею, а затем собирали данные для её проверки. Это классический научный метод. Сейчас процесс почти перевернулся: сначала собираются большие данные, а затем из них извлекаются гипотезы.
Кеплер, возможно, был одним из первых «учёных по данным», дата-сайентистов, но даже он не начинал с набора данных Тихо и их анализа, поскольку у него сначала были собственные теоретические предпосылки. Похоже, что такой подход становится всё менее распространённым просто потому, что данные теперь настолько объёмны и информативны, что сам процесс открытия смещается в сторону их первичного анализа.
Дваркеш Патель:
О, это интересно. Мне кажется, что наука XX века, которую вы описываете, на самом деле очень точно характеризует то, что произошло с Кеплером. У него действительно были эти идеи, в 1595–1596 годах он выдвигает теорию с многоугольниками, а затем с платоновыми телами, но все они оказались ошибочными. Затем, несколько лет спустя, он получает данные Браге, и лишь после двадцати лет перебора случайных гипотез он приходит к этой эмпирической закономерности.
На самом деле это ощущается ближе к тому, что данные Браге аналогичны некой огромной базе симуляций, и теперь, когда у вас есть эти данные, вы можете продолжать пробовать случайные вещи. Если бы не это, Кеплер так и продолжал бы писать книги о гармониях и платоновых телах, и у него не было бы ничего, с чем можно было бы реально сверяться.
Теренс Тао:
Данные имели огромное значение. Различие, которое я пытался провести, заключалось в следующем: традиционно вы формулируете гипотезу, а затем проверяете её на данных. Но сейчас, с развитием машинного обучения, анализа данных и статистики, вы можете начать с данных и с помощью статистических методов вывести закономерности, которых раньше не было.
Третий закон Кеплера отчасти похож на это, за исключением того, что вместо тысячи точек данных, которыми располагал Браге, у Кеплера было всего шесть. Для каждой планеты он знал длину орбиты и расстояние до Солнца. Было пять или шесть точек данных, и он сделал то, что мы сейчас назвали бы регрессионным анализом: он подобрал кривую к этим шести точкам и получил закон квадратов и кубов, что было поразительно. Но ему изрядно повезло, что именно эти шесть точек привели его к верному выводу. Это недостаточное количество данных, чтобы дать возможность делать по-настоящему надёжные выводы.
Позже появился астроном Иоганн Боде, который взял те же данные, расстояния до планет, и, вдохновлённый Кеплером, выдвинул гипотезу, что расстояния до планет образуют сдвинутую геометрическую прогрессию. Он тоже подобрал кривую, но одна точка отсутствовала: между Марсом и Юпитером был большой промежуток. Его закон предсказывал наличие недостающей планеты. Это была своего рода маргинальная теория, но когда Гершель открыл Уран, расстояние до Урана в точности вписалось в эту закономерность. Затем в поясе астероидов была открыта Церера — и она тоже подошла. Люди пришли в восторг: казалось, Боде открыл удивительный новый закон природы.
Но затем был открыт Нептун, и он совершенно не вписывался в эту картину. По сути, это было просто численное совпадение. Было шесть точек данных. Возможно, одна из причин, по которой Кеплер не акцентировал свой третий закон так же сильно, как первые два, заключалась в том, что пусть у него и не было современной статистики, но интуитивно он понимал: с шестью точками данных нужно делать выводы с определённой осторожностью.
Дваркеш Патель:
Чтобы задать вопрос об аналогии более явно: имеет ли смысл эта аналогия, если в будущем у нас появятся всё более и более умные ИИ? Их будут миллионы, и они смогут выходить и искать всевозможные эмпирические закономерности. Судя по вашим словам, вы не считаете, что «узким местом» в науке является поиск новых вещей, эквивалентных третьему закону движения планет для каждой конкретной области, чтобы потом кто-то мог сказать: «Ага, нам нужно это объяснить. Давайте выведем математику. Вот закон обратных квадратов для гравитации».
Теренс Тао:
Я думаю, что ИИ снизил стоимость генерации идей практически до нуля. Это похоже на то, как интернет снизил стоимость коммуникации до нуля. Это потрясающе, но само по себе это не создаёт изобилия. Теперь «узкое место» сместилось. Мы оказались в ситуации, когда внезапно люди могут генерировать тысячи теорий для одной научной проблемы. Теперь нам нужно их проверять, оценивать. Это требует изменения самих структур науки, чтобы разобраться с этим потоком.
Традиционно мы строили «фильтры». В прошлом, до эпохи ИИ-«шлака», у любителей науки были свои теории устройства мира, многие из которых имели крайне малую ценность. Мы создали системы рецензирования и публикаций, чтобы отфильтровывать и выделять идеи с высоким «сигналом» для проверки.
Но теперь, когда мы можем генерировать возможные объяснения в огромных масштабах (причём некоторые из этих идей хороши, но большинство ужасны), человеческие рецензенты уже не справляются. Многие журналы сообщают, что их просто захлёстывает поток статей, сгенерированных ИИ.
Здорово, что теперь с помощью ИИ мы можем генерировать всевозможные вещи, но это означает, что остальные аспекты науки должны подтянуться: верификация, валидация и оценка того, какие идеи действительно продвигают предмет вперёд, а какие всего лишь ложные следы или ведут в тупик. Мы не знаем, как делать это в масштабе. Для каждой отдельной статьи мы можем устроить дебаты среди учёных и прийти к консенсусу за несколько лет. Но когда мы генерируем тысячи таких статей каждый день, этот подход перестаёт работать.
Дваркеш Патель:
Возникает невероятно интересный вопрос. Если у вас есть миллиарды ИИ-учёных, то как оценить, какие из их идей представляют реальный прогресс?.. На самом деле, это вопрос, с которым человеческая наука уже сталкивалась и который мы каким-то образом решили... Хотя, честно говоря, я не уверен, как именно мы это сделали.
Допустим, в 1940-х вы работаете в Bell Labs, и появляются новые технологии: импульсно-кодовая модуляция, способы передачи сигналов, оцифровка, передача по аналоговым проводам. Есть множество статей об инженерных ограничениях и деталях, и вдруг появляется одна, в которой возникает идея «бита» — понятия, имеющего последствия для множества разных областей. Вам нужна система, способная взглянуть на это и сказать: «Хорошо, это нужно применить в теории вероятностей, в компьютерных науках» и так далее.
В будущем разные ИИ будут предлагать всё новые версии таких объединяющих понятий. Как вы сможете выделить их среди миллионов статей, которые, возможно, в чём-то представляют прогресс, но при этом содержат гораздо меньше универсальных, объединяющих идей?
Теренс Тао:
Во многом это проверка временем. Многие великие идеи изначально не получили тёплого приёма. Лишь позже другие учёные осознали, что их можно развить и применить в своих областях. Само глубокое обучение долгое время было нишевым направлением в ИИ. Идея получения ответов исключительно через обучение на данных, а не через рассуждения на основе определенных принципов, была весьма спорной, и потребовалось много времени, прежде чем она начала приносить плоды.
Вы упомянули бит. Существовали и другие предложения по компьютерным архитектурам, помимо универсальной сегодня двоичной системы (ноль-единица). Были, например, триты, троичная логика. В альтернативной вселенной, возможно, закрепилась бы другая парадигма. Трансформер, например, лежит в основе всех современных больших языковых моделей, и это была первая архитектура глубокого обучения, которая оказалась достаточно сложной, чтобы работать с языком. Но так могло и не сложиться. Могла бы появиться какая-то другая архитектура, которая первой решила бы эту задачу, и именно она стала бы стандартом.
Одна из причин, почему сложно оценить, окажется ли данная идея плодотворной, заключается в том, что это зависит от будущего. Это также зависит и от культуры, и от общества: какие идеи приживаются, а какие — нет. Десятичная система счисления в математике чрезвычайно удобна, она гораздо удобнее, например, римских цифр. Но опять же, в числе 10 нет ничего особенного. Эта система полезна нам просто потому, что её используют все остальные. Мы стандартизировали её. Мы построили вокруг неё все наши компьютеры и системы представления чисел, так что теперь мы с ней «застряли». Время от времени кто-то предлагает перейти на другие системы, но инерция слишком велика.
Это не тот случай, когда можно взглянуть на любое научное достижение изолированно и выставить ему объективную оценку, не учитывая контекст, как прошлый, так и будущий. Поэтому, возможно, это никогда не станет задачей, которую можно решить с помощью обучения с подкреплением так же, как решаются более локальные проблемы.
Дваркеш Патель:
Часто в истории науки, когда появляется новая теория, которая ретроспективно оказывается верной, из неё следуют выводы, которые либо не имеют смысла, потому что ошибочны, и мы позже понимаем, почему. Либо выводы, которые верны, но в своё время кажутся совершенно неправдоподобными.
Как вы уже упоминали, Аристарх выдвинул гелиоцентрическую модель ещё в III веке до н.э. Древние афиняне возражали: «Этого не может быть, потому что если Земля вращается вокруг Солнца, мы должны видеть, как меняется относительное положение звёзд по мере нашего движения. Единственный вариант, при котором этого не происходит, когда звёзды находятся так далеко, что параллакс незаметен». Что, на самом деле, является верным следствием.
Но бывают случаи, когда следствие ошибочно, и нам просто нужно перейти на более высокий уровень понимания. Лейбниц упрекал Ньютона и не соглашался с его теорией гравитации на том основании, что она подразумевала действие на расстоянии, а механизм был неизвестен; сам Ньютон был озадачен тем, что инертная и гравитационная массы — это одна и та же величина. Все эти вопросы позже разрешил Эйнштейн. Но это всё равно был прогресс.
Таким образом, задача для системы рецензирования ИИ звучит так: даже если вы можете фальсифицировать теорию, как вы заметите, что она всё равно представляет прогресс по сравнению с предыдущей?
Теренс Тао:
Часто в конечном итоге верная теория изначально во многих отношениях хуже. Теория планет Коперника была менее точной, чем теория Птолемея. Геоцентризм к тому моменту развивался уже тысячелетие, и учёные внесли множество поправок и всё более сложных ad hoc-модификаций, чтобы повысить его точность. Теория Коперника была гораздо проще, но значительно менее точной. Лишь Кеплер сделал её точнее, чем теория Птолемея.
Наука — это всегда работа в процессе. Когда у вас есть лишь часть решения, оно выглядит хуже, чем теория, которая неверна, но каким-то образом доведена до состояния, в котором отвечает на все вопросы. Как вы верно заметили, в теории Ньютона оставались большие загадки: эквивалентность масс и действие на расстоянии, которые были разрешены лишь столетия спустя, с помощью концептуально иного подхода.
Часто прогресс достигается не добавлением новых теорий, а отказом от некоторых предположений, которые укоренились в нашем сознании. Одна из причин, по которой геоцентризм держался так долго, в том, что у нас было представление, что объекты естественным образом стремятся оставаться в покое. Это аристотелевское представление о физике, и поэтому идея о том, что Земля движется, вызывала вопрос: «Почему же мы все не падаем?» Как только появились законы движения Ньютона, а также понимание того, что «тело, находящееся в движении, продолжает двигаться», — всё обрело смысл.
Концептуально это огромный скачок: осознать, что Земля находится в движении. Это не ощущается. Значительные прорывы, такие как теория эволюции Дарвина, идея, что виды не статичны, вовсе не очевидны. Например, потому, что вы не наблюдаете эволюцию в течение своей жизни. Ну, теперь мы уже можем, но всё равно она кажется постоянной и неизменной.
Сейчас мы переживаем когнитивную версию коперниканской революции: раньше мы считали, что человеческий интеллект — это центр вселенной, а теперь видим, что существуют совершенно иные типы интеллекта с совершенно иными сильными и слабыми сторонами. Наша оценка того, какие задачи требуют интеллекта, а какие не требуют, должна быть существенно пересмотрена.
Пытаясь вписать ИИ в наши теории научного прогресса и в представления о том, что сложно, а что легко, мы сталкиваемся с серьёзными трудностями. Нам приходится задавать вопросы, которые раньше нам просто не нужно было задавать. Или, возможно, их задавали философы, но теперь с этим приходится иметь дело всем нам.
Дваркеш Патель
Это поднимает тему, которая меня очень интересует. Вы упомянули теорию эволюции Дарвина. Есть такая книга Эдварда Долника, «Заводная Вселенная», которая охватывает как раз ту историческую эпоху, о которой мы говорим. Там есть интересное наблюдение: «Происхождение видов» было опубликовано в 1859 году, а «Математические начала натуральной философии», Principia Mathematica, в 1687-м.
То есть «Происхождение видов» вышло на два столетия позже «Начал». Концептуально теория Дарвина кажется проще. Современник Дарвина, биолог Томас Гексли, прочитав «Происхождение видов», воскликнул: «Как глупо, что я сам до этого не додумался».
Никто никогда не говорил подобного о «Началах», упрекая себя в том, что не опередил Ньютона в открытии гравитации. Возникает вопрос: почему же это заняло больше времени?
Похоже, значительная часть причины кроется в том, о чём вы говорили. Доказательства естественного отбора в определённом смысле неопровержимы, но они носят кумулятивный и ретроспективный характер, тогда как Ньютон может просто сказать: «Вот мои уравнения. Давайте посмотрим на орбитальный период Луны и её расстояние, и если всё сходится, значит, мы продвинулись вперёд».
На самом деле, у Лукреция ещё в первом веке до нашей эры была идея о том, что виды адаптируются к окружающей среде, но об этом всерьёз не говорили до Дарвина, потому что Лукреций не мог провести эксперимент и заставить людей обратить на это внимание. Интересно, не окажется ли так, что ретроспективно мы увидим гораздо больший прогресс в тех областях, где есть такая «плотная петля данных», то есть там, где гипотезы можно проверять довольно легко, даже если концептуально они гораздо сложнее.
Теренс Тао
Думаю, один из аспектов науки заключается в том, что это не просто создание новой теории и её проверка, но и донесение её до других. Дарвин был потрясающим популяризатором науки. Он писал на английском, естественным языком. Я сейчас говорю как…
Дваркеш Патель
Без Lean. (Прим. переводчика: Lean — формальный язык доказательств, используемый в том числе и Теренсом Тао в математических исследованиях).
Теренс Тао
Мне нужно выйти за рамки технического мышления. Он излагал мысли простым английским, не использовал уравнения и синтезировал множество разрозненных фактов. Отдельные кусочки эволюционной теории уже прорабатывались и раньше, но у него сложилась очень убедительная целостная картина. Опять же, кое-чего ему всё же не хватало: он не знал механизма наследственности, у него не было ДНК. Но его стиль письма был убедительным, и это очень помогло.
Ньютон писал на латыни. Он изобрёл целые разделы математики, просто чтобы объяснить то, чем занимался. К тому же он принадлежал к эпохе, когда учёные были гораздо более скрытными и конкурентными. Академическая среда конкурентна и сейчас, но во времена Ньютона это было ещё острее. Он придерживал некоторые из своих лучших идей, потому что не хотел давать преимуществ соперникам. Насколько я понимаю, он был ещё и человеком не самым приятным в общении. Лишь спустя пару десятилетий после Ньютона другие учёные изложили его работы в гораздо более простых терминах. И только тогда они получили широкое распространение.
Искусство изложения, аргументации и создания нарратива — это очень важная часть науки. Если у вас есть данные, это помогает, но людей нужно убеждать: иначе они не станут развивать вашу идею дальше или вкладывать усилия в то, чтобы изучить вашу теорию и по-настоящему исследовать её. Это ещё одна вещь, которую крайне сложно оптимизировать с помощью обучения с подкреплением. Как оценить, насколько вы убедительны? Что ж, целые маркетинговые отделы пытаются это делать. Возможно, это к лучшему, что ИИ пока не оптимизирован для убеждения.
У науки есть социальный аспект. Хотя мы гордимся её объективной стороной (данными, экспериментами, проверкой), нам всё равно приходится рассказывать истории и убеждать коллег-учёных. Это нечто мягкое, нечёткое. Это сочетание данных и выстраивания нарратива, причём нарратива, не лишённого пробелов.
Даже у Дарвина, как я уже сказал, были элементы теории, которые он не мог объяснить. Но он всё равно мог аргументированно утверждать, что в будущем люди найдут переходные формы, обнаружат механизм наследственности... И люди действительно нашли! Я не знаю, как можно количественно оценить это настолько точно, чтобы начать применять обучение с подкреплением. Возможно, это навсегда останется человеческой стороной науки.
Дваркеш Патель
Один из выводов, который я сделал, читая и просматривая ваши материалы о космической лестнице расстояний… Кстати, настоятельно рекомендую всем посмотреть вашу серию с 3Blue1Brown на эту тему. Этот вывод заключался в том, что «дедуктивный навес» (deductive overhang) во многих областях может быть гораздо больше, чем люди осознают. Если бы у нас просто появилось правильное понимание того, как подойти к изучению проблемы, мы могли бы удивиться, насколько больше можно узнать о мире.
Интересно, как вы думаете: это особенность именно астрономии в те конкретные исторические периоды, которые вы изучаете? Или же, исходя из данных, которые в настоящее время достигают Земли, мы на самом деле могли бы извлечь гораздо больше знаний, чем нам известно сейчас?
Теренс Тао
Астрономия была одной из первых наук, которая по-настоящему приняла анализ данных и идею «выжимания каждой капли информации» из имеющихся сведений, потому что данные были узким местом. Они остаются им и сейчас: собирать астрономические данные действительно очень сложно.
Астрономы — это мастера экстра класса в извлечении всевозможных выводов из крошечных следов данных, почти как Шерлок Холмс. Я слышал, что для многих квантовых хедж-фондов (quant hedge funds) предпочтительными кандидатами на найм на самом деле являются кандидаты наук по астрономии. Они также очень заинтересованы в извлечении сигналов из различных случайных фрагментов данных.
Мы действительно недостаточно исследуем способы извлечения дополнительной информации из различных сигналов. Просто один пример: я помню, как читал, что люди пытались измерить, как часто учёные на самом деле читают статьи, на которые ссылаются. Как это измерить? Можно было бы попробовать опросить разных учёных, но они применили хитрый приём.
Во многих цитатах встречаются мелкие опечатки: например, неверная цифра или почти неправильная пунктуация. Они измерили, как часто опечатка копируется из одной ссылки в другую, и смогли сделать вывод, просто ли автор скопировал и вставил ссылку, не проверяя её. На основе этого они смогли оценить, насколько внимательно люди относятся к цитированию. Так что существуют остроумные приёмы для извлечения информации…
Те вопросы, которые вы задавали ранее, о том, как мы можем оценить, является ли научное открытие плодотворным, интересным или представляет собой реальный прогресс… Возможно, в данных действительно существуют полезные метрики или «следы» этого явления. Мы можем анализировать цитирования и то, как часто что-то упоминается на конференциях. Возможно, здесь кроется большой потенциал для исследований в области социологии науки, которые могли бы фактически выявлять такие вещи. Может быть, нам действительно стоит привлечь к этому делу астрономов.
Дваркеш Патель
Это подводит нас к прогрессу в области применения ИИ в математике, и этот прогресс, глядя со стороны, кажется весьма впечатляющим. Недавно вы опубликовали пост, где отметили, что за последние несколько месяцев программы на основе ИИ решили около пятидесяти из примерно тысячи ста задач Эрдёша. Не знаю, актуально ли это до сих пор, но месяц назад вы сказали, что сейчас наблюдается пауза, потому что были собраны самые «низковисящие плоды».
Прежде всего, мне интересно: это всё ещё так? То есть мы действительно собрали лёгкие задачи и сейчас находимся на плато?
Теренс Тао
Похоже, что да. Около пятидесяти задач решено при помощи ИИ, и это замечательно, но впереди ещё порядка шестисот. Люди продолжают понемногу работать над одной-двумя из них прямо сейчас.
Сейчас мы гораздо реже видим чисто ИИ-решения, когда модель «с одного удара» решает задачу. Был такой месяц, когда это происходило регулярно, но потом прекратилось, и вовсе не из-за недостатка попыток. Я знаю как минимум о трёх независимых попытках заставить передовые модели ИИ одновременно атаковать все задачи подряд. Иногда они находят какие-то мелкие улучшения или обнаруживают в литературе, что задача уже была решена, но новых полностью ИИ-решений пока не появилось.
Люди сейчас активно используют ИИ. Кто-то может применить ИИ для генерации возможной стратегии доказательства, другой человек будет использовать отдельный ИИ-инструмент, чтобы его критически проанализировать, переписать, сгенерировать численные данные или провести обзор литературы. Некоторые задачи были решены в результате длительного диалога между множеством людей и множеством ИИ-инструментов. Но всё же создаётся впечатление, что был один короткий период взрывного прогресса, а теперь он закончился.
Возможно, хорошая аналогия для этих задач — это горный хребет с множеством скал и утёсов разной высоты. Есть, скажем, стена высотой в метр, другая стена два метра, потом пять метров, а есть и километровые обрывы. Вы пытаетесь взобраться на как можно большее количество стен, но делаете это в темноте: вы не знаете, какие из них высокие, какие низкие. Поэтому вы зажигаете свечи, составляете карты и постепенно начинаете понимать, какие из них можно покорить, а на некоторых даже удаётся найти частичную тропу, за которую можно зацепиться.
Эти ИИ-инструменты похожи на машины, способные подпрыгнуть на два метра вверх, выше любого человека. Иногда они прыгают не туда и падают, но иногда им удаётся достичь вершин самых низких стен, до которых раньше мы дотянуться не могли. Мы просто выпустили их в этот горный массив, и они начали прыгать повсюду. Был волнующий период, когда они действительно находили низкие стены и одолевали их. Возможно, при следующем значительном скачке в развитии моделей будут покорены ещё несколько утёсов.
Но это совершенно иной стиль занятий математикой. Обычно мы продвигаемся шаг за шагом, ставим маркеры, выявляем промежуточные результаты. ИИ-инструменты либо сразу решают задачу, либо терпят неудачу. Они очень плохо справляются с созданием частичного прогресса или выявлением промежуточных этапов, на которых стоило бы сосредоточиться. Возвращаясь к нашему предыдущему обсуждению: у нас нет хороших способов оценить частичный прогресс так же чётко, как мы можем оценить успех или провал в решении задачи «с одного удара».
Дваркеш Патель
Есть два разных способа интерпретировать то, что вы только что сказали. Один пессимистичен относительно прогресса ИИ, другой же более оптимистичен.
Пессимистический взгляд: «Ах, они могут достичь лишь определённой высоты стены, которая всё ещё значительно ниже, чем та, до которой добираются люди».
Оптимистический же заключается в том, что у ИИ есть мощное свойство: как только они достигают определённого уровня, «ватерлинии», они мгновенно обретают способность решать все задачи, доступные на этом уровне, то есть то, чего человеческая цивилизация просто не в состоянии сделать. Мы не можем создать миллион копий вас, дать каждой по миллиону долларов вычислительных ресурсов и позволить провести сто лет субъективного времени исследований над миллионом разных задач одновременно.
Но как только ИИ достигнут уровня Теренса Тао, они смогут именно это и делать. А когда достигнут промежуточного уровня, то смогут делать и промежуточную версию этого. Именно та причина, из-за которой стоит быть пессимистом сейчас, на самом деле является основанием для особого оптимизма: не обязательно ждать сверхчеловеческого интеллекта, достаточно просто человеческого уровня. Потому что их «человеческий» интеллект будет качественно шире и мощнее нашего собственного.
Теренс Тао
Я согласен. ИИ превосходят в широте охвата, а люди — в глубине, по крайней мере люди-эксперты. Думаю, они очень хорошо дополняют друг друга. Но наш нынешний подход к математике и науке ориентирован на глубину, именно в этом сила человеческой экспертизы: люди просто не способны на широту. Нам нужно переосмыслить сам процесс научной работы, чтобы в полной мере использовать новую способность к широкому охвату, которую нам дали ИИ.
Нам следует гораздо больше усилий направлять на создание очень широких классов задач, а не концентрироваться только на одной-двух глубоких и важных проблемах. Конечно, такие глубокие проблемы должны оставаться, и люди по-прежнему должны над ними работать. Но теперь у нас есть и другой путь в науке: мы можем исследовать совершенно новые области, сначала отправив туда, умеренно компетентных ИИ, но с «широким захватом» чтобы они составили «карту местности» и сделали все простые наблюдения. А затем выявить отдельные «острова сложности», над которыми уже смогут трудиться эксперты-люди.
Я вижу будущее науки как крайне синергетическое. В идеале мы хотели бы со временем получить и широту, и глубину, то есть объединить лучшее из обоих миров. Но нам нужно потренироваться в использовании широты. Это слишком ново: у нас даже нет пока парадигм, позволяющих в полной мере воспользоваться этим преимуществом. Но как только они появятся, я думаю, наука станет неузнаваемой.
Дваркеш Патель
Что касается этой взаимодополняемости: вот, программисты заметили, что благодаря ИИ-инструментам они стали гораздо продуктивнее. Не знаю, чувствуете ли вы то же самое как математик, но представляется, что есть одно важное различие между «вайб-кодингом» и «вайб-исследованиями». В случае программирования вся суть в том, чтобы ваша работа оказывала реальное воздействие на мир. Если в процессе вы лучше понимаете проблему или придумываете чистую абстракцию, воплощаемую в коде, это служит конечной цели.
В исследованиях же причина, по которой нас волнует решение Проблем тысячелетия, состоит в том, что, предположительно, в процессе их решения мы открываем новые математические объекты или методы, расширяющие понимание математики всей цивилизацией. То есть само доказательство — это лишь средство для достижения промежуточных результатов. Согласны ли вы с таким разделением? Может ли это объяснить разницу в том, насколько ИИ усиливает программирование по сравнению с влиянием на фундаментальные исследования?
Теренс Тао
Конечно, в математике процесс часто важнее самой задачи. Задача — это своего рода прокси для измерения прогресса. Думаю, даже в программировании есть разные типы задач. Если вы просто создаёте веб-страницу, делающую то же, что и тысячи других, то здесь почти ничему нельзя научиться. Хотя, возможно, отдельный программист всё же приобретёт какой-то навык. Но шаблонный код точно стоит передавать ИИ.
Иногда после написания кода его всё равно нужно поддерживать: обновлять, обеспечивать совместимость с другими системами. Я слышал, что программисты говорят: даже если ИИ может создать первый прототип инструмента, интеграция его в существующую экосистему и взаимодействие с реальным миром так, как нужно, — это длительный процесс. Если вы не обладаете навыками, приобретёнными при самостоятельном написании кода, это может помешать вам поддерживать его в будущем.
Да, математики всегда использовали задачи для развития интуиции и обучения тому, что правдоподобно, что ожидаемо, что доказуемо и что сложно. Просто взять и сразу получать готовые ответы может на самом деле мешать этому процессу.
Ранее я уже проводил различие между теорией и экспериментом. В большинстве наук существует примерно равный баланс между теоретической и экспериментальной сторонами. Математика же уникальна тем, что она почти полностью теоретическая. Мы придаем огромное значение построению целостных, чистых теорий, объясняющих, почему утверждения истинны или ложны. Мы почти не проводим экспериментов, чтобы проверить, какой из двух методов решения задачи эффективнее. У нас есть интуиция, но мы не проводили масштабных исследований, где берём тысячу задач и просто тестируем разные подходы.
Но теперь мы можем это делать. Думаю, ИИ-инструменты действительно совершают революцию на экспериментальной стороне математики. Это та часть, где вам не так важны отдельные задачи и процесс их решения, а важно собрать крупномасштабные данные о том, что работает, а что нет. Как если вы, к примеру, софтверная компания и хотите выпустить тысячу программ: вы не станете вручную создавать каждую и извлекать уроки из каждой отдельно. Вы просто найдёте рабочие процессы, которые позволяют масштабироваться.
Идея «масштабируемой математики» находится в зачаточном состоянии. Но именно здесь ИИ действительно изменит предмет до неузнаваемости.
Дваркеш Патель
Мне кажется, ключевой момент во всех этих разговорах о том, насколько ИИ будет полезен для науки, вы уже упоминали: ИИ используют существующие методы и немного их модифицируют. Было бы интересно понять, какого прогресса можно добиться, просто применяя уже известные техники.
Если посмотреть ведущие математические журналы, то сколько статей там представляют принципиально новые методы (в каком бы смысле это ни было), а сколько просто применяют существующие методы к новым задачам? Каков размер «дедуктивного навеса»? Если бы мы применили все известные методы ко всем открытым проблемам, привело бы это к колоссальному росту знаний нашей цивилизации? Или это оказалось бы не таким уж полезным и впечатляющим?
Теренс Тао
Отличный вопрос, и у нас пока нет данных, чтобы полностью на него ответить. Конечно, значительная часть работы математиков заключается в следующем: когда вы берётесь за новую задачу, первое, что вы делаете — смотрите на стандартные методы, которые сработали для похожих задач в прошлом, и пробуете их по очереди. Иногда это срабатывает, и такие работы всё равно публикуют, потому что сама задача важна.
Иногда методы почти работают, но вам нужно добавить ещё одну «изюминку», и это тоже интересно. Но статьи, попадающие в топовые журналы, обычно решают задачи, где существующие методы покрывают около 80% проблемы, но остаются упрямые 20%, для преодоления которых требуется изобрести новый метод.
Сейчас крайне редко случается, чтобы задача решалась без опоры на предыдущую литературу, как будто бы все идеи возникли из ниоткуда. Раньше такое встречалось чаще, но математика сейчас достигла такой зрелости, что игнорировать существующую литературу — просто себе вредить.
ИИ-инструменты становятся очень неплохими именно в первой части этого процесса, а именно в применении стандартных методов к задаче, зачастую совершая при этом меньше ошибок, чем люди. Они всё ещё ошибаются, но я тестировал эти инструменты на простых задачах, которые могу решить сам, и иногда они ловят мои ошибки, а иногда я ловлю их ошибки. Сейчас это примерно на равных.
Но я пока не видел, чтобы они делали следующий шаг. Когда в аргументации появляются пробелы и ни один из стандартных методов не работает — что делать дальше? ИИ может предлагать случайные идеи, но часто попытки их развить и довести до рабочего состояния убивают больше времени, чем экономят.
Я думаю, определённая доля задач, которые мы считаем сложными, всё же поддастся такому подходу, особенно те, которым не уделялось достаточного внимания. Почти все 50 решённых ИИ задач Эрдёша были такими, по которым практически не существовало литературы. Эрдёш формулировал их раз или два, возможно, кто-то пробовал решить вскользь и не справился, но ничего не записал.
Однако оказалось, что решение существует. Просто нужно было скомбинировать некую малоизвестную технику с каким-то другим результатом из литературы. Это примерно медианный уровень того, что может сделать ИИ, и это действительно здорово: 50 задач решены. Так что будут и отдельные успехи.
Но вот что мы обнаружили… Некоторые провели масштабные обзоры задач Эрдёша. Если смотреть только на истории успеха, которые распространяются в соцсетях, создаётся впечатление, что всё складывается просто фантастически: десятилетиями нерешённые задачи внезапно поддаются одна за другой. Но когда проводишь систематическое исследование, оказывается, что для любой конкретной задачи вероятность успеха ИИ составляет около 1-2%. Просто они могут позволить себе масштаб, широкое поле попыток, и вы фокусируетесь на тех, где ИИ победил. Выглядит впечатляюще.
Думаю, то же самое будет происходить и с сотнями действительно престижных и трудных математических задач. Какому-то ИИ может случайно повезти, и он действительно решит одну из них, найдя «чёрный ход», который все пропустили. Это получит огромную огласку. Но затем люди попробуют эти продвинутые инструменты на своих любимых задачах, и снова столкнутся с теми же 1-2% успеха.
Будет много шума среди сигнала, то есть сложно будет отличить, когда ИИ действительно помогает, а когда нет. Поэтому будет всё важнее собирать стандартизированные наборы данных. Сейчас предпринимаются усилия по созданию стандартных наборов задач для тестирования ИИ, чтобы не полагаться только на компании, которые публикуют исключительно свои успехи, скрывая неудачи. Это, возможно, даст более ясную картину того, где мы реально находимся.
Дваркеш Патель
Хотя, думаю, стоит подчеркнуть, насколько это уже само по себе огромное достижение: иметь ИИ-модели, способные применить технику, которую никто ранее не считал применимой именно к этой задаче.
Теренс Тао
Прогресс одновременно и поразителен, и разочаровывает. Испытываешь странное чувство, наблюдая, как эти инструменты работают. Но люди очень быстро привыкают.
Помню, когда 20 лет назад появился веб-поиск Google, он просто уничтожил всех конкурентов. Вы получали релевантные ссылки на первой странице, и именно то, что искали. Это было невероятно. А спустя несколько лет вы уже воспринимали как должное, что можете «загуглить» что угодно.
ИИ уровня 2026 года ошеломил бы нас в 2021-м. Многое из того, что мы имеем сегодня, мы уже принимаем как данность: распознавание лиц, естественная речь, решение математических задач на уровне колледжа.
Дваркеш Патель
Кстати об ИИ 2026 года: в 2023-м вы предсказывали, что к 2026-му он станет подобен коллеге-математику?
Теренс Тао
Надёжным соавтором, при правильном использовании.
Дваркеш Патель
Что, оглядываясь назад, выглядит довольно точно.
Теренс Тао
Да, я вполне доволен.
Дваркеш Патель
Так что давайте посмотрим, сможете ли вы продолжить эту полосу удачных прогнозов. Предположим, вы лично стали в два раза продуктивнее благодаря ИИ. На какой год вы бы это спрогнозировали?
Теренс Тао
Продуктивность, думаю, не совсем одномерная величина. Я определённо замечаю, что стиль, в котором я занимаюсь математикой, довольно сильно меняется, как и тип вещей, которыми я занимаюсь. Например, в моих статьях теперь гораздо больше кода, гораздо больше изображений, потому что сейчас всё это очень легко генерировать. Какой-нибудь график, на создание которого у меня уходили часы, теперь я могу сделать за минуты. Но раньше я бы просто не стал включать этот график в статью. Я бы просто описал это словами. Так что трудно измерить, что означает «в два раза».
С одной стороны, думаю, тот тип статей, которые я пишу сейчас, если бы мне пришлось делать их без помощи ИИ, определённо занял бы в пять раз больше времени. Но я бы не писал свои статьи таким образом.
Дваркеш Патель
В 5 раз?
Теренс Тао
Да, но это вспомогательные задачи. Например, гораздо более глубокий поиск литературы или предоставление гораздо большего количества численных данных. Они обогащают статью. Ядро того, что я делаю, а именно решение самой сложной части математической задачи, не слишком изменилось. Для этого я всё ещё использую ручку и бумагу.
Но есть масса мелочей. Я теперь использую ИИ-агента для переформатирования. Иногда, если все мои скобки не совсем правильного размера, раньше я менял их вручную, а теперь я могу поручить ИИ-агенту сделать всё это довольно качественно в фоновом режиме.
Они действительно ускорили множество второстепенных задач. Они пока не ускорили основную вещь, которой я занимаюсь, но это позволило мне добавлять больше разных элементов в свои статьи. То есть если бы я снова написал статью, которую написал в 2020 году, и не добавлял бы все эти дополнительные функции, а просто сделал бы что-то того же уровня функциональности, то это, честно говоря, не сэкономило бы столько времени. Это (использование ИИ) сделало статьи насыщеннее и шире, но не обязательно глубже.
Дваркеш Патель
Вы проводили различие между искусственной смекалкой (artificial cleverness) и искусственным интеллектом. Я бы хотел лучше понять эти концепции. Что является примером интеллекта, который не сводится просто к смекалке?
Теренс Тао
Интеллект, как известно, трудно определить. Это одна из тех вещей, которые узнаешь, когда видишь. Но когда я говорю с кем-то и мы пытаемся совместно решить математическую задачу, возникает разговор, в котором изначально никто из нас не знает, как решить задачу. У одного из нас появляется какая-то идея, и она выглядит многообещающей, поэтому у нас возникает своего рода прототип стратегии. Мы проверяем её, и она не работает, но затем мы её модифицируем. Здесь есть адаптивность и непрерывное улучшение идеи со временем. В конце концов, мы систематически картируем и то, что не работает, и то, что работает, и видим путь вперёд, но он развивается в ходе нашего обсуждения.
Это не совсем то, что делают ИИ. ИИ могут немного это имитировать. Возвращаясь к аналогии с этими прыгающими роботами: они могут прыгнуть и упасть, прыгнуть и упасть. Но чего они не могут сделать, так это прыгнуть немного, зацепиться за какую-то выступ, остаться там, подтянуть других людей, а затем попытаться прыгнуть уже оттуда. Здесь нет этого кумулятивного процесса, который строится интерактивно. Кажется, это (работа ИИ) гораздо больше похоже на метод проб и ошибок и просто повторение, то есть грубую силу. Это масштабируется и может удивительно хорошо работать в определённых контекстах. Но идеи накопления прогресса на основе частичных результатов, к сожалению, всё ещё не появляются.
Дваркеш Патель
Интересно. Вы говорите, что если Gemini 3 или Claude 4.5, или кто угодно, решит задачу, это не значит, что его собственное понимание математики прогрессировало.
Теренс Тао
Нет, не значит.
Дваркеш Патель
Или даже если оно работает над задачей, не решив её, это не значит, что его собственное понимание математики прогрессировало.
Теренс Тао
Да. Вы запускаете новую сессию, и оно забывает то, что только что сделало. У него нет новых навыков, на которых можно строить решение связанных задач. Возможно, то, что вы только что сделали, составит 0,001% обучающих данных для следующего поколения. Так что, возможно, в конечном итоге часть этого будет усвоена.
Дваркеш Патель
Один из главных вопросов, который я хочу задать: насколько правдоподобен сценарий, что если мы просто продолжим обучать ИИ, и модели будут становиться всё лучше и лучше в решении задач в Lean, будут решать всё более впечатляющие задачи, а затем мы с удивлением обнаружим, что извлекли крайне мало понимания из какого-нибудь решения в Lean для доказательства гипотезы Римана или чего-то подобного?
Или же вы считаете, что необходимым условием для решения гипотезы Римана, даже используя ИИ, который делает это полностью в Lean, является то, что конструкции и определения, созданные в программе на Lean, должны продвинуть наше понимание математики? Или же это могло бы быть просто бессмысленным набором команд на уровне ассемблера?
Теренс Тао
Мы не знаем. Некоторые задачи были по сути решены чистым перебором. Известный пример — теорема о четырёх красках. Мы до сих пор не нашли концептуально элегантного доказательства этой теоремы, и, возможно, никогда не найдём.
Некоторые задачи могут оказаться решаемыми только путём разбиения на огромное количество вариантов и проведения грубого компьютерного анализа, не дающего никакого понимания для каждого варианта.
Отчасти мы ценим такие задачи, как гипотеза Римана, потому что почти уверены: чтобы её доказать, должен быть создан новый тип математики или обнаружена новая связь между двумя ранее не связанными областями математики. Мы даже не представляем себе очертаний решения, но интуитивно чувствуем, что это не та задача, которую можно решить просто исчерпывающей проверкой вариантов решения.
На самом деле, она может оказаться ложной. Есть маловероятный сценарий, что гипотеза неверна, и вы просто можете вычислить ноль вне прямой, и мощные компьютерные вычисления подтвердят это. Это было бы очень разочаровывающе.
Я всё же считаю, что полностью автономные подходы «с одного удара» не являются правильным путём для таких задач. Гораздо больше пользы можно извлечь из взаимодействия людей, сотрудничающих с этими инструментами.
Я могу представить, что одна из таких задач будет решена умными людьми при поддержке чрезвычайно мощных ИИ-инструментов. Но динамика решения может сильно отличаться от того, что мы представляем себе сейчас. Это могло бы стать сотрудничеством такого типа, которого просто ещё не существует.
Возможно, существует способ сгенерировать миллион вариантов дзета-функции Римана и провести анализ данных с помощью ИИ, чтобы обнаружить какую-то закономерность, связывающую их, о которой мы раньше не знали. Это позволит трансформировать задачу в другую область математики. Возможны самые разные сценарии.
Дваркеш Патель
Предположим, ИИ разобрался, и в Lean скрыта какая-то совершенно новая конструкция, которую, если бы мы осознали её значимость, мы могли бы применить во всех этих различных ситуациях. Как бы мы вообще смогли её распознать?
Опять же, очень наивный вопрос, но если вы придумаете эквивалент идеи Декарта о том, что можно иметь систему координат, объединяющую алгебру и геометрию, в коде Lean это будет выглядеть просто как R→R, и это не будет выглядеть как что-то значительное. Я уверен, есть другие конструкции, обладающие таким свойством.
Теренс Тао
Прелесть формализации доказательства в чём-то вроде Lean заключается в том, что вы можете взять любой его кусок и изучить его атомарно.
Когда я читаю статью, решающую какую-то сложную задачу, там часто есть большая последовательность лемм и теорем. В идеале автор объясняет, что важно, а что нет. Но иногда они не раскрывают, какие шаги были важными, а какие были просто шаблонными, стандартными шагами.
Вы можете изучать каждую лемму отдельно. Некоторые из них выглядят довольно стандартно и напоминают что-то знакомое. Я почти уверен, что там ничего интересного не происходит. Но одна из лемм — это что-то, чего я раньше не видел, и я вижу, почему её наличие действительно поможет получить доказательство. Вы можете оценить, является ли шаг действительно ключевым для вашего аргумента или нет, и Lean облегчает это. Отдельные шаги идентифицируются очень точно.
Думаю, в будущем появятся профессии математиков, которые будут брать гигантские доказательства, сгенерированные в Lean, и проводить своего рода оптимизацию, пытаясь удалить части и найти более элегантные способы. Они могут привлекать другие ИИ для обучения с подкреплением, чтобы сделать доказательство более элегантным, и, возможно, другие ИИ будут оценивать, выглядит ли это доказательство лучше или нет.
Что довольно сильно изменится в ближайшем будущем, так это то, как мы пишем статьи. До недавнего времени написание статей было самой трудоёмкой и дорогой частью работы. Поэтому вы делали это очень редко. Вы оформляли свои результаты только после того, как все остальные части вашего вывода были проверены, потому что переписывание и рефакторинг были просто сущей мукой. Сейчас с современными ИИ-инструментами это стало намного проще. Вам не нужно иметь только одну версию вашей статьи. Как только у вас есть одна, можно сгенерировать ещё сотни.
Одно гигантское запутанное доказательство в Lean может быть не очень осмысленным или понятным само по себе, но другие люди могут провести его рефакторинг и сделать с ним всевозможные вещи. Мы видели это на сайте задач Эрдёша. ИИ генерирует доказательство, и вот 3000 строк кода, которые это доказательство проверяют. Затем люди используют других ИИ, чтобы резюмировать доказательство, и люди пишут свои собственные доказательства.
Это известно как постобработка. Как только у вас появляется одно доказательство, мы сразу можем деконструировать и интерпретировать его, у нас сейчас для этого есть много инструментов. Это зарождающаяся область математики, но я не так сильно об этом беспокоюсь. Некоторые люди обеспокоены тем, что произойдёт, если гипотеза Римана будет доказана с помощью совершенно непостижимого доказательства. Я думаю, что как только у нас появится артефакт такого доказательства, мы сможем провести над ним довольно сложный и тщательный анализ.
Дваркеш Патель
Недавно вы опубликовали пост о том, что было бы полезно иметь формальный или полуформальный язык для математических стратегий, а не только для математических доказательств, на чем специализируется Lean. Я очень хотел бы узнать больше о том, как бы это выглядело.
Теренс Тао
Мы на самом деле не знаем. Нам очень повезло с тем, что мы разработали законы логики и математики, но это недавнее достижение. Это началось с Евклида два тысячелетия назад, но только в начале ХХ-го века мы наконец выписали аксиомы математики, стандартные аксиомы того, что мы называем ZFC, аксиомы логики первого порядка и то, что такое доказательство. Нам удалось это автоматизировать, и теперь у нас есть для этого формальный язык.
Мог бы существовать какой-то способ оценки правдоподобия. У вас есть гипотеза, что что-то истинно, вы проверяете несколько примеров, и это подтверждается. Как это повышает вашу уверенность в том, что гипотеза верна? У нас есть несколько специальных математических способов смоделировать это, например, байесовская вероятность. Но часто приходится задавать определённые базовые предположения, и в этих задачах всё ещё много субъективности.
Это скорее желание, чем четкий план разработки таких языков, но, видя, насколько успешным оказалось наличие формальной структуры, такой как Lean, которая сделала дедуктивные доказательства гораздо более лёгкими для автоматизации и обучения ИИ… Узким местом в использовании ИИ для создания стратегий и выдвижения гипотез является то, что мы должны полагаться на человеческих экспертов и проверку временем, чтобы подтвердить, правдоподобно ли что-то или нет.
Если бы существовала какая-то полуформальная структура, где это можно было бы делать полуавтоматическим способом, который нелегко взломать… Для этих формальных помощников по доказательству действительно важно, чтобы не было бэкдоров или уязвимостей, которые можно было бы использовать, чтобы каким-то образом получить сертифицированное доказательство, фактически ничего не доказывая. Потому что обучение с подкреплением просто очень хорошо находит эти бэкдоры.
Если бы существовала какая-то структура, фреймворк, имитирующая то, как учёные общаются друг с другом полуформальным образом, используя данные и аргументы, и создавая при этом нарративы… Существует некий субъективный аспект науки, и мы не знаем, как уловить его таким образом, чтобы мы могли с пользой внедрить туда ИИ. Это проблема будущего. Прилагаются исследовательские усилия в попытке создать автоматизированные гипотезы, и, возможно, есть способы проводить бенчмаркинг и симулировать это, но всё это пока новая, малоизведанная наука.
Дваркеш Патель
Можете ли вы помочь мне получить некоторое интуитивное понимание этого? У меня есть два подвопроса. Во-первых, было бы очень полезно иметь конкретный пример того, как могло бы выглядеть что-то подобное, какой-то способ общения учёных, который мы пока не можем формализовать.
Во-вторых, выглядит парадоксальным заявить, что вы создаёте какой-то нарратив или объяснение на естественном языке и при этом имеете что-то, что можно было бы формализовать. Я уверен, что за этой зоной пересечения стоит какая-то интуиция, и я бы хотел понять это лучше.
Теренс Тао
Вот пример гипотезы: Гаусс интересовался простыми числами и создал один из первых математических наборов данных. Он просто вычислил первые 100 000 простых чисел или около того, надеясь найти закономерности. Он действительно нашёл закономерность, но, возможно, не ту, которую ожидал. Он обнаружил статистическую закономерность в простых числах: если вы подсчитаете, сколько простых чисел есть до 100, 1 000, одного миллиона и так далее, они становятся всё реже и реже, но падение плотности было обратно пропорционально натуральному логарифму диапазона чисел.
Так он выдвинул гипотезу, которую мы теперь называем теоремой о распределении простых чисел: количество простых чисел до X равно X, делённому на натуральный логарифм от X. У него не было способа доказать это. Это было основано на данных. Это была гипотеза. И это было революционно для своего времени, потому что это, возможно, была первая действительно важная математическая гипотеза, носившая статистический характер. Обычно вы говорите о закономерности, например, что расстояние между простыми числами имеет определённую регулярность. Но это не скажет вам точно, сколько простых чисел будет в любом заданном диапазоне. Гипотеза просто дает вам приближение, которое становится всё точнее и точнее по мере удаления всё дальше и дальше.
Это положило начало области, которую мы называем аналитической теорией чисел. Это была первая из многих подобных гипотез, многие из которых были доказаны, что начало укреплять идею о том, что простые числа на самом деле не имеют закономерности, что они ведут себя как случайные наборы чисел с определённой плотностью. У них есть некоторые закономерности, например, почти все они нечётные. Они также на самом деле не случайны, они называются псевдослучайными. В создании простых чисел не задействована генерация случайных чисел. Но со временем становилось всё более продуктивным думать о простых числах так, как будто они просто генерируются каким-то богом, всё время бросающим кости и создающим этот случайный набор.
Это позволило нам сделать и другие предсказания. Есть всё ещё открытая гипотеза в теории чисел, называемая гипотезой о простых числах-близнецах, согласно которой должно существовать бесконечно много пар простых чисел-близнецов, отличающихся всего на два, как 11 и 13. Мы не можем это доказать, и есть веские причины, почему мы не можем это доказать. Но благодаря пониманию статистической случайной модели простых чисел мы абсолютно убеждены, что это верно. Мы знаем, что если бы простые числа генерировались подбрасыванием монет, мы бы просто благодаря случайности, как бесконечные обезьяны за печатной машинкой, видели, как простые числа-близнецы появляются снова и снова.
Со временем мы разработали очень точную концептуальную модель того, как должны вести себя простые числа, основанную на статистике и вероятности. Она в основном эвристическая и нестрогая, но чрезвычайно точная. В тех немногих случаях, когда мы действительно можем доказать что-то о простых числах, это совпадало с предсказаниями того, что мы называем случайной моделью простых чисел. У нас есть такая гипотетическая концептуальная структура для понимания простых чисел, в которую верят все. Это та же причина, по которой мы верим, что гипотеза Римана верна, и почему мы верим, что криптография, основанная на простых числах, математически безопасна. Всё это часть этой веры.
На самом деле, одна из причин, почему нас волнует гипотеза Римана, заключается в том, что если бы гипотеза Римана не подтвердилась, если бы мы знали, что она ложна, это стало бы серьёзным ударом по этой модели. Это означало бы, что у простых чисел есть секретная закономерность, о которой мы не знали. Я думаю, мы очень быстро отказались бы от любой криптографии, основанной на простых числах, потому что если бы была одна закономерность, о которой мы не знали, вероятно, нашлись бы и другие, и эти закономерности привели бы к уязвимостям в криптографии. Это стало бы большим шоком. Поэтому мы действительно хотим убедиться, что этого не произойдёт.
Мы убеждались в таких понятиях, как гипотеза Римана, со временем. Отчасти это экспериментальные доказательства, а отчасти то, что в тех немногих случаях, когда нам удавалось получить теоретические результаты, они всегда совпадали. Возможно, консенсус ошибочен, и мы все просто упустили что-то очень базовое. В прошлом в истории науки происходили сдвиги парадигм. Но у нас действительно нет способа измерить это, отчасти потому, что у нас недостаточно данных о том, как развивается математика или наука. У нас есть одна временная шкала истории, и у нас есть, возможно, 100 историй о поворотных моментах в истории.
Если бы у нас был доступ к миллиону инопланетных цивилизаций, каждая со своим особым развитием истории и науки, тогда, возможно, у нас действительно был бы приличный шанс понять, как мы измеряем, что такое прогресс и что является хорошей стратегией. Мы могли бы, возможно, начать это формализовать и действительно получить некую структуру. Возможно, для начала нам нужно попробовать создать множество мини-вселенных или симуляций ИИ, решающего базовые задачи по арифметике или что-то в этом роде, но придумывающего свои собственные стратегии для выполнения этих действий, такие маленькие лаборатории для тестирования. Есть люди, которые исследуют, какая нейронная сеть является наименьшей, способной выполнять умножение 10-значных чисел или похожие задачи. Я думаю, мы могли бы многому научиться, просто эволюционируя с небольших моделями ИИ на простых задачах.
Дваркеш Патель
Вам приходится изучать новые области не только очень быстро, но и достаточно глубоко, чтобы вносить свой вклад на переднем крае науки. Так что в некотором смысле вы также один из величайших в мире самоучек. Каков ваш процесс изучения новой подобласти в математике? Как это выглядит?
Теренс Тао
Мы ранее говорили о глубине и широте. Это не чисто человеческое противопоставление ИИ. Люди тоже… Думаю, это Берлин (Исайя Берлин) разделил их на ежей и лис. Ёж знает одну вещь очень хорошо, а лиса знает понемногу обо всём. Я определённо считаю себя лисой. Я много работаю с ежами, и иногда, если нужно, я тоже могу быть ежом.
У меня всегда была одна черта, некая одержимость... Если я читаю о чём-то, что, как мне кажется, я способен понять, но не понимаю, почему это работает, то мне кажется, что в этом есть какая-то магия… Кто-то смог использовать тип математики, с которым я не знаком, и получить результат, который я хотел бы доказать. Я не могу сделать это сам, но они смогли сделать это своим методом, и я хочу выяснить, в чём был их трюк. Меня беспокоит, что кто-то другой может сделать то, что, как я думаю, я тоже могу сделать, но пока не могу. У меня всегда была эта одержимая, перфекционистская черта. Мне пришлось отучать себя от компьютерных игр, потому что если я начинаю игру, я хочу пройти её до конца, через все уровни. Это один из способов, которым я изучаю новые области.
Я сотрудничаю со многими людьми, которые научили меня другим типам математики. Я просто завожу дружбу с другим математиком, работающим в другой области математики. Я нахожу их задачи интересными, но они должны научить меня некоторым базовым приёмам, тому, что известно, а что нет. Я многому учусь из этого.
Я обнаружил, что изложение того, что я узнал, очень помогает. У меня есть блог, где я иногда записываю вещи, которые я узнал. В прошлом, когда я был моложе, я бы узнал что-то, проделал этот крутой трюк и сказал: «Хорошо, я запомню это». Затем, через шесть месяцев, я обычно это забывал. Я помню, что помнил это, но не могу восстановить свои рассуждения. Первые несколько раз было так разочаровывающе, когда ты понял что-то, а затем это потерял. Я решил, что всегда должен записывать всё крутое, что я узнал. Это часть того, как появился этот блог.
Дваркеш Патель
Сколько времени у вас уходит на написание поста в блоге?
Теренс Тао
Это то, чем я часто занимаюсь, когда не хочу делать другую работу. Например, от меня требуется какой-то отзыв, рецензия или что-то ещё, выполнение чего в данный момент кажется мне слегка неприятным. Написание блога, наоборот, кажется творческим и весёлым. Это то, что я делаю для себя.
В зависимости от темы, это может занять полчаса или несколько часов. Поскольку это то, что я делаю добровольно, время летит, когда я записываю эти вещи, в отличие от выполнения чего-то рутинного, что я должен делать по административным причинам. Это, кстати, те задачи, с которыми ИИ действительно помогает в наши дни.
Дваркеш Патель
Если бы цивилизация могла с нуля решить, как использовать время Терри Тао как ограниченный ресурс, в чём была бы самая большая разница? Что, если бы «вуаль неведения» могла решить, как использовать время Терри Тао, по сравнению с тем, как это происходит сейчас? Этого подкаста бы не случилось.
Теренс Тао
Как бы я ни жаловался на определённые задачи, которые я не хочу делать, но должен… По мере того как вы становитесь старше в академической среде, у вас появляется всё больше и больше обязанностей, больше всяких комитетов и так далее. Я также обнаружил, что есть мероприятия, на которые я неохотно хожу, потому что был вынужден по той или иной причине… Поскольку это выходит за рамки моей зоны комфорта, это часто приводит к взаимодействию с людьми, с которыми я обычно не общаюсь, например, с вами. Но благодаря этому я узнавал интересные вещи и получал интересный опыт. У меня появлялись возможности для нетворкинга с другими людьми, с которыми я никогда бы не связался иначе.
Так что я действительно верю в серендипность (удачную случайность). Я оптимизирую интервалы своего дня, которые планирую очень тщательно. Но я готов оставить некоторые занятия просто для того, чтобы делать что-то, что не является моим обычным делом. Возможно, это будет пустой тратой времени, но, возможно, я чему-то научусь. Чаще, чем нет, я получаю позитивный опыт, который не планировал.
Да, я действительно верю в серендипность. Возможно, в современных обществах есть опасность, и не только связанная с ИИ, опасность в том, что мы стали действительно хороши в оптимизации всего. Но мы не оптимизируем саму нашу оптимизацию. С пандемией COVID, например, мы многое перевели в формат удалённых встреч, поэтому всё было распланировано. Мы оставались занятыми в академической среде. Мы встречались почти с тем же количеством людей, с которым встречались лично, но всё нужно было планировать заранее. То, что мы потеряли, эти случайные стуки в дверь в коридоре, случайные встречи с кем-то, пока берёшь кофе. Случайные взаимодействия могут казаться неоптимальными, но на самом деле они действительно важны.
Когда я был аспирантом, я ходил в библиотеку, чтобы найти статью в журнале. Нужно было физически взять журнал и прочитать статью. Можно было полистать его, и иногда следующая статья тоже оказывалась интересной. Иногда нет, но можно было случайно найти интересные вещи. Сейчас это практически утрачено. Если вы хотите получить доступ к статье, вы просто вводите её в поисковую систему или ИИ, и вы мгновенно получаете именно то, что хотите. Но вы не получите тех случайных находок, которые могли бы обнаружиться, если бы сделали это менее эффективно.
Я однажды провёл год в Институте перспективных исследований, и это прекрасное место без отвлекающих факторов. Вы там только для того, чтобы заниматься исследованиями. Первые несколько недель это здорово. Вы пишете все те статьи, которые давно хотели написать. Вы думаете о задачах блоками по несколько часов за раз. Но я обнаружил, что если остаюсь там дольше нескольких месяцев, у меня заканчивается вдохновение. Мне становится скучно. Я гораздо больше начинаю зависать в интернете.
В жизни, на самом деле, вам нужен определённый уровень отвлечений. Это добавляет достаточно случайности и «высокой температуры». Я не знаю оптимального способа планировать свою жизнь. Просто кажется, что это работает.
Дваркеш Патель
Мне интересно узнать, когда, по вашему мнению, появятся ИИ, способные заниматься передовой математикой, по крайней мере, так же хорошо, как лучшие люди-математики?
Теренс Тао
В некотором смысле они уже занимаются передовой математикой, которая является сверхразумной и недоступной людям, но это другой «передний край», не тот, к которому мы привыкли. Можно утверждать, что калькуляторы уже выполняли передовую математику, недоступную людям, но это были численные расчёты.
Дваркеш Патель
Но я имею в виду полную замену Терри Тао.
Теренс Тао
Да, но зачем тогда нужен я?
Дваркеш Патель
Вы просто будете ходить по всем этим подкастам...
Теренс Тао
Возможно, это не совсем правильный вопрос. Я думаю, что в течение десятилетия многие вещи, которыми студенты-математики занимаются сейчас, на что мы тратим большую часть времени, и многое из того, что мы включаем в свои статьи сегодня, смогут делать ИИ. Но мы обнаружим, что это на самом деле не было самой важной частью того, чем мы занимаемся.
Сто лет назад многие математики просто решали дифференциальные уравнения. Физикам нужно было точное решение какой-то системы, и они нанимали математика, чтобы тот кропотливо проделал вычисления и вывел решение этого уравнения гидродинамики или чего-то ещё. Многое из того, чем занимался математик 19-го века, можно теперь сделать, зайдя в Mathematica, Wolfram Alpha, пакет компьютерной алгебры или, в последнее время, обратившись к ИИ. И он просто решит задачу за несколько минут. Но мы двинулись дальше. Мы стали работать над другими типами задач.
Когда появились компьютеры, кстати, раньше «компьютерами» были люди, и они кропотливо составляли таблицы логарифмов и вычисляли простые числа, как это делал Гаусс, но всё это было передано на аутсорсинг компьютерам. И мы двинулись дальше.
В генетике секвенирование генома одного организма когда-то было целой диссертацией генетика, который тщательно разделял все хромосомы и так далее. Теперь вы можете просто потратить $1000, отправить образец в секвенатор и получить результат. Но генетика как предмет не умерла. Мы просто перешли на другой масштаб. Возможно, теперь мы изучаем целые экосистемы, а не отдельных особей.
Дваркеш Патель
Я понимаю вашу точку зрения, но когда же большая часть математического прогресса, или даже почти весь математический прогресс, будет происходить благодаря ИИ? Если вы узнаете в этом году, что одна из Проблем тысячелетия решена, вы бы поставили 95% на то, что это сделал ИИ автономно? Наверняка такой год наступит...
Теренс Тао
Я действительно верю, что гибриды «человек + ИИ» будут доминировать в математике ещё очень долго. Это будет зависеть от многих факторов. Потребуются дополнительные прорывы помимо того, что у нас уже есть, так что процесс будет стохастическим. Я думаю, что ИИ в настоящее время очень хороши в определённых направлениях, но реально ужасны в других. Хотя можно добавлять всё больше и больше структур сверху, чтобы снизить уровень ошибок и заставить их работать друг с другом чуть лучше, создаётся ощущение, что у нас пока нет всех ингредиентов для действительно удовлетворительной замены (на ИИ) всех интеллектуальных задач.
Сейчас это дополнение, а не замена. Поскольку ИИ текущего уровня ускорят науку во многих отношениях, надеюсь, новые открытия и прорывы будут происходить быстрее. Но также возможно, что, уничтожая серендипность, мы на самом деле тормозим определённые типы прогресса. На данном этапе возможно всё. Я думаю, что мир сейчас очень и очень непредсказуем.
Дваркеш Патель
Какой совет вы бы дали человеку, который рассматривает карьеру в математике или находится в начале такого пути, особенно в свете прогресса ИИ? Как им следует по-другому думать о своей карьере (если вообще следует) видя прогресс ИИ?
Теренс Тао
Мы живём в эпоху перемен. Как я уже сказал, мы живём в особенно непредсказуемую эру. То, что мы считали само собой разумеющимися на протяжении столетий, может перестать работать. Изменится способ, которым мы делаем всё, и не только математику. Во многих отношениях я предпочёл бы гораздо более скучную, спокойную эпоху, где вещи остаются примерно такими же, как 10 или 20 лет назад. Но я думаю, что нужно просто принять тот факт, что перемен будет много. То, что вы изучаете, может устареть или подвергнуться революции, но некоторые вещи сохранятся.
Всегда нужно следить за возможностями делать то, что раньше было невозможно. В математике раньше нужно было истратить годы и годы обучения, стать кандидатом наук (PhD), прежде чем вы могли бы внести вклад в передний край математических исследований. Но теперь вполне возможно, что даже на уровне старшей школы или около того вы сможете вовлечься в математический проект и внести реальный вклад благодаря всем этим ИИ-инструментам, Lean и всему остальному.
Появится много нетрадиционных возможностей для обучения, поэтому вам понадобится очень адаптивный склад ума. Будет место для занятия чем-то просто из любопытства и для экспериментов. Вам всё ещё нужно получать свои профессии. Ещё какое-то время будет важно проходить традиционное образование и изучать математику и науку по старинке. Но вы также должны быть открыты для совершенно иных способов ведения науки, некоторые из которых ещё даже не существуют. Это пугающее время, но и очень захватывающее.
Дваркеш Патель
На этой прекрасной ноте предлагаю завершить беседу. Теренс, большое спасибо.
Теренс Тао
Взаимно. Было приятно пообщаться.