На днях прошла наша конференция GigaConf, посвящённая ИИ в бизнесе. Мы подготовили сборник ознакомительных выступлений с трека открытия.
Об ИИ в Сбере и в мире
Беседа с Максутом Шадаевым, министром цифрового развития связи и массовых коммуникаций РФ
Об ИИ‑экосистеме MindSpore — фреймворке и платформе
Достижение целей бизнеса с помощью технологий
Лето искусственного интеллекта
Андрей Белевцев, старший вице-президент, руководитель блока «Технологическое развитие»
Главной темой последних лет стал искусственный интеллект. Чем он был для нас раньше? Технологией повышения эффективности. Мы во многих областях нашей работы внедряли решения, основанные на искусственном интеллекте. И хотя миры ИТ и data science всегда были очень близко друг к другу, всё же они немного различаются. А сегодня уже можно сказать, что искусственный интеллект стал центральной технологией — в ИТ мы видим её на каждом этапе создания продуктов: в проектировании, разработке и эксплуатации. Очень часто наши клиенты даже не знают, что им во многом помогают системы на основе искусственного интеллекта. И всё же, представить себе без него современный клиентский опыт уже невозможно. Такая тенденция во всём мире. В 2023 году каждую неделю было по два-три релиза фундаментальных моделей. Правда, в основе большинства из них open source-модели.
За прошлый год на GitHub появилось около двух миллионов ИИ-проектов, а с 2011 года их количество выросло в 2000 раз. 80 % опрошенных нами разработчиков уже используют в своих личных проектах ИИ-ассистента. 60 % компаний тестируют, внедряют или уже внедрили в свою работу генеративный искусственный интеллект. Причём крупные компании невероятно оптимистичны: в ближайший год-полтора ожидается повышение общей продуктивности больше, чем на 22 %.
Наша флагманская генеративная нейросеть GigaChat находит применение в компаниях любого размера. С начала 2024 года больше 4000 самых разных компаний начало использовать эту технологию. В том числе крупнейшие промышленные гиганты. Например, Сибур делает очень сложные промышленные решения: ассистенты диагностики динамического оборудования, анализ упущенного маржинального дохода. C другой стороны, активно приобщаются малый и средний бизнес. Скажем, компания Jivo и система SaluteBot с интегрированной GigaChat помогают экономить 85 % затрат на обработку обращений пользователей. Растёт и удовлетворённость клиентов, по опросам — на 15-20 %.
Многих волнует этот вопрос. Мы станем безработными или получим волшебного помощника, который поможет нам доделать ту работу, на которую вечно не хватает времени, или освободит нас для более интересных задач? Чтобы ответить на это, расскажу несколько новостей из нашей экосистемы разработчиков.
Мы представили его в первом квартале 2024 года. Это очень молодой продукт, но считаем, что качество работы моделей достигло необходимого уровня после слепого тестирования дописыванием нескольких тысяч фрагментов кода. И на несколько процентов, но мы превосходим лучшие мировые разработки. На наш взгляд, сегодня программировать без ИИ-помощника уже и не очень удобно, и не очень эффективно.
В IDE GigaCode встроен инструмент CodeChat. Прямо в окне можно ставить ассистенту задачи, и он будет подробно объяснять сгенерированный код, что особенно полезно для новичков. Также мы сильно автоматизировали генерацию автотестов. GigaCode уже поддерживает больше 30 языков, это около 90 % активно используемых сегодня.
В марте 2024 года мы представили российскую платформу для работы с исходным кодом. По одному клику можно мигрировать из GИТHub, и сохраняется постоянная синхронизация. Из новых функций:
Открытый бесплатный менеджер задач для командной работы.
Также прямо в репозитории GigaCode может проверить ваш код. Второе мнение всегда полезно, вне зависимости от того, работаете ли вы в один или в команде.
А третья новинка больше обрадует менеджеров и владельцев продукта: можно попросить GigaCode оценить трудозатраты на разработку вашего проекта. Вы можете загрузить свой проект на GitVerse, и система скажет, к примеру, сколько времени заняла бы разработка этого проекта middle‑разработчикам. Можно оценивать даже отдельно по коммитам.
У GitVerse есть и много других функций, в том числе публикация релизов и хранение пакетов, статусы CI/CD и DevSecOps-конвейер.
Это IDE, который можно инсталлировать или использовать в облаке. Российская поддержка, встроенный GigaCode. Доступно уже больше 70 плагинов, есть интеграция с CodeChat.
Согласно исследованию Stanford AI Report, в 2023 году больше 65 % опубликованных моделей машинного обучения были с открытым исходным кодом, как и 4 из 15 самых производительных LLM. Однако нужно понимать, что в машинном обучении есть код модели и веса, полученные в результате обучения — ими многие делятся, помогая развивать отрасль. А есть сами обучающие данные, которыми, обычно, не делится никто. И при использовании чужой модели очень важно понимать, насколько она будет интерпретируема, насколько мы можем доверять и объяснять её результаты. Особенно в бизнес-приложениях.
Правительство сейчас активно работает над национальным проектом «Экономика данных и цифровая трансформация государства». Что от него ждать нашему сообществу? Что это значит для страны? Для инженеров? Что самое главное?
Этот нацпроект планируется запустить в следующем году. Он станет продолжением действующей национальной программы «Цифровая экономика». Назову несколько амбициозных задач.
Собственная низкоорбитальная спутниковая группировка для доступа в интернет. Это один из важнейших приоритетов. Пока было два тестовых запуска, на орбите сейчас шесть аппаратов. Успешно пройдены испытания, включая межспутниковую лазерную связь. Надеемся, что разработчики смогут дать нам новые технологии и повысить качество связи.
Вторая большая история — создание цифровых платформ для трансформации здравоохранения, госуправления и т. д. Придётся отказаться от такой «лоскутной» цифровизации на местах и выходить в облака.
Искусственный интеллект. Мы считаем, что можно значительно сократить сроки оказания услуг — вплоть до реального времени. Чтобы люди получали необходимый документ прямо в момент обращения. Но главный вызов — это переход к индивидуальным траекториям. Задача искусственного интеллекта — обобщать данные и создавать полноценный цифровой профиль конкретного человека, выстраивать его траекторию развития или помощи от государства.
Переход исключительно на российское ПО.
С учётом основного вектора развития страны, чем сейчас лучше заняться инженерам и другим техническим специалистам? Особенно студентам?
Мы создали воронку: за 4 года на 50 % увеличилось количество школьников, сдающих информатику как экзамен в рамках ЕГЭ. В 2,5 раза выросло количество бюджетных мест в ВУЗах, на айтишные специальности мы можем ежегодно зачислять 115-120 тысяч человек. И конкурсы туда большие. Молодёжь готова связывать свою судьбу с ИТ. При этом, безусловно, важно обеспечить необходимый уровень преподавания языков программирования.
Также примерно 30-40 % не доучивается до диплома. На рынке огромный спрос, студент на третьем-четвёртом курсе может получить хорошее предложение и уйти работать. Но в будущем недоученность может помешать его профессиональному и карьерному развитию.
Поэтому мы всё-таки будем возлагать на ИТ-бизнес обязанность участвовать в вузовском обучении. Возможно, это станет условием сохранения льгот от государства.
На ближайшие 5-6 лет какие вы видите перспективные направления для начинающих ИТ-предпринимателей?
Есть огромный спрос на всё, что связано с «тяжёлыми» решениями: робототехникой, базовыми станциями, спутниками, промышленной автоматизацией, сложным ИИ. За такими специалистами будут прямо охотиться.
Вы сказали про развитие платформ как основу для практического прикладного внедрения искусственного интеллекта. Увидим ли мы вместе с этим каких-нибудь социальных ИИ-помощников? Как это видится со стороны государства?
Например, штрафы для автомобилистов уже формируются с помощью ИИ-систем. На втором месте по темпам внедрения и по ожиданиям — здравоохранение: распознавание снимков КТ и МРТ, рекомендательные сервисы для врачей. Здесь тоже огромный потенциал с точки зрения качества лечения, повышения производительности, минимизации врачебных ошибок. На третьем месте дистанционное зондирование Земли: оценка автотрафика, незаконные вырубки лесов, развитие сельского хозяйства, эффективность использования земель, городское планирование и другое. Это технологии высокой степени зрелости, они будет развиваться в сторону сложной геоаналитики.
Могли бы вы в заключение дать напутствия сегодняшним инженерам?
Вам выпало жить в непростое, но суперинтересное время. При общении с крупными организациями, мне раньше говорили, что они хотят зарубежные инструменты, чтобы конкурировать с лучшими международными компаниями. Но ситуация сложилась по-другому. Сейчас у российских решений есть реальный шанс, и на их разработчиках очень большая ответственность: сделать даже лучше. От многих компаний, которые внедряют какие-то отечественные отраслевые решения, я уже слышу: «На самом деле круто работает, нам даже больше подходит». Но пока что мы только в начале пути.
Сяомань Ху, старший директор MindSpore, разработчика open source-фреймворка для глубокого обучения
Кроме своей должности в MindSpore я также председатель комитета по связям с общественностью фонда LF AI & Data, эксперт Китайского института электроники, руководитель open source-проекта и основатель MSG Women in Tech. Сегодня я расскажу о тенденциях в отрасли искусственного интеллекта и о платформе MindSpore.
Ещё недавно мы использовали ИИ в основном для классификации изображений. Но с появлением моделей уровня GPT-4 стало возможно создавать целые миры. Всё важнее становятся LLM (большие языковые модели) и фреймворки для их обучения. Некоторые разработчики считают, что нам не нужно использовать фреймворк для написания кода. С помощью фреймворков ИИ мы сможем резко повысить эффективность, использовать для обучения меньше ресурсов.
Mindspore — это open source-проект, основанный в марте 2020 года. Этот фреймворк способен работать с центральными, видео- и нейронными процессорами. Его архитектура:
В центре архитектуры изображён компилятор (MindCompiler), который повышает эффективность обучения моделей. Модуль MindData используется для обогащения данных. MindInsight помогает визуализировать информацию, а MindArmour обеспечивает информационную защиту при обучении моделей. ModelZoo — репозиторий моделей для компьютерного зрения, обработки аудио и естественного языка и решения других задач.
MindSpore поддерживает несколько методов распараллеливания обучения моделей:
Выбор режима зависит от доступного вам оборудования, характера данных и архитектуры модели. Если затрудняетесь, то можно положиться на автоматику, и фреймворк сам выберет подходящий, по его мнению, вариант.
Фреймворк нативно поддерживает недорогой вывод базовых моделей для масштабного коммерческого развёртывания. Сейчас в MindSpore доступно более 20 базовых предобученных open source-моделей с GitHub. опенсорсные. Их использует более 40 % китайских компаний в отрасли ИИ, в том числе PCL, CodeGeeks, Zigong Taichu.
Чтобы облегчить начало работы с фреймворком, мы создали более 10 наборов для разных задач:
Сегодня очень много разработчиков используют PyTorch, поэтому мы разработали модуль MindTorch, портирующий код этой библиотеки во фреймворк.
Сегодня более 5500 компаний по всему миру используют промышленную экосистему. В неё входит более 600 моделей и свыше 1000 научных публикаций с наиболее авторитетных конференций. Экосистему поддерживает сообщество из более чем 25 000 участников. Общее количество загрузок превысило 7,3 миллиона.
Подробнее о фреймворке и всей платформе MindSpore вы можете узнать здесь:
Александр Салтанов, директор по разработке департаментов доверия и безопасности и коммуникации Авито
Мне всегда было интересно, как из стартапов получаются экосистемы? И когда я пришёл в Авито, у меня появилась возможность устроить сеанс цифровой археологии.
Достижение целей бизнеса с помощью технологий — основная работа технического подразделения и всех технических менеджеров. Задача выглядит примерно так: «А давайте уменьшим сложность покупки какой-то категории товаров?» Так у нас в компании появились так называемые вертикали — независимые бизнесы, отвечающие за определённые товарные направления, со своей разработкой. При этом нужно научиться быстро расти, по возможности не теряя техническую культуру и возможности решать бизнес-задачи.
Шесть лет назад у нас было около 300 инженеров. Они занимались всем: продуктовой разработкой, инфраструктурой, админками. А сейчас у нас более 1800 инженеров, и больше 200 из них занимаются только развитием техплатформы.
Когда вы маленькая компания, вам нужно заниматься своими технологиями, унифицировать инфраструктуру, учить людей. Шесть лет назад у нас был монолит на PHP. Однажды команда решила перейти на микросервисную архитектуру. И когда монолит распилили, то выяснилось, что микросервисы не бесплатные. Внезапно все инженеры начали использовать Kubernetes, разбираться в том, что такое Helm Chart’ы, стали создавать CI/CD-конвейеры, собирать метрики. Но за это время продукт сам себя не напишет. То есть компания не зарабатывает деньги, пока инженеры заняты инструментами.
Тогда товарищи решили заниматься тем, что сейчас называют developer experience. У нас появилась PaaS — Platform-as-a-Service. Я ещё в Авито не работал, но ко мне приходили оттуда люди и говорили: «Саша, у нас была офигенная штука, которая за нас делала огромное количество рутины». На самом деле, то, что умеет PaaS, может сделать любой разработчик: работа с БД, создание очередей, кеши и прочее. Кстати, в Авито ходит байка, что с помощью PaaS можно развернуть что-нибудь в эксплуатацию в первый же день работы.
То есть всё это перечислили в описании сервиса, и волшебным образом появились очереди, базы данных, кеши и прочее, сразу с нужными параметрами. Очень удобно и здорово. К тому же есть красивый и информативный интерфейс. Здесь можно посмотреть ресурсы, версии библиотек, релизы, ошибки и т. д.
Итак наши инженеры научились быстро делать огромное количество микросервисов. И всё было бы хорошо, если бы они ещё умели делать это хорошо. При этом мы любим единообразие и очень хотим, чтобы был единственный способ делать хорошо. Хотя бы два. В крайнем случае три. И всё это поместим в какой-нибудь инструмент. Примерно так мы поступили. Но внезапно выяснилось, что господа инженеры не знают, каким образом им что-то делать, то инструмент не поможет, их надо учить. Так несколько лет назад в компании появился внутренний девятимесячный курс по микросервисной архитектуре. И после его прохождения у инженеров должна была появиться хорошая, правильная архитектура, верно?
В теории, нет разницы между практикой и теорией, а на практике эта разница есть. Все команды теоретически всё знают, а на практике каждая применяет по-своему. А поскольку мы очень любим унификацию, чтобы можно было передавать сервисы из команды в команду и чтобы люди могли переходить между командами, то помогло нам только Technical Design Review. У нас настолько глубоко развивают архитектурные навыки у старших инженеров, что мы нормально живём без архитекторов. А если мы понимаем, что нам где-то не хватает знаний, то зовём специалистов на техническую рецензию, чтобы помогли нам разобраться. В результате у нас достаточно высокое качество архитектурной проработки.
Но есть маленькая проблема: за долгие годы существования Авито как горизонтальной доски объявлений у нас сформировался не только технический монолит, который мы победили, но ещё и организационный монолит. Как это выглядело? Есть поисковая выдача, которая немного различается для разных категорий товаров, но всё это делала одна команда. И если захочется сделать что-то новое, то придётся обратиться к этой команде. Чтобы избавиться от подобных узких мест, мы решили, что нам нужна платформизация. Чтобы менеджеры меньше отвлекали инженеров для решения бизнес-задач.
Конечно же, мы создали новые технологии:
Bricks — платформу для управления разметкой страниц и экранов в веб‑ и нативных приложениях. То есть мы словно из кирпичей собираем разные интерфейсы.
Beduin — движок рендеринга, реализующий Backend‑driven UI на всех платформах. Почти все используют подобное для мобильных приложений, а мы применяем его везде.
Любой человек, даже не умеющий программировать, может в админке Bricks подвигать мышкой нужные элементы, и они появятся в приложении.
Если в 2023 году на добавление нового поля в сниппет уходил в среднем 21 день, то сейчас — 3 дня. Инженеры решают сложные инженерные задачи, а менеджеры — свои бизнес-задачи.
Что нам помогло вырасти? Ставка на автоматизацию, унификацию и технодиктатуру. То есть мы хотим, чтобы у нас всегда был один, максимум два способа что-либо сделать. Хороший пример — PaaS. И обучение сотрудников, от этого никуда не денешься. Но самое интересное, что ничего из этого нельзя высечь в граните. Не получится принять одно решение и навсегда. Всё будет меняться.
Сергей Марков, руководитель исследовательской программы GigaChat и R&D SberDevices
Я расскажу о том мире, в котором мы с вами оказались, и о том будущем, которое хочется создать нашими руками.
Примерно с начала 19 века мы решили, что история человечества связана с тремя субстанциями: камнем, железом и бронзой. Человечество постепенно подчиняло их своей воле. Но на самом деле та версия истории, в которой мы с вами оказались, должна была продемонстрировать, что венцом творения является металлургический завод. А дело в том, что в 19 веке историкам стали негласно платить промышленники, потому что о каменном, бронзовом и железном веке ещё в 16-17 веках даже не знали. Если бы историкам платил Папа Римский, то в исторических трудах писали бы, что всё началось с Адама и Евы, и далее по тексту. Но мы уже давно не в 19 веке. И сегодня на вершине капитализации находятся компании, которые занимаются бизнесом, связанным с обработкой информации, а не металла.
Давайте посмотрим на историю человечества в другом разрезе. Что, если не было никакого каменного, бронзового и железного века, а был век устной речи, которому на смену пришёл век письменности, потом его сменило книгопечатание, и затем наступила эпоха интернета? В этом есть резон, потому что каждый из этих этапов выводил нас на совершенно новый уровень обработки информации. Когда появилось книгопечатание, стоимость создания книги уменьшилась в десятки тысяч раз. Уже не нужно было нанимать писца, который каждую копию изготавливал от руки. С каждым новым этапом растёт количество производимой и доступной людям информации. Каждая из этих технологий радикально меняла наш мир. И кажется, что мы сейчас на пороге или даже внутри новой революции, связанной с технологиями генеративного искусственного интеллекта.
Сейчас каждые два года количество оцифрованной информации увеличивается примерно вдвое. В 2025 году мы накопим 175 зеттабайтов данных. Если всё это записать на DVD-диски и сложить в стопку, то она в 44 раза превысит расстояние от Земли до Луны. И через два года эта стопка вырастет вдвое. Сегодня это во многом происходит за счёт развития технологий генеративного искусственного интеллекта. Причём модели активно осваивают новые модальности. Мы по инерции говорим о больших языковых моделях, хотя сегодня вовсю создаются мультимодальные, работающие и с музыкой, и с изображениями, и с текстом. Появляются первые омнимодальные модели, которые могут получать на вход любую комбинацию модальностей, и генерировать тоже любую комбинацию.
Но некоторые тенденции неприятны. Например, повышается закрытость разработок. Как только компании начинают чувствовать деньги, как только государство начинает чувствовать стратегические интересы, возникает закрытость. К счастью, сегодня не все компании пришли к этому, и мы тоже стараемся сопротивляться этой тенденции.
Ещё один важный тренд — движение в сторону интерактивного искусственного интеллекта. У революции глубокого обучения, которая произошла за последние 10 лет, можно чётко выделить три стадии:
Дискриминативный искусственный интеллект. Вначале наши модели научились распознавать котиков, речь, распознавать и всё, что угодно.
Потом, благодаря революции трансформеров, мы оказались в эре генеративного искусственного интеллекта.
Дальше, по мнению лидеров индустрии, нас ждёт интерактивный искусственный интеллект. То есть системы, которые будут решать интеллектуальные задачи, не решаемые в один присест. И в процессе они будут взаимодействовать друг с другом и программными инструментами.
Сегодня самая горячая тема в мире больших языковых моделей — это агентность. Мы переходим к созданию фундаментальных агентов — моделей, которые предобучаются выполнять различные действия и затем становятся основой для создания всевозможных агентов. Это похоже на наш разум: он не един во всех своих проявлениях, мы меняем роли в процессе выполнения разных задач. Мы приближаемся к созданию систем, которые способны к медленному мышлению, а не только к быстрому.
В мире больших языковых моделей сегодня есть и много других интересных тенденций:
Некоторые люди считают, что в 2027 году появится универсальный самосовершенствующийся искусственный интеллект.
Но надо осторожно относиться к таким прогнозам. Любая экстраполяция чревата некоторыми последствиями. Реальные экспоненты обычно превращаются в S-образные функции. Поэтому, даже в рамках быстрого линейного масштабирования вычислительных мощностей, в силу мультиагентного характера решаемых интеллектуальных задач прирост интеллекта будет нелинейным. Есть целый ряд физических барьеров, из-за которых, скорее всего, никакого «интеллектуального взрыва» не произойдёт.
Мир будет куда многообразнее и интереснее того, что нам мог бы устроить общий искусственный интеллект. На мой взгляд, по мере приближения к этой сверхтехнологии темпы роста будут, скорее, замедляться. Уже через несколько лет мы увидим снижение отдачи от масштабирования, упрёмся в энергетические ограничения и ряд других проблем. Это заставит нас искать новые пути развития технологий машинного обучения.
В эру такого быстрого технологического прогресса самым важным являются именно человеческие качества. Потому что технология сама по себе нейтральна. Применение зависит только от нас с вами. Важно об этом не забывать и действовать ответственно.