Возможно ли будущее без ИИ? А генеративного ИИ? Какие тенденции в отрасли сегодня существуют и по какому пути она идет? Останутся ли маркетологи и дизайнеры без работы в будущем из-за активного развития ИИ? И какое применение он находит в авиастроении, ракетостроении? Об этом и не только поговорили с Дмитрием Сошниковым, экспертом в области ИИ, кандидатом физико-математических наук, доцентом Кафедры 806 МАИ «Вычислительная математика и программирование», преподавателем института № 8 «Компьютерные науки и прикладная математика» МАИ.
— Дмитрий, расскажите немного о себе: как получилось, что Вы решили связать свою профессиональную деятельность с ИИ в МАИ?
Я заканчивал физматшколу №224 при МАИ, поэтому прошел туда по «облегченному» формату, выпускные из школы были сразу вступительными. Были мысли поступать в МФТИ, но жизнь сложилась так, что на 2 года от МАИ поехал учиться в международный колледж UWCAD в Италии, а по возвращении продолжил учебу в МАИ. На 2-м курсе началась научная работа: мой руководитель, Зайцев Валентин Евгеньевич, занимался рядом проектов на базе символьного ИИ. Оттуда появилась тема моей диссертации — распределенный символьный ИИ.
— И так вы пошли с ИИ по жизни…
Да, все верно. И продолжил углубляться в эту тему дальше. Но сейчас ИИ, конечно, совсем не тот, которым я начинал заниматься!
— А какой он? Как Вы оцениваете развитие ИИ на сегодняшний день?
Сейчас ИИ почти является синонимом понятий «Машинное обучение» или «Нейросети». Мне посчастливилось углубиться в эту тему и пройти курс по нейросетям в Microsoft Research Cambridge, и потом поработать с командой талантливых исследователей в Microsoft над внедрением ИИ в разные европейские компании. Лет 10 назад началось очень активное внедрении ИИ в таких задачах, как компьютерное зрение, или базовое понимание текста, а года 2-3 назад случился бум генеративного ИИ, который сильнее всего может изменить наш мир.
— Согласны ли Вы с тем, что использование генеративных сетей, ИИ нужно ограничивать?
Я думаю, что ограничивать использование технологий бесполезно, тем более что уже сейчас есть свободно распространяемые модели, которые можно дорабатывать «на коленке» и внедрять для решения каких-то задач. Но вот крупным компаниям, конечно, стоит задуматься над тем, чтобы соблюдать баланс между исследованиями в области совершенствования моделей и разработкой в области этического ИИ, или, как модно сейчас это называть, «выравнивания» — чтобы «ценности» ИИ совпадали с ценностями человека. Мы недавно наблюдали такой конфликт внутри компании OpenAI.
— Уже сейчас нейросеть успешно сдает экзамены, пишет дипломы, создает дизайнерские решения, рисует… В чем-то даже конкурирует с человеком…
Безусловно, ИИ может решать многие задачи, некоторые из них — лучше человека. Например в паре недавних исследований было установлено, что в области дивергентной креативности генеративный ИИ показывает себя лучше, чем 99 % людей с точки зрения разнообразия идей и скорости их генерации. В то же время проработанность решений у ИИ страдает, и это — следствие ограничений ИИ-моделей, о которых, например, говорится в этой статье. Основное ограничение — модели не могут вести диалог сами с собой «в голове» для совершенствования решения, они занимаются только линейной генерацией текста и для пересмотра решений и их итеративного улучшения нуждаются в каком-то внешнем воздействии — либо в соавторстве с человеком, либо в рамках каких-то многоагентных систем на базе LLM.
— Возвращаясь к генеративным сетям: с чем связано столь активное движение в их популяризации?
Думаю, популяризация во многом объясняется эффектом FOMO (Fear of Missing Out) — боязнь опоздать. Все компании понимают, что генеративный ИИ может сильно изменить экономику, и начинают думать, как внедрять ИИ в свои рабочие процессы. Но даже если компании этим не занимаются, я бы очень рекомендовал всем читателям озаботиться темой генеративного ИИ в частном порядке. Ведь использование ИИ в своей работе сделает вас существенно более продуктивным и креативным.
Правда, надо немного научиться правильно использовать ГенИИ и не останавливаться при первых неудачах. Я многим своим знакомым рекомендовал попробовать ChatGPT в их работе и личной жизни, и часто ко мне возвращались со словами: «Этот ИИ глупый — мы спросили его, как увеличить продажи в компании, а он посоветовал снизить цены. Мы это и так знали». Так вот проблема здесь не с ИИ, который, кстати, дает правильный ответ на поставленный вопрос. Проблема в том, что надо научиться общаться с ГенИИ, т. е. почитать или послушать про промпт-инжиниринг. Могу рекомендовать курс, который мы сделали с коллегами из ФКН и лаборатории генеративного ИИ Школы дизайна НИУ ВШЭ.
— Сейчас затрачиваются огромные усилия для развития этого направления: рождаются стартапы, вливаются инвестиции. К чему все идет?
Думаю, все пойдет, как всегда, по кривой Гартнера, и через какое-то время мы научимся правильно применять ИИ в нашей жизни. В то же время будут рождаться более интересные технологии. И так до бесконечности. При условии, что не случатся какие-то негативные сценарии, связанные с развитием ИИ и не только.
— Анализируя сегодняшнюю ситуацию, вы бы могли выделить тенденции в развитии ИИ?
Изначально ИИ был про извлечение знаний из человека и построение символьных систем рассуждений. Сейчас закономерным образом маятник качнулся в другую сторону, и большинство ИИ-систем основаны на машинном обучении. Однако только с помощью машинного обучения мы пока не научились формировать в нейросетях символьную картину мира, способности к прозрачным интерпретируемым рассуждениям. В то же время мы наблюдаем, что для обучения моделей требуется все больше ресурсов и данных, и в какой-то момент мы можем упереться в фундаментальный потолок возможностей. Поэтому будет интересно посмотреть, как будет развиваться изучение и создание ИИ дальше, сможет ли возникнуть какая-то эмерджентная картина мира в относительно базовых архитектурах трансформеров, или мы пойдем по пути создания какого-то более сложного механизма в рамках нейросетевой или даже гибридной парадигмы. В итоге, я надеюсь, исследования в области ИИ дадут нам больше понимания того, как мы сами устроены, и возможно смогут ответить на какие-то фундаментальные вопросы мироздания.
Параллельно с этим идет быстрое внедрение существующих технологий, которые уже способны радикально изменить мир. Например на основе генеративных сетей уже сейчас идут первые эксперименты по чтению мыслей с помощью ИИ, а в перспективе это может привести и к передаче мыслей, минуя язык, с помощью более богатых выразительных возможностей пространств семантических эмбеддингов нейросетей. Страшно представить, какой эффект это будет иметь на цивилизацию в целом! Кстати, фантаст Клиффорд Саймак в своем романе «Город» описывал именно такой прибор, который помогает людям точнее передавать мысли…
— А давайте поговорим об аэрокосмосе. Как используется ИИ в этой отрасли?
В аэрокосмосе с использованием ИИ есть проблема: это — отрасль, где очень высока цена ошибки, и поэтому использовать ИИ-модели, которые априори вероятностные, не всегда получается. Классические процессы, где нужны компьютеры — расчет аэродинамики, прочности и т. д. — хорошо решаются классическими методами, и ИИ здесь скорее выступает как технология, способная радикально удешевить возможности таких расчетов за счет внедрения технологий на стыке нейросетей и уравнений в частных производных (так называемые физически-информированные нейронные сети, PINN). Поэтому ожидать такого же «легкого» эффекта повышения производительности от генеративного ИИ, как в индустриях типа маркетинга и рекламы, в аэрокосмической отрасли не приходится — тут нужна кропотливая исследовательская работа, которая, тем не менее, со временем даст результат.
— В контексте развития нейросетей, какие отечественны стартапы вы бы могли выделить?
В ИИ-ландшафте надо выделить крупные компании, которые могут позволить себе обучать большие языковые модели, и стартапы или исследовательские группы, которые ищут новых эффективные способы их использования. В области обучения LLM в России есть конкуренция, поскольку и Яндекс, и Сбер достаточно успешно обучают свои языковые модели, которые, правда, пока конкурируют с мировыми лидерами лишь отчасти. Здесь дело все-таки в доступных вычислительных мощностях и датасетах, и, если посмотреть на общемировую ситуацию, есть не так много стран, которые в целом могут себе позволить обучение LLM. Но у нас, к счастью, есть очень сильная экспертиза в этом направлении, в обеих упомянутых компаниях. Другие экосистемные компании также планируют или выводят на рынок (или, как минимум, используют внутри продуктов) свои модели: VK, MTC, T-Банк. Все это приводит к созданию очень интересных услуг, например МТС обещает автоматически детектировать мошенников в ходе телефонных звонков, а Т-Банк создал голосового ассистента, который, прикидываясь человеком, держит мошенников на линии как можно дольше, чтобы их деятельность становилась экономически невыгодной.
— А в вашей научной деятельность есть проекты, связанные с ИИ? Какие планы в этом направлении?
Я сейчас очень много занимаюсь популяризацией направления генеративного ИИ, рассказываю об этом людям и компаниям, помогаю искать точки приложения. Этому помогает мой интерес к генеративному искусству и Science Art. Например сейчас в галерее «Краснохолмская» на выставке представлен мой экспонат «Кибернетическое бессмертие FIDONet», в котором обученная на архивных переписках генеративная сеть оживляет давно умершую компьютерную сеть, создавая бесконечный поток сообщений между виртуальными персонажами. Это помогает нам не только вспомнить историю компьютерной техники, но и поразмышлять об идее сознания и возможности оживления своеобразных «призраков прошлого». И, кстати, этот проект был также представлен на международной конференции HISTELCON 2023. Похожие идеи виртуальных персонажей исследуются в проекте «Театр роботов», который позволяет опробовать подходы коммуникации агентов на наглядной задаче вербальной коммуникации персонажей в процессе создания искусственно-интеллектуальной пьесы.
Много работ у нас на кафедре 806 МАИ ведется на стыке с аэродинамикой, в русле того, о чем я говорил выше: от тривиальной генерации синтетических данных для машинного обучения до разработки креативных отраслевых проектов. Еще одно направление исследований — это 3D-ML, т. е. использование ИИ для понимания или конструирования 3D-сцен в виртуальной или дополненной реальности. Пока что направление дополненной реальности сдерживается отсутствием дешевых и доступных устройств для погружения, но в перспективе, за счет нейроинтерфейсов, погружение может стать намного более иммерсивным, и лучше подготовить технологии к этому моменту.
Интересным оказался эксперимент по применению генеративного ИИ в подготовке студентов на «цифровой кафедре» МАИ. Одна из программ на кафедре разработана для студентов гуманитарных направлений подготовки, которым оказалось не только интересно, но и практически полезно изучить возможности ГенИИ для планирования рекламных кампаний, коммуникаций с пользователями через сгенерированных виртуальных персонажей, создания обучающих комиксов вместо руководства пользователя и т. п. Важно, что студенты, прошедшие обучение на «цифровой кафедре», теперь убеждены, что ИИ — и тем более ГенИИ — «нам строить и жить помогает», и без него уже невозможно представить будущее.