Понедельник, 27 июня, 2022

Мы считаем, что мир 2051 — это мир без войны.

Котики vs нейросети: технологии на страже нашего веселья

Время на чтение 5 мин.

Нейросети — это, безусловно, одно из самых замечательных изобретений, которое вошло (и еще войдет) во многие сферы нашей жизни. Но человек не был бы человеком, если бы не попробовал приспособить эту штуку для развлечения и прочих глупостей. Впрочем, глупостями перечисленные ниже вещи можно назвать только на первый взгляд.

Несуществующие коты. И люди.

В конце 2018 года компания Nvidia продемонстрировала миру свою нейросеть StyleGAN. Она была предназначена для того, чтобы генерировать изображения человека, и могла работать на обычных графических процессах Nvidia. В 2020-м появилась улучшенная версия StyleGAN2, а в 2021-м — StyleGAN3. Они делают еще более реалистичные изображения. Можете убедиться сами: два преподавателя Университета Вашингтона из Сиэттла создали на основе StyleGAN создали сайт, пользователям которого нужно выбрать из двух фотографий настоящего человека: https://www.whichfaceisreal.com/

В 2019 году инженер Uber Филипп Вонг создал сайт https://thispersondoesnotexist.com/ При каждой загрузке веб-страницы StyleGAN генерирует новое лицо — и его практически невозможно отличить от настоящего. Впрочем, в интернете редко любят людей, а вот котиков — практически всегда. Поэтому Филипп Вонг создал https://thiscatdoesnotexist.com/, где нейросеть генерирует господ кисулькеных на основе настоящих фотографий питомцев.

Котики vs нейросети: технологии на страже нашего веселья
Несуществующая женщина. Фото: thispersondoesnotexist.com

Палка, палка, огуречик

Нейросети не только генерируют правдоподобные изображения, но и распознают их. Это применение, например, очень важно для оцифровки старых книг: алгоритмы распознают тексты на сканах, заменяя кропотливый ручной труд по набору текста. Остается только отредактировать результат.

Посмотреть, как это работает, можно на примере https://www.autodraw.com/ Нейросеть анализирует каракули и предлагает варианты того, что вы хотели нарисовать, основываясь на произведениях профессиональных художников. В общем, такой Paint, который помогает людям с рисовательной беспомощностью. Заодно можно внести свой вклад в развитие технологий будущего.

Великая война с кошками

В ней тоже замешана Nvidia, а точнее ее инженер Роберт Бонд и платформа Jetson TX1, предназначенная для ресурсоемких расчетов с использованием технологий искусственного интеллекта и глубокого обучения.

Началось все с постановки проблемы. Она была тривиальной для любого американского одноэтажного пригорода. Соседские коты регулярно гадили на газон семейства Бондов, а миссис Бонд была заядлой садовницей и очень огорчалось, когда в ее владениях наступал беспорядок. Поскольку отлавливать котов или гнать пинками под наглый зад «было бы не по-соседски», Роберт привлек высокие технологии.

Инженер установил направленную на газон камеру. Как только в поле ее зрения попадал движущийся объект, она делала снимок и отправляла его на платформу, которая запускала FCN — разработанную в Калифорнийском университете программу глубокого обучения.

Чтобы обучить систему распознавать котиков, Бонд прогнал через нее все изображения животных, которые смог найти.

Котики vs нейросети: технологии на страже нашего веселья
Cat detected. Фото: blog.nvidia.com

Итак, получив снимок, FCN анализировала его и определяла, идет по газону кот или кто-то еще. Если это было гадкое животное, программа по вай-фаю посылала сигнал на спринклерную систему поливки газона. Та включалась — и котик поспешно ретировался. Сперва не все шло гладко, и программа приняла тень Бонда за кота, знатно намочив собственного разработчика, но довольно быстро научилась распознавать пушистиков безошибочно.

Впоследствии Бонд усовершенствовал систему: она смогла также определять, в каком месте газон находится кот и включать полив только там. Котики тоже проявили способность к обучению и больше возле дома Бондов не появляются.

Кстати, до этого Роберт Бонд уже создал систему, которая шмаляла лазером в муравьев, забредавших на его кухню. Как утверждает изобретатель, луч был маломощный, поэтому муравей только пугался, а не сгорал заживо.

Слова, слова, слова…

Нейросети уже способны писать осмысленные тексты (и это приводит автора статьи в некоторое беспокойство относительно собственного будущего). Вполне вероятно, что совсем скоро они смогут составлять сводки для новостных агентств, которым важно первыми сообщить о каком-то событии, — там, где нужна оперативность, нейросетям нет равных.

Впрочем, копирайтерам рано паниковать. Пока что нейросети могут составить информационную сводку, но не способны написать длинный осмысленный текст.

В 2014 году «Яндекс» представил «Автопоэта»: алгоритм составляет их поисковых запросов пользователей бессмысленные, но складные стихи. Он умеет подражать, например, хокку, лимерикам, шекспировским сонетам или онегинской строфе, точно определяет рифмовку, ударение и транскрипцию. Получается абсурдистская поэзия:

замена крестовин кардана
я абрикос на юге рос
хорошее письмо подруге
до слёз

Похожий проект в 2019-м запустила Google. Poemportrait предлагает пользователю пожертвовать одно слово, используя которое искусственный интеллект сложит пару строчек, подражая поэзии XIX века. После этого ваши строки станут частью коллективной поэмы, а программа предложит сделать портрет с наложенным поверх произведением.

Для обучения в алгоритм загрузили 25 миллионов слов из произведений поэтов XIX века. При этом нейросеть именно создает собственные строки, а не копирует или переписывает существующие.

Одни наш друг сообщил, что всякую нецензурщину фильтруют, и она в коллективную поэму не попадет.

Все это может показаться невинными забавами, но на самом деле подобные сервисы нужны для обучения и совершенствования технологии, ведь чем больше данных соберет нейросеть, тем лучше она будет работать. В этом материале можно подробнее прочитать о том, что такое нейросети и как они работают.