Рисует, но не шутит: почему нейросети не понимают юмор и как скоро они смогут заменить человека?
14:00 20/04/2023Появление нейросетей вывело человеческие технологии на качественно новую высоту, и их развитие происходит быстрее, чем мы успеваем за ним следить. Мир еще не успел освоить все функции Chat GPT, как Google в погоне за славой компании Илона Маска уже представил собственный аналог популярного бота – Bard. Не отстают и российские разработчики: на одном из ставропольских телеканалов прогноз погоды уже ведет искусственный интеллект в образе миловидной девушки по имени Снежана Туманова. И таких примеров, где нейросети заменяют людей, с каждым днем становится все больше.
Но значит ли это, что через некоторое время мир не будет нуждаться в журналистах, редакторах, художниках, актерах, ведущих? Мнения экспертов расходятся, сценариев – много. Так, один из основателей OpenAI Сэм Альтман недавно заявил, что даже он сам побаивается своего изобретения. Разработчик признал, что технология ИИ навсегда изменит общество, и, возможно, многие люди лишатся своих рабочих мест. Кроме того, Альтман опасается, что злоумышленники будут использовать нейросети для широкомасштабной дезинформации и кибератак, поскольку ИИ постоянно совершенствуется в написании компьютерного кода. При этом он подчеркнул, что пока ИИ работает только под руководством человека, и, вне всяких сомнений, это «величайшая технология, разработанная людьми».
Но что мы в действительности знаем про нейросети? Как они работают, как обучаются? Когда была создана первая нейросеть и кто ее создатель? На эти и другие вопросы мы попросили ответить экспертов IT-сферы. Обещаем – будет интересно.
Как появились нейронные сети?
Естественно полагать, что нейросети – это детище эпохи интернета, но на самом деле появились они гораздо раньше. Термин «нейросеть» был сформулирован еще в середине прошлого века, рассказывает эксперт в области ИИ, цифровизации, руководитель направления IT & Data Science Центра НТИ по большим данным МГУ имени М.В. Ломоносова Александр Бирюков.
«Самые первые попытки моделировать деятельность человеческого мозга еще в 1943 году описали нейрофизиолог Уоррен Мак-Каллок и математик Уолтер Питтс. Однако первую нейронную сеть, которая действительно стала предком современного ИИ, представил нейрофизиолог Фрэнк Розенблатт. Это была математическая модель, в упрощенном варианте копирующая принцип работы биологических нейронных сетей. Модель назвали «персептрон», иногда ее также называют «персептрон Розенблатта», – рассказывает Бирюков.
Таким образом, истоки нейросетей, какими мы знаем их сегодня, лежат в 40–50-х годах прошлого века. Ученые того времени преследовали амбициозную цель: создать некий механизм, который смог бы имитировать функции человеческого мозга, способность анализировать информацию. «Персептрон, по сути – простая модель для машинного обучения, которую создали для помощи вычислительным машинам в обучении на разном виде данных. Таким образом, можно сказать, что именно там лежит начало развития нейросетей, – говорит генеральный директор Motive agency&production, специалист по маркетингу и технологиям в рекламе Сергей Житинец. – С разной степенью успешности в Америке, Японии, Европе ученые так или иначе приближали вид нейросетей к тому, что мы видим сейчас».
Одним из первых применений нейросетей было распознавание образов на фотографиях – именно для этого использовал свою модель Фрэнк Розенблатт.
«В те годы компьютеры были громоздкими, медленными и очень дорогими, а доступ к вычислительным ресурсам был ограничен. Все это затрудняло дальнейшее развитие нейросетей, и они остались в тени на десятилетия, – объясняет программист, разработчик игр Денис Кондратьев. – Но мир не стоял на месте, компьютерная техника стремительно развивалась. И вот на рубеже XX-XXI веков о нейросетях вновь заговорил ряд ученых и инженеров, работавших в области искусственного интеллекта. В 2006 году профессор Джеффри Хинтон из Университета Торонто и его коллеги представили статью о глубоких нейронных сетях на конференции по компьютерному зрению и обработке изображений. В этой статье они описали алгоритм обучения нейронных сетей с несколькими слоями, который позволял значительно улучшить точность распознавания изображений. Этот алгоритм был назван «глубоким обучением» (deep learning) и с тех пор стал широко применяться в различных областях, связанных с анализом данных и машинным обучением».
Но как именно нейросеть обучается и запоминает новую информацию? Попробуем разобраться.
Как обучаются нейросети?
Итак, мы узнали, что сначала основной задачей нейросетей ученые видели обработку больших массивов данных, что сильно сокращало затраты времени на ручные вычисления и обработку. И только в конце XX – начале XXI века нейросети начали развивать для машинного обучения и создания искусственного интеллекта. Как же устроены современные нейросети и что заставляет их выдавать точные результаты? Все дело в обучении.
«Можно сказать, что нейронная сеть – это «дерево» возможных вариантов, где каждая точка разветвления является узлом с математической операцией. Однако, если представлять нейронную сеть как дерево, то ветки будут разной толщины, – проводит аналогию директор компании IceRock Development Александр Погребняк. – Более частые результаты будут обладать большим «весом» при выборе вариантов. Некоторые из них будут врастать в другие ветки из-за весовых коэффициентов, которые настраиваются в процессе обучения и определяют степень влияния одного узла на другой. После обучения сети, когда у нас уже есть вес на связях, ее можно использовать, чтобы она могла решать определенную задачу. Например, определять предметы на изображении и сортировать их по папкам».
Существует много способов обучения искусственного интеллекта, их условно делят на ручной и автоматизированный. «Нейросети дают на вход разные данные, она анализирует их, а потом ей сообщают, каким должен быть правильный ответ. Сеть устроена так, что будет «стремиться» подогнать веса синапсов (связей между нейронами), чтобы выдавать верные результаты. У каждого синапса есть веса – числовые коэффициенты, от которых как раз и зависит поведение нейронной сети. И так огромное количество раз. Когда нейронная сеть будет выдавать стабильно желаемый результат – ее можно считать обученной», – объясняет программист, архитектор высокотехнологичных IT-решений Денис Сапожников.
Чтобы лучше понять, как работают нейросети, рассмотрим простую схему, представленную Александром Бирюковым.
«Сильно упрощая, нейросеть – это уравнение типа y = a*x+b. Задача нейросети на основе значений x, которые подаются на вход в сеть, посчитать y и выдать его пользователю.
Однако вся магия нейросети заключается в том, чтобы подобрать правильные коэффициенты a и b в данном уравнении – именно это и происходит на этапе обучения модели. Для обучения сети формируется специальный тренировочный набор данных, в который входят пары x и y*, то есть входные данные и заранее известные правильные ответы, которые нейросеть должна научиться предсказывать.
Дальше начинается обучение, где есть разные подходы, суть которых всегда сводится к одной задаче: попробовать различные коэффициенты a и b, посчитать ошибку предсказания (разницу между правильными ответами y и предсказанными моделью ответами y*) и скорректировать коэффициенты исходя из этой ошибки. Процесс повторяется до тех пор, пока ошибка не становится минимальной», – объясняет Бирюков.
Современные глубокие нейронные сети устроены значительно сложнее, однако исходные принципы остаются теми же: подбираются коэффициенты, которые минимизируют ошибку во время тренировки сети. «Генеративные сети типа Midjourney и ChatGPT глобально работают так же, но их задачей является предсказать наиболее вероятный ответ уже на основе контекста (например, вопроса или предложения, которое вы написали боту), а не конкретного значения х. Сила этих сетей заключается в том, что они обучались на огромном количестве тренировочных данных в самых разных комбинациях и научились копировать паттерны поведения людей, которые изначально создавали эти данные (писали тексты или создавали изображения). Теперь, когда ChatGPT отвечает, казалось бы, разумно на ваш вопрос, на самом деле он просто определяет наиболее вероятную комбинацию слов исходя из того, что модель «видела» во время обучения», – поясняет эксперт.
Обучением нейросетей занимаются специальные люди – ИИ-тренеры, или ML-инженеры (Machine Learning Engineers). Они загружают в нейросеть необходимые данные и помогают cкорректировать ее обучение. «Для того чтобы нейросеть хорошо обучилась, необходимо ей «скормить» много качественных данных, – объясняет генеральный директор и основатель маркетинговой группы Genius Group Геннадий Нагорнов. – Например, мы хотим обучить нейросеть, чтобы она распознавала пол человека по фотографии, генерировала стихи или воспроизводила чей-то голос. Для достижения поставленной задачи, обучения и тренировки понимания специфики данных нейросетью, которая подходит под тип поставленной задачи, нужно загрузить эти самые данные – будь то голос, будь то текст, будь то изображение.
Дальше включаются в работу так называемые «модераторы» – ML-инженеры и data scientist’ы, которые помогают корректировать обучение нейросети. Они начинают отсматривать результаты работы нейросети и вносить корректировки там, где нейросеть проявляет неточность – нейросеть это запоминает, переучивается. Таким образом, через несколько итераций она начинает все лучше и лучше справляться с поставленными задачами. Также именно ML-инженеры и data scientist’ы занимаются поиском исходных данных и их источников. Например, чтобы обучить нейросеть писать стихи, источником исходных данных могут быть каталогизированные онлайн-библиотеки со стихотворениями определенных направленностей и жанров».
Как нейросети генерируют изображения по запросам?
Современные нейросети достигли поразительных высот в написании текста, компьютерного кода и даже музыки, но больше всего нас поражают создаваемые ими картины. Прогресс в этой области действительно впечатляет: к примеру, если первые версии той же Midjourney по запросу «рыжий кот» выдавали нечто размытое, пушистое и непонятное, то сейчас это детализированное реалистичное изображение, которое с трудом можно отличить от фото. Разве что с пальцами до сих пор есть проблема.
О том, каким образом ИИ генерирует изображения по запросам пользователей, рассказал Александр Погребняк: «Нейронные сети могут генерировать изображения с помощью так называемых генеративно-состязательных сетей (GANs). Обычно это связка двух нейронных сетей: генератора и дискриминатора. Эти сети обучены на огромном количестве изображений.
После того как пользователь вводит текст запроса, сеть-генератор создает случайный вектор шума и преобразует его в изображение. Это сначала просто рандомные цветные точки. Дискриминатор принимает изображение и выдает значение, которое показывает, насколько вероятно, что изображение реальное (то есть не сгенерированное). Эти две сети обучаются друг против друга в рамках игры с нулевым суммарным выигрышем: генератор пытается сгенерировать изображения, которые как можно более похожи на реальные изображения, в то время как дискриминатор пытается правильно определять, какие изображения являются реальными, а какие сгенерированными. Со временем получается искомый результат для пользователя».
Самая популярная нейросеть для создания изображений сегодня – это уже упомянутая Midjourney. Кто-то использует ее просто для развлечения, получая с помощью ИИ различные смешные и фантастические картинки. А художники и дизайнеры уже давно взяли ее к себе в подмастерья. Как отмечает сооснователь, генеральный директор школы дизайна Geometrium School Павел Герасимов, «нейросеть может выполнять простые задачи, которые вы не хотите или не можете решить сами». Например, нарисовать персонажа по текстовому описанию или превратить скетч в фотографию.
«Midjourney – система на базе искусственного интеллекта, которая принимает текстовое описание в качестве вводных данных и создает настоящие произведения искусства. Многие архитекторы и дизайнеры используют эту нейросеть, чтобы раздвинуть границы традиционных методов проектирования и представить миру самые необычные идеи и футуристические образы.
Постепенно то, что когда-то считалось невозможным, теперь стало реальностью. Специалисты из разных сфер тестируют возможности нейросетей и «поручают» ей сложные или рутинные задачи. Дизайнеры интерьеров не стали исключением. Например, в будущем выбор цветов, стилей и вариантов меблировки не будет занимать так много времени. А дизайнер сможет в короткие сроки предоставить заказчику несколько концепций», – объясняет Павел Герасимов.
Какими бывают нейросети?
Нейронные сети можно условно разделить как по их функциям, так и по другим признакам – например, типам обучения. Рассмотрим несколько популярных классификаций и познакомимся с самыми известными представителями искусственного интеллекта.
«Есть два типа генеративных архитектур, готовых к работе в реальном мире и требующих навыков формирования запроса: сервисы на основе ChatGPT, где нужно описывать результат генерации текста, и сервисы для генерации картинок, где нужно описывать картинку для ИИ. Обычно они создаются на основе Midjourney, Stable Diffusion или DALL-E», – говорит директор по развитию компании по разработке ПО «Формат Кода» Александр Жуков. Таким образом, нейросети можно условно разделить на «текстовые» и «рисовальные». Впрочем, алгоритмы работы и тех, и других во многом схожи.
Генеральный директор и основатель IT-компании CESCA Евгений Доможиров дает более подробную классификацию – в зависимости от их архитектуры и методов обучения.
По структуре нейронной сети:
- однослойные нейронные сети (Perceptron);
- многослойные нейронные сети (Multi-layer Perceptron);
- рекуррентные нейронные сети (Recurrent Neural Networks);
- сверточные нейронные сети (Convolutional Neural Networks);
- автоэнкодеры (Autoencoder);
- глубокие нейронные сети (Deep Neural Networks);
- резервные нейронные сети (Residual Neural Networks).
По задачам, решаемым нейронной сетью:
- Классификация (Classification);
- Регрессия (Regression);
- Сегментация изображений (Image Segmentation);
- Детектирование объектов (Object Detection);
- Машинный перевод (Machine Translation);
- Анализ тональности (Sentiment Analysis);
- Генерация текста (Text Generation);
- Управление роботами (Robot Control).
По типу обучения:
- Обучение с учителем (Supervised Learning);
- Обучение без учителя (Unsupervised Learning);
- Обучение с подкреплением (Reinforcement Learning).
«Каждый тип нейронной сети подходит для определенных задач и требует своих методов обучения. Например, сверточные нейронные сети хорошо подходят для обработки изображений, в то время как рекуррентные нейронные сети могут использоваться для обработки последовательностей данных, таких как тексты. Классификации нейронных сетей помогают выбрать наиболее подходящую архитектуру для решения конкретной задачи», – говорит Доможиров.
Генеральный директор компании «Аватар Машина», создатель чат-бота-психолога «Сабина» Виктор Носко, в свою очередь, также выделяет трансформерные (GPT-like, BERT, T5), генеративно-состязательные (Alpha-Go, Alpha-Zero) и диффузионные (Midjourney, Stable Diffusion) модели нейросетей. «Концептуально нейросети для генерации картинок похожи на ChatGPT – и те, и другие научились понимать и выполнять инструкции, причем это умение у них с обобщением – то есть выполняют они даже те инструкции, которых в обучающих данных не было», – говорит он.
Кроме того, разные нейросети, как и любое ПО, требуют разных технических мощностей. «Если говорить про архитектуры языковых сетей, то технология GPT-3 для сервиса ChatGPT уникальна, ее архитектуру сложно воспроизвести на широко доступном «железе» (только параметры сети требуют около 800 ГБ оперативной памяти для развертывания). Генеративные сети для картинок более просты: Stable Diffusion, например, может быть развернута на домашнем компьютере с более-менее современной видеокартой. Построение сервисов на ее базе существенно легче», – объясняет директор по развитию компании «Формат кода» Александр Жуков.
Программист Денис Кондратьев предлагает подробно остановиться на трех категориях нейросетей, их устройстве и функциональных особенностях.
«Прямые нейронные сети являются наиболее простыми и широко используемыми. Они состоят из слоев нейронов, соединенных таким образом, что данные проходят через сеть только в одном направлении, – рассказывает специалист. – Рекуррентные нейронные сети позволяют обрабатывать последовательные данные, такие как звук, речь или текст. Они имеют циклическую связь между нейронами, что позволяет им запоминать информацию о предыдущих состояниях и использовать ее для принятия решений в будущем. Сверточные нейронные сети часто используются для обработки изображений. Они имеют специальные слои, которые могут обнаруживать определенные признаки в изображении, такие как края или цветовые пятна. Автокодировщики могут использоваться для изучения скрытых закономерностей в данных. Они работают путем преобразования входных данных в некое скрытое представление, а затем восстанавливают исходные данные из этого представления», – говорит программист.
Нейросеть и Т9 – что у них общего?
На самом деле, чтобы понять, как работает нейросеть, можно обойтись и без уравнений. Просто начните набирать сообщение в своем телефоне и обратите внимание на возникающие на экране подсказки. Да, вы все верно поняли: по сути, нейросеть – это не что иное, как Т9, который есть в каждом смартфоне, только «на максималках». Дело в том, что обе эти технологии являются «языковыми моделями», а их главная задача – угадать, какое слово должно следовать за уже написанным. И чем совершеннее программа, тем лучше у нее это получается.
«Природа происхождения у Т9 и ChatGPT довольно схожая, однако в случае первой технологии речь идет только о предсказании вероятностей того, какое слово будет идти в предложении следующим, а в случае более сложной ChatGPT мы уже говорим о предсказании предложений и даже больше – ответов на вопросы.
Т9 – это более легковесная модель, работающая непосредственно на устройстве пользователя и не требующая больших вычислительных мощностей. Проще говоря, в ее «мозгу» хранится ограниченная информация о наиболее распространенных сценариях последовательного употребления слов, и эта информация адаптируется с учетом частоты употребления этих слов у каждого конкретного пользователя. В случае с ChatGPT мы имеем дело с куда более крупными объемами информации, более масштабными вычислительными мощностями», – объясняет R&D-специалист онлайн-школы для детей и подростков Skysmart Влад Корнышев.
И нейросети, и Т9 имеют отношение к обработке естественного языка, но используют разные подходы для этого, добавляет Евгений Доможиров.
«Технология T9 используется на мобильных устройствах для ввода текста на клавиатуре с ограниченным количеством кнопок. T9 использует словарь слов и статистику, чтобы предлагать варианты слов на основе введенных цифр. Например, если пользователь вводит цифры «2 6 8», T9 может предложить слово «нота», потому что эта комбинация цифр соответствует буквам «н», «о» и «т» на клавиатуре. С другой стороны, нейросети используются для более сложных задач обработки естественного языка, таких как распознавание речи, машинный перевод и анализ текстов на смысл. Нейросети обучаются на больших объемах текстовых данных, чтобы научиться распознавать связи между словами и предсказывать следующие слова в контексте. Например, нейросеть может предсказать, что если пользователь вводит слово «хочу», то следующим словом может быть «пойти» или «купить» на основе анализа контекста», – приводит пример Доможиров.
Могут ли нейросети распознавать юмор?
Практика показала, что искусственный интеллект при грамотном формулировании запросов вполне может заменить человека – решить уравнение, написать эссе и даже создать уникальную иллюстрацию. Но на ум все же приходит знаменитая сцена с Уиллом Смитом из фильма «Я, робот»: «Робот сочинит симфонию? Робот превратит кусок холста в шедевр искусства?» В самом деле, с момента появления первых компьютеров нам не дает покоя главный вопрос: может ли машина творить и чувствовать, как человек?
Появление нейросетей, похоже, приблизило нас к эпохе «очеловеченных» компьютеров. Взять хотя бы ставший уже легендарным ChatGPT: нейросеть может поддержать диалог практически на любую тему, сочинить историю и даже рассказать анекдот. Но значит ли это, что бот в самом деле научился шутить? Ведь юмор – одна из характерных черт, присущих именно человеку.
«Не сомневаюсь, что модель GPT-4 или будущая GPT-5 смогут даже воспринимать иронию, не то что обычные шутки, – говорит редактор блога маркетингового агентства TexTerra, тестировщик нейросетей Никита Шевцев. – Но довольно сложно говорить о том, что нейросети «понимают» юмор. Они научились на придуманных человеком шутках и ответах других людей на эти шутки. Да, они могут отвечать «человечно» – например, ChatGPT смогла сходу сгенерировать мне довольно смешной анекдот про медведя и программиста. Но это лишь языковая модель, использующая кучу референсов из реального мира и способная отлично их смешивать и обрабатывать так, что ее ответ кажется нам чем-то самобытным. Не отрицаю, что человечество веками делало то же самое, и в этом плане мы с ChatGPT, может быть, не так различны, но это уже философский вопрос».
R&D-специалист Влад Корнышев также отмечает, что нейросети в плане распознавания юмора и эмпатии пока сильно уступают людям. Главным образом из-за того, что не могут понять и проанализировать контекст диалога.
«У Open AI уже есть чат-бот Marv, умеющий общаться в саркастическом стиле, различные голосовые ассистенты иногда способны распознать шутку и сарказм, но здесь до человека им еще далеко. В вопросах юмора и сарказма, чтобы их генерировать и понимать, необходимо умение анализировать не только слова, но и общий контекст происходящего, знать или уметь «читать» своего собеседника. Все это завязано на свойствах психики человека, которая на текущий момент не до конца изучена. Следовательно, научить машину распознавать психоэмоциональные аспекты нашего общения довольно проблематично.
Мы в этом убедились даже на собственном примере, когда хотели создать систему распознавания эмоций, которая определяет вовлеченность в урок, восприятие учеником материала и прочие эмоциональные критерии. Это было для нас амбициозной задачей. Согласитесь, было бы здорово с помощью распознавания эмоций сделать любой предмет более простым в усвоении и вызывающим исключительно положительные эмоции! Но у нейросети нет эмпатии и она не способна понять, когда человек притворяется, скрывает эмоции или выдает одну эмоцию за другую по какой-то своей причине. И только человек это может понять и дать адекватную обратную связь», – объясняет Корнышев.
Создатель чат-бота «Сабина» Виктор Носко также призывает различать распознавание юмора и его генерацию. «Распознавать юмор и сарказм умели нейросети еще до массового прихода трансформерных моделей, – говорит он. – А вот полноценная, разнообразная генерация юмора или сарказма была недоступна примерно до 2020 года, когда на сцену вышел GPT-3, а также его русская версия от Сбера – ruGPT3. Но стоит понимать, что сами нейросети не «понимают», что и зачем они генерируют. Они реактивны, такие системы все еще можно называть стохастическими (случайными – прим. ред.) попугаями – примерно так поступают дети, повторяя за взрослыми сложные слова, услышанные вечером на кухне. Я считаю, что до прихода нейросимвольного подхода нейросети не очеловечатся, то есть не будут хотеть произвести впечатление сарказмом, не будут истинно хотеть «подколоть собеседника».
Директор по маркетингу компании Interion Антон Калабухов уже несколько лет создает IT-стартапы в сфере недвижимости. Сейчас он работает над собственным AI-проектом, в рамках которого провел любопытный эксперимент с нейросетью.
«У меня был показательный опыт в данной тематике: я хотел узнать, может ли ChatGPT отвечать потенциальным клиентам с негативной окраской. Оказалось, что на это стоит запрет, но, проведя его по нескольким вопросам, я добился этого и «договорился» о том, что он будет отвечать в формате провокативной терапии – эта технология очень похожа на сарказм тем, что это тоже провокация, скрытый от собеседника смысл. В итоге GPT начал отвечать более чем хорошо», – поделился Антон с MIR24.TV.
Но с тем, что способность быть саркастичным и вообще как-то эмоционировать отличает человека от роботов, согласны не все.
«Наличие чувства юмора и иронии не является отличием людей от машин. Человек не рождается с ними – это тренируемые навыки, полученные на основе нашего жизненного опыта и обратной связи от окружающих, – убежден директор по развитию и индустриальным партнерам Фонда «Сколково» Сергей Дутов. – Для компьютерной модели это также лишь один из навыков, который она может приобрести и постоянно улучшать. Сентимент-анализ, или анализ тональности текстов – уже давно стандартная функция специализированных программ, которые помогают в написании текстов, рекомендуют смену тональности в зависимости от общего контекста или цели. У той же Алисы вполне конкретный характер и специфическое чувство юмора».
Как скоро нейросеть заменит человека?
О том, что из-за развития ИИ многие люди рискуют лишиться работы, сегодня говорят даже сами создатели нейросетей. Эта тема сегодня так актуальна, что ей уже посвящают научные труды. Так, ученые из Принстонского университета, Университета Пенсильвании и Нью-Йоркского университета Эл Фэлтен, Манав Радж и Роберт Сименс провели большое исследование на предмет того, как языковые модели типа ChatGPT влияют на рынок вакансий. Среди профессий, которые наиболее чувствительны к влиянию ИИ и окажутся под угрозой уже в ближайшее время, эксперты назвали следующие: маркетологи, социологи, политологи, юристы, судьи, психологи, коучи, турагенты, а также преподаватели различных дисциплин (иностранного языка, литературы, географии, истории, права, философии, культурологии и т.д.). Что интересно, программистов в списке не оказалось, хотя многие эксперты в области IT отмечают, что многие нейросети уже умеют писать код не хуже людей.
«Это огромная проблема. Нейронные сети уже массово уничтожают целый ряд профессий и делают множество рутинных задач лучше людей, – говорит программист Денис Сапожников. – Рядового человека спасает лишь то, что нейронные сети пока не обрели достойную физическую оболочку. Да и будем честны, во многих сферах человеческий ресурс дешевле внедрения ИИ».
СЕО IT-компании Tiqum и IT-рекрутингового агентства it_smiles, консультант в области digital трансформации бизнеса Юрий Гизатуллин и вовсе уверен: в ближайшие 2-3 года 90% творческих профессий будут заменены нейросетями.
«До ноября прошлого 2022 года бытовало мнение, что креатив – одна из самых труднозаменяемых сфер, но сейчас очевидно, что искусственный интеллект отлично справляется с подобными задачами, в том числе с задачами создания сюжета, – объясняет Гизатуллин. – Возможно, это коснется даже киноиндустрии: фильмы будут генерироваться нейросетями, что позволит удешевить продукт и повысить скорость его производства. На мой взгляд, может появиться персонализированное кино, когда люди смотрят один фильм, но, в зависимости от их психотипа, сюжет меняется в режиме реального времени.
Также будут заменены многие диагностические профессии в медицине. Уже сейчас есть специализированные нейросети, которые обучаются определять наличие рака по снимкам и дают более точный результат, чем если бы это делал человек. Наша компания сейчас вплотную занимается разработкой сервиса, который по фотографиям лица будет определять заболевания кожи и рекомендовать способы лечения и омоложения. Наш алгоритм на основе нейросети будет заниматься предиктивной медициной и подбирать комплекс мер по уходу за кожей, а на основе графических нейросетей мы сможем предсказывать, каким будет результат».
Проектный директор digital-агентства «Интериум» Айта Лузгина также отмечает, что во многих областях ИИ уже потеснил человека, но считает, что паниковать по этому поводу не стоит.
«Нейросети уже вытесняют человека по целому фронту задач: от копирайтинга, ретуширования изображений и видео до проверки строк кода на ошибки, оптимизации приложений и доказательства сложнейших теорем. Существует даже специальный сайт Will robots take my job? («Лишат ли роботы меня работы?») с обновлениями о каждой профессии.
Нейросети научились помогать слепым, пишут стихи, учат людей в онлайн-школах и даже сами пишут подсказки («промты») для генерации в других нейросетях. Отдельные умельцы даже успешно подключают ИИ к сенсорам, имитирующим человеческое зрение и слух. Поэтому на горизонте 2-4 лет рынок труда в секторах вроде копирайтинга, написания отчетности и создания презентаций, видеомонтажа, программирования и дизайна, а также бизнес-аналитики серьезно поредеет. Останется узкая прослойка сверхквалифицированных специалистов и тех, кто помимо основной специальности освоит профессии будущего.
Таковыми можно назвать промт-инженера (искусство написания запросов для нейросетей и корректировки их генерации), бизнес-аналитика с навыками работы в ИИ-инструментах или no-code программиста или дизайнера», – говорит Лузгина.
Однако стремительное развитие ИИ вряд ли можно считать проблемой для рынка труда на макроуровне, отмечает она. «В первые годы замещение будет происходить в наиболее низкооплачиваемых профессиях и задачах (по типу тех, что встречаются на биржах фрилансеров вроде «Профи» или «Яндекс.Толока»), а занятость в них довольно гибка. На рубеже 5-6 лет встанет вопрос, что делать с массой нетрудоустроенных дизайнеров и монтажеров (ведь конвейер образования остановится позже, чем его выпускники станут не нужны). Однако в долгосрочном плане рынок урегулируется – никто сегодня не говорит, что появление компьютеров стало катастрофой для занятости (хотя исчезли целые профессии вроде машинисток). Если что-то и можно назвать проблемой, так это банковско-венчурный кризис: на фоне краха «банков для стартаперов» в США перспективным ИИ-проектам станет труднее получать финансирование и толкать рынок вперед», – считает Айта Лузгина.
Тестировщик нейросетей Никита Шевцев лучше многих знает, насколько хорошо нейросети уже научились «притворяться» людьми. Недавно он представил собственную цифровую копию, которая вместо Никиты приняла участие в пресс-конференции. Над созданием цифрового клона трудились сразу три нейросети. И, хотя «цифровой Никита» говорил по-русски с сильным акцентом и порой неверно ставил ударения, беседу поддержал на достойном уровне.
«Безусловно, в некоторых профессиях нейросети смогут серьезно сократить потребность в специалистах. И чем дальше, тем активнее будет этот процесс, – рассуждает Никита Шевцев. – Но надо понимать, что за нейросетями до сих пор надо серьезно следить и править результаты их работы. Условно, компания может уволить трех дизайнеров из четырех в отделе, но хотя бы один остаться должен, чтобы задавать запросы нейросети и выбирать из того, что она нагенерировала, лучший вариант.
С другой стороны, многим бизнесам выгоднее будет не снижать издержки посредством увольнения сотрудников, а масштабироваться, используя нейросети. На том же примере с дизайнерами: представим, что мы не уволили трех дизайнеров, а дали им в руки нейросети. Тогда каждый из них сможет заменить еще четверых таких же. Получится, что отдел дизайна сможет работать в несколько раз эффективнее и быстрее.
Кроме дизайнеров изменения коснутся и копирайтеров, и учителей (компания Duolingo, например, уже начала в тестовом режиме использовать нейросеть для обучения), и программистов, и даже юристов, не говоря уже о тех, чья основная задача заключается в перекладывании бумажек в офисе».
Самой популярной новой профессией в скором времени окажется промт-инженер, также вырастет потребность в тестировщиках и других специалистах, «которые будут общаться с ИИ, чтобы улучшить пользовательский опыт и генерацию контента», отмечает тестировщик. Эволюция технологий циклична: с появлением компьютеров ушли в прошлое многие профессии, и изобретение нейросетей также внесет свои коррективы в рынок труда. Но, по мнению Никиты Шевцева и других экспертов, глобального роста безработицы ждать не стоит.
«Я в этом плане оптимист. Думаю, если ИИ справляется с задачей лучше человека, значит, мы на правильном пути. Да, возможно, многие люди лишатся работы, но появятся потребности в новых кадрах. Каждый виток прогресса, который мы видели, создавал рабочие места, а не приводил к появлению миллионов безработных. ИИ, на мой взгляд, как и роботизация промышленности, наоборот, даст огромный импульс мировой экономике и может вывести человечество на качественно новый уровень развития», – убежден редактор блога маркетингового агентства TexTerra.
Эту точку зрения разделяет и эксперт в области ИИ Александр Бирюков: «История показывает, что технологический прогресс всегда создает больше рабочих мест, чем забирает. Однако чтобы претендовать на них, конечно, нужно также продолжать учиться, развиваться, осваивать новые технологии. В случае с ChatGPT или Midjourney даже не нужно становиться программистом: если вы были дизайнером или писателем, вы должны научиться работать с данными нейросетями как пользователь и начать их использовать в своей работе. Чтобы создать уникальный текст или изображение с нейросетью, у вас уйдет кратно меньше времени, чем у коллег, работающих с нуля самостоятельно, и это обеспечит вам большую продуктивность, карьерный рост или рост вашего бизнеса. Кто-то скажет, что это нечестно, но бизнес скажет: это выгодно!»
Достижения российских разработчиков в сфере ИИ
В заключение мы попросили экспертов поделиться своими впечатлениями от ИИ-продуктов, созданных российскими специалистами. Вот что они рассказали.
Денис Сапожников, программист, архитектор высокотехнологичных IT-решений:
«Конечно же, лидируют в этой области банковская сфера, медицина и научно-оборонная сфера. Проектов для широкой публики пока крайне мало, в основном это узкопрофильные коммерческие решения. Но думаю, с реализацией «Национальной стратегии развития искусственного интеллекта в России» дела со временем начнут улучшаться. Один из проектов на основе нейронных сетей – сайт НашиЛица.РФ, небольшой авторский проект, суть которого сводится к восстановлению фотографий и реконструкции лиц исторических личностей Рсосии. Но так как за проектом нет коммерческого интереса, а использование ИИ – дорогое удовольствие, то весьма вероятно, проект так и останется лишь авторской инициативой».
Влад Корнышев, R&D-специалист онлайн-школы для детей и подростков Skysmart:
«Онлайн-школа Skyeng создала первой среди российских edtech-компаний виртуального помощника для обучения иностранному языку. Это – виртуальный собеседник «Кеша», созданный на базе GPT-4. «Кеша» используется для практики речи и отработки разных диалоговых ситуаций и ведет себя практически как живой собеседник, самостоятельно моделирует развитие диалога, а также анализирует ответы, замечает ошибки и дает обратную связь.
Мне еще концептуально нравится голосовой помощник «Олег» в «Тинькоффе» с его функцией автоответа. Было бы здорово, если бы ребята пошли по стопам Google Assistant с их функцией Duplex, которая позволяет ассистенту сделать онлайн-бронирование или заказать еду в автоматическом режиме. Кажется, что в концепции суперапа, в которой работают ребята, такая функция была бы очень кстати.
Еще в памяти всплывает нашумевший редактор фото Prisma, с помощью которого многие рисовали портреты себя, как их видит ИИ».
Павел Гуштюк, генеральной директор IT-компании Formind:
«Одна из перспективных для использования ИИ областей – это строительная отрасль, где особенно актуален анализ больших объемов данных. Из заслуживающих внимания отечественных разработок – система Skolkovo Robotics, которая использует искусственный интеллект для оптимизации размещения кранов на строительных площадках. Система учитывает такие факторы, как расположение рабочих, размещение материалов и планировка строительной площадки, чтобы определить наиболее эффективное размещение кранов. Это помогло компании сократить количество отходов и улучшить использование ресурсов на строительных площадках».
Виктор Носко, генеральный директор компании «Аватар Машина»:
«Ученые из команды Fusion Brain Института искусственного интеллекта AIRI при поддержке команд Sber AI и SberDevices разрабатывают модель для решения почти 800 задач. Проект называется Fusion Brain. Модель позволит решать множество прикладных задач без дообучения или с минимальным его присутствием.
Также стоит отметить чат-бота «Сабина». Это первый в РФ цифровой психолог – полностью генеративный чат-бот, работающий на самых современных нейросетях трансформер. «Сабина» способна вести эмпатичный, логичный и доверительный разговор на психологические темы. Бот ведет дружеское общение, выясняет проблему пользователя и позволяет ему выговориться, при этом обеспечивая полную конфиденциальность».
Денис Кондратьев, программист, разработчик игр:
«Российские разработчики создают много интересных ИИ-продуктов в различных областях. Вот несколько примеров.
- Система автоматизации работы медицинской документации от NeuroNet
Эта ИИ-система позволяет автоматически распознавать и классифицировать медицинскую документацию, такую как медицинские карты и результаты анализов. Она может сократить время, необходимое для обработки документов, и уменьшить количество ошибок.
- Система контроля качества дорожного покрытия от компании Cognitive Technologies
Эта ИИ-система использует камеры и сенсоры для анализа качества дорожного покрытия. Она может определять различные дефекты, такие как трещины, ямы и выбоины, и помогает быстро и точно определять, какие участки дорог нуждаются в ремонте.
- Система предсказания оттока клиентов от компании Insider
Эта ИИ-система использует данные о поведении клиентов, чтобы предсказывать, кто из них может уйти к конкурентам. Она также может предлагать персонализированные рекомендации по удержанию клиентов.
- Система автоматического распознавания лиц и обнаружения эмоций от компании NtechLab
Эта ИИ-система может быстро и точно распознавать лица людей на фото и видео, а также определять их эмоциональное состояние. Она может использоваться в различных областях, от безопасности до маркетинга.
- Система автоматического перевода от компании Yandex
Эта ИИ-система использует нейронные сети для автоматического перевода текстов на различных языках. Она является одной из наиболее точных систем автоматического перевода и может быть полезна как для личного использования, так и для бизнеса.
Анатолий Углов, технический директор компании «Цифроматика»:
«Нейросеть DALL-E Mini от компании Илона Маска OpenAI обучена на 12 миллионах параметров и способна создавать реалистичные версии животных, людей и объектов, а также сочетать в картинке несвязанные концепции. А в 2022 году компания SberAI выпустила большую модель ruDALL-E Kandinsky, обученную уже на 12 миллиардах параметров! Это большая работа не только для самой нейросети, но и для разработчиков – подготовить и настроить такое обширное обучение. Стоит отметить, что размеры и качество обучающих выборок для нейросети важны примерно так же, как и при обучении человека чему-то новому. Если художник, например, пересмотрел очень много картинок в стиле аниме, то ему сложно будет дальше что-то создавать в стиле классических русских художников, хорошо нам знакомых по Третьяковской галерее, и наоборот. Гораздо лучшие результаты будут у того, кто может совместить несколько стилей и благодаря этому выдать что-то новое и интересное».
Читайте также:
- «Мне не стыдно»: студент РГГУ рассказал, как писал диплом с помощью нейросети
- Как работает ChatGPT и почему новое детище Маска грозит уничтожить Google?
- Студентов Страсбургского университета отправили на пересдачу за использование бота ChatGPT
- Нейросеть вместо судьи: смогут ли умные технологии выносить приговоры людям?