NGB5yfN4XJ476oCye

Искусство и нейросети. Концептуальные рамки для понимания новых художественных практик

Семионавт — навигатор в мире знаков / Иллюстрации: Евгений Никитин / Искусство и нейросети. Концептуальные рамки для понимания новых художественных практик — Discours.io

Семионавт — навигатор в мире знаков / Иллюстрации: Евгений Никитин

Появление генеративных AI-технологий в художественной практике ставит ряд интересных вопросов о природе творческого процесса. MidJourney, Stable Diffusion и DALL-E создают изображения, которые одновременно уникальны и производны от уже существующих, что заставляет по-новому взглянуть на авторство, оригинальность, подлинность.

Этот текст — подробное исследование эстетических и технических сдвигов, вызванных появлением художников, работающих с генеративным искусственным интеллектом. Опираясь на теоретические концепции — от Беньямина до Мановича, от «семионавтов» до гипогуманизма, — он рассматривает AI-искусство через призму философии, чтобы осмыслить, что значит быть художником в условиях распределенного авторства, когда произведение создается в соавторстве с алгоритмом, и что происходит с искусством, когда человек создает его совместно с нейросетью.

Кризис «ауры» и расщепленное авторство

Вальтер Беньямин в своем знаменитом эссе об искусстве в эпоху технической воспроизводимости говорит, что произведения искусства утрачивают свою «ауру» — уникальность, связанную с их единичным существованием «здесь и сейчас». Технические средства воспроизводства делают возможным создание множества копий, лишенных этой ауры оригинала. В эпоху ИИ традиционное понимание оригинала и копии теряет смысл. Каждое сгенерированное произведение технически — уникально, но при этом является производным от обучающих данных. Это создает парадоксальную ситуацию: уникальность становится массовым явлением. В этом смысле можно говорить о кризисе подлинности.

Можно предложить вместо «ауры» произведения искусства, потеря которой так беспокоила Беньямина, следующие формы аутентичности, применимые к ИИ-работам:

— Процессуальная аутентичность (уникальность процесса генерации).

— Контекстуальная аутентичность (уникальность контекста создания).

— Интенциональная аутентичность (уникальность человеческого замысла).

Последний пункт требует уточнения. До какой степени можно говорить о человеческом замысле, если он всегда интерпретируется моделью ИИ?

ИИ создает сложную систему распределенного авторства, где участвуют:

— Пользователь;

— Разработчики ИИ-системы;

— Авторы обучающих данных;

— Сама ИИ-система как квази-автономный агент, интерпретирующий вводные.

Возникает необходимость переосмысления самого понятия творческого субъекта. Теперь это коллективный субъект, он расщеплен. Можно относиться к ИИ как к инструменту, но эта расщепленность будет сохраняться. «Аналоговый» художник работает через физическое присутствие. Кисть — продолжение руки. Иногда сам он становится инструментом: в перформансе тело превращается в главный выразительный материал. В работе с ИИ человек всегда ощущает границу своего тела: за этой границей начинается Другой в лакановском смысле — то, что существует независимо от субъекта и структурирует его опыт через символические системы. В случае ИИ это интерфейсы, алгоритмы, структуры данных, преобразующие и интерпретирующие вводные.

Беньяминовская идея демократизации искусства — процесса, при котором искусство теряет свою элитарность и становится доступным широким массам благодаря развитию технических средств воспроизведения — в эпоху ИИ получает новое воплощение. Если раньше демократизация означала доступность готовых произведений для масс, то теперь она проявляется в доступности самого творческого процесса. Технический барьер практически снят — освоить работу с ИИ можно за несколько уроков. Эстетическая инфляция неизбежна, и на ее пути остается только институциональный барьер.

От диджея к мета-семионавту: постпродукция в цифровую эпоху

Если Беньямин помогает нам понять кризис традиционных категорий, то для понимания позитивного содержания AI-искусства необходимы более современные концептуальные рамки.

Помочь осмыслить то, чем занимается AI-искусство могут идеи искусствоведа и критика Николя Буррио. Буррио пишет о постмодернистском художнике как о диджее. Диджей сэмплирует (собирает из готовых кусочков) музыку, художник микширует и переосмысляет существующие культурные элементы. AI-искусство тоже можно рассматривать как постпродукцию. «Искусство XX века — это искусство монтажа (соединения образов в ряд) и детуража (наложения образов друг на друга)», — пишет Буррио в книге «Реляционная эстетика. Постпродукция». Параллель с AI-искусством, опирающимся на обучающие базы данных, то есть на готовые образцы визуальной культуры, тут очевидна.

«Во время своего сета диджей меняет диски — то есть продукты. Его работа заключается в прокладке своего маршрута в музыкальной вселенной (в создании плей-листа) и в соединении отобранных элементов в определенном порядке», — пишет Буррио.

Точно так же AI-художник «прокладывает» маршрут во вселенной, которой является так называемое латентное пространство ИИ-модели.

«Пользуясь готовыми дисками (или сэмплами — Прим. авт.), можно создать музыкальное произведение, не имея представления о нотной грамоте», — пишет Буррио, и здесь снова можно провести параллель с AI-художником, которому не нужно учиться рисовать. Критик также использует термин «семионавт» — навигатор в мире знаков. AI-художник работает как навигатор в мире знаков: он задаёт направление с помощью промптов (текстовых запросов и инструкций для ИИ), параметров и визуальных референсов, а затем — преобразует полученные изображения — варьирует, дополняет, совмещает и дорабатывает их с помощью инструментов вроде ремиксов и инпейнтинга.

Семионавт. Автор: Евгений Никитин
Семионавт. Автор: Евгений Никитин

Однако надо отметить, что «аналоговый» художник комбинирует культурные элементы напрямую, а AI-художник опосредованно. Модели ИИ работают не с конкретными «сэмплами», а с паттернами, усвоенными на этапе обучения. После обучения ИИ больше не обращается к базе картинок, на которой она обучалась. Вместо этого она работает с миллионом параметров — своего рода знаний о различных признаках картинок и статистическом распределении пикселей. Обучение — это фактически формирование культурного словаря, с которым можно потом работать. Сгенерированные картинки не равны обучающим материалам. Происходит переосмысление и развитие визуального опыта. Итог работы — это всегда синтез, а не просто механическая переклейка элементов. В этом смысле AI-художник — это мета-семионавт: он прокладывает маршрут уже в пространстве культурных кодов и образов.

Гиперархив: новые формы культурной памяти

Концепция «семионавта» естественным образом подводит нас к вопросу о том, в каком именно пространстве происходит эта навигация. Для его понимания продуктивной оказывается теория «архивного импульса» историка и художественного критика Хэла Фостера, хотя и в радикально переосмысленном виде.

Рассуждение Хэла Фостер об архивном импульсе — тенденции современных художников работать с архивами, переосмысливая историю и память, тоже может быть спроецирована на AI-искусство. Хэл Фостер приводит примеры таких художников как Тасита Дин и Сэм Дюрэнт.

Тасита Дин работает с «утраченными» историями и заброшенными объектами, а Сэм Дюрэнт — с модернистским наследием.

Конечно, у Фостера речь идет об «аналоговом» искусстве, для которого характерна материальность объектов и физическая тактильность, а мы говорим о цифровых работах. Но, сделав скидку на это отличие, к рисующим AI-моделям тоже можно подойти как к архивам визуальных образов. Только это будет гиперархив, превосходящий традиционные ограничения организации и доступа.

Традиционный архив устроен как набор отдельных, статичных объектов, к которым нужно физически добираться и выбирать осознанно. В ИИ-гиперархиве всё устроено иначе: его элементы существуют не раздельно, а непрерывно — в виде латентного пространства, всегда готового к активации. Доступ к контенту происходит мгновенно, но это не «сырые» данные, а уже переработанные ИИ-паттерны, представленные в визуальной форме.

ИИ-модели извлекают из обучающих данных абстрактные характеристики и отношения. Результатом является своего рода культурный метаболизм: ИИ становится пищеварительной системой для культурной памяти.

Кроме того, такой гиперархив не стерилен. В него вмешиваются человеческие кураторы, отбирающие и размечающие данные, и цензурные механизмы, определяющие политики доступа. С одной стороны, все это может искажать работу художника с таким архивом. С другой — художник может предъявлять эти искажения и ограничения в своих работах.

Практики памяти: от коллективных воспоминаний к промптографии

Поэта и AI-художник Станислава Львовского в своем проекте Collective memories работает именно как художник-архивист в фостеровском понимании.

Одна из работ Станислава Львовского из проекта Collective memories
Одна из работ Станислава Львовского из проекта Collective memories

Как указывает Львовский, в отличие от collective memory (коллективная память) — понятие collective memories (коллективные воспоминания) парадоксально, так как воспоминания всегда индивидуальны. Но поскольку обучающие данные ИИ включают исторические фотографии, фото из личные архивов, винтажные открытки и т. д. можно извлекать из них синтезированное «воспоминание» в форме квази-фотографической картинки, сразу включающей у зрителя механизм узнавания, несмотря на то, что запечатленное на ней событие не происходило в действительности. И в этом смысле промпт становится единичным актом вспоминания.

Легко сравнить это рассуждение с тем, что пишет Фостер о работах Таситы Дин:

«В каком-то смысле все эти архивные объекты (…) работают как найденные ковчеги утерянных мгновениий, в которых „здесь-и-сеи‌час“ тои‌ или инои‌ работы функционирует в качестве портала между незавершенным прошлым и вновь открывшимся будущим».

Один из проектов другого художника, Бориса Элдагсена, называется Pseudomnesia: Fake memories. В названии, в отличие от проекта Львовского, сделан акцент не на достоверности коллективной идентичности, а именно на фейковости самого сюжета.

Здесь я приведу и собственный опыт: когда я иллюстрировал книгу историка Владимира Булдакова о русской революции 1917 года, я планировал оформить иллюстрации в духе фотографий того периода. Но автору книги идея не понравилась, поэтому я перешел на стиль псевдо-рисунка тушью (для ИИ и фотография, и рисунок — просто разные вероятностные распределения пикселей). Хотя и ИИ-фотографии и ИИ-рисунки просто иллюстрировали конкретные абзацы из книги, позиция Булдакова представляется обоснованной — использование стилизованных под документы изображений в историческом труде могло создать нежелательный эффект мистификации. Хотя, если проводить параллели с кинематографом, художественные исторические фильмы тоже не претендуют на документальную точность. Игра на этой двойственности, противоречивости коллективного опыта, выраженного визуально, и ожиданиями от фотографии, может быть содержательным направлением для AI-художника.

Псевдоисторическая фотография для проекта Владимира Булдакова. Автор: Евгений Никитин
Псевдоисторическая фотография для проекта Владимира Булдакова. Автор: Евгений Никитин

Об этом же пишет Львовский в своей статье «Нейрофотография как истинная правда». Традиционная фотография претендовала на отображение реальности, хотя кадрирование, ретушь, выстраивание сцены — инструменты манипуляции, указывает Львовский.

Нейрофотография (или, по Элдагсену, «промптография») отказывается от претензии на реальность, и в этом смысле она, по Львовскому, честнее. Она служит прямой визуализацией отношения художника к чему-либо, например, его социальной критике, проблематизации каких-либо явлений, либо его эстетическим исследованиям.

Парадоксально здесь то, что AI-работы в этом смысле оказываются менее манипулятивными, чем настоящие фотографии, хотя вполне очевидно, что — вне контекста искусства — именно ИИ можно использовать для создания фейков для влияния на общественное мнение: для манипуляции выборами в США или отношением к событиям в Газе. То есть, если как искусство промптография честнее, то как оружие в информационной войне — опаснее. Поэтому мы постепенно оказываемся в эпохе, в которой доверять фотоизображению как документу больше нельзя.

В апреле 2023 года Борис Элдагсен намеренно представил на суд жюри престижной премии Sony World Photography Award изображение, созданное с помощью искусственного интеллекта, чтобы инициировать широкое обсуждение фундаментальных вопросов о природе фотографического образа в эпоху AI. В итоге он победил и отказался от премии — что стало одним из ключевых моментов в дискуссии о статусе AI-искусства в современном художественном процессе.

Этот жест можно рассматривать как своеобразный художественный перформанс, направленный на проблематизацию границ между традиционной фотографией и нейрофотографией.

Элдагсен отмечает: «Мой подход к фотографии был психологическим и философским. Это было путешествие внутрь себя; я не изображал то, что все видят перед собой. Имея такой опыт, искусственный интеллект меня очаровал. Он был создан из коллективного бессознательного. Я также заметил, что принцип его работы можно соотнести с теорией идей Платона». Аналогия понятна: промпт можно считать «идеей», а его визуальное воплощение — конкретной материализацией этой идеи (у каждого промпта существует практически бесконечное число визуальных решений).

Векторизация визуального: модульность, транскодирование и deep remixability

От художественных практик обратимся к техническим принципам, которые делают эти практики возможными. Здесь незаменимыми оказываются концептуальные разработки Льва Мановича — крупнейшего теоретика цифрового искусства и медиа. В книге Cultural Analytics Манович говорит о необходимости применения современных вычислительных методов для анализа культурных данных. В контексте того, как AI учится на огромных базах картинок, можно рассмотреть такие модели как MidJourney, Stable Diffusion и Flux как неконвенциональный инструмент анализа Big Data. Интересно здесь то, что к итогам этого анализа у нас нет никакого прямого доступа, потому что эти они хранятся в виде миллионов параметров в неинтеллигибельном (непознаваемом) виде в так называемом «латентном пространстве» модели. Единственный способ доступа к этому пространству — формирование промптов (запросов) и наблюдение за получающимися картинками.

Что мы имеем:

  1. Огромный по глубине и бесконечному количеству критериев анализ, проведенный AI в процессе обучения.

  2. Отсутствие у человека способности постичь итоги этого анализа ввиду ограниченности наших ресурсов.

  3. Возможность взаимодействия с ними с помощью промпта.

В концепции Мановича все объекты новых медиа являются числовыми представлениями. А ведь ИИ осуществляет именно перевод из визуального в числовую форму (векторизацию). Стиль становится набором числовых значений, описывающих вероятностное распределение пикселей, композиция превращается в системы координат, а цвет сводится к математическим отношениям. Благодаря числовому представлению все языки взаимно переводимы, и визуальные языки — не исключение. В этом отношении можно говорить о «транскодировании» — это еще один термин Льва Мановича. Транскодирование — перевод содержания между различными культурными и техническими форматами. Так, техники Text-to-Image, Image-to-Text — это транскодирование.

Числовая основа обеспечивает и Deep Remixability (еще один термин Мановича): возможность беспрецедентной манипуляции художественными элементами — стилями, эпохами, медиумами (способами выражения) и жанрами. Все их можно комбинировать в любых сочетаниях, а также переводить один в другой: на числовом уровне иерархические отношения между жанрами и стилями, историческая разбросанность художественных эпох снимаются. Можно смешать открытку с натюрмортом голландских мастеров и сделать это в в стиле Пикассо: звучит абсурдно, а для MidJourney является просто сочетанием токенов (элементов запроса). При этом можно усиливать или ослаблять влияние каждого из токенов, присваивая им «вес»~или перемещая внутри запроса ближе к началу фразы.

Математическая природа искусства ИИ не уменьшает его художественную ценность, а скорее открывает новые возможности.

В этой связи можно говорить о «модульности» AI-искусства — это еще один термин Льва Мановича. Модульность позволяет манипулировать отдельными элементами системы. В данном случае это выражается в отдельном управлении семантикой, композицией и стилем. В MidJourney стилистику можно задавать отдельным параметром --sref, которому присваивается либо числовой код (существуют целые библиотки таких кодов), либо подгружаются картинки в любых сочетаниях — из этих картинок ИИ вычисляет стилистику. Недавно появившиеся настройки «персонализации» и «moodboards» служат той же цели — настройке стиля. Композицией можно управлять с помощью уже ставших традиционными для ИИ инструментами инпейнтинга (перерисовывания отдельных фрагментов) и аутпейнтинга (расширение холста в любую сторону). Семантика задается промптом. Здесь надо, конечно, сделать поправку на то, что контроль всех этих элементов неполный. С одной стороны, интерпретация референсов, запросов, поправок, корректур и дорисовок остается за ИИ, с другой — границы между стилистикой и семантикой могут быть зыбкими. Тем не менее, можно говорить о модульной природе создания изображений с помощью ИИ. Эта модульность обеспечивает гибкость в художественных экспериментах и становится новым видом художественной грамматики, позволяющей не только создавать сложные решения через комбинацию и рекомбинацию элементов, но и целые индивидуальные техники создания изображений.

Также Манович говорит об изменчивости/ вариативности. Действительно, в отличие от традиционных медиа, ИИ могут производить бесконечные вариации заданной концепции или стиля. Эта бесконечная вариативность трансформирует отношения между оригиналом и копией, между концепцией и исполнением. Каждое сгенерированное изображение становится одновременно уникальным и частью потенциально бесконечной серии, бросая вызов традиционным представлениям о художественной оригинальности.

Эта способность к бесконечной вариации меняет подход художников к своей работе. Вместо работы над единственной окончательной версией, художники могут исследовать диапазон возможностей и даже использовать сам процесс вариации как художественное средство. Творческий процесс становится менее ориентированным на достижение окончательной формы и более направленным на исследование пространства возможностей.

Гипогуманизм и плоские онтологии

Новые технические возможности открывают путь к более радикальному философскому переосмыслению самой природы творческого субъекта. В этом отношении нельзя не коснуться идей медиа-художника и дизайнера Олега Пащенко, изложенных в его замечательной книге «Гипогуманизм» (Jaromir Hladik press, 2023). В числе прочего Пащенко касается и вопроса ИИ как соавтора, но при этом ставит его в ряд с множеством других соавторов, которые всегда были у человека, но до последнего времени не рассматривались как таковые. Это такие мощные соавторы как социум, язык, нейрометаболизм, микрофлора — этот ряд можно продолжать. Действительно, художник всегда находится в соавторстве с социумом, в котором он действует и на языке которого говорит, с бессознательным своей психики и даже собственным кишечником, который влияет на те или иные решения и выборы. Мы не рассматривали их как соавторов, потому что наше мышление иерархично и в его центр мы всегда ставили человека. Что если убрать человека из центра, продолжив начатую Галилеем перестройку описания мира? Пащенко вводит понятие «гипогуманизма» как концепции, в которой будущее человека состоит в его самоумалении, признании своей ничтожности.

Гипогуманизм и трансгуманизм: «маленький» человек и огромный ИИ. Автор: Евгений Никитин
Гипогуманизм и трансгуманизм: «маленький» человек и огромный ИИ. Автор: Евгений Никитин

Гипогуманизм противопоставлен трем другим образам будущего: трансгуманизму, в котором человек подчиняет себе ИИ, ингуманизму философа Ника Ланда, в котором ИИ вытесняет человека и «новацену» ученого и футуролога Джеймса Лавлока — эпохе симбиотических отношений людей и машин. Пащенко делает следующий шаг — к полному кенозису, то есть богословскому понятию самоумаления Бога — проявлению величия через добровольное самоограничение: «Будущее у человека, по-моему, есть, и оно прекрасно — но не потому что он велик и грандиозен, а как раз наоборот — потому что он подобен Богу кенотическому, слабому, истончившемуся, самому ничтожному и незначительному из всего, что есть и чего нет». К этому приводится цитата из Писания: «Всякий возвышающий сам себя унижен будет, а унижающий себя возвысится» (Лк 18:14).

Признав ничтожность человека, нам легче посмотреть на децентрализацию авторской субъектности как на естественный процесс — и как на более точное описание процесса творчества как такового. AI-Художник не контролирует ИИ полностью, сотни микрорешений на всем пространстве виртуального холста принимает алгоритм. И точно так же художник не контролирует/ только ограниченно контролирует социум, язык, нейрометаболизм и микофлору.

Нетрудно заметить, что этот характер рассуждений рифмуется с так называемыми плоскими онтологиями философа и художника Мануэля ДеЛанда и объектно-ориентированными онтологиями (ООО) философа Грэма Хармана — это ставшие мейнстримными направлениями в философии, в которых все объекты рассматриваются как равноправные участники реальности. В рамках ООО, алгоритмы и программное обеспечение рассматриваются не просто как инструменты, а как автономные объекты со своей собственной реальностью и влиянием на мир. Еще дальше идет философ и теоретик видеоигр Йен Богост в концепции «чуждой феноменологии» (Alien Phenomenology). Богост вообще предлагает встать на точку зрения нечеловеческих объектов.

Все это идеально ложится на практику AI-художника. Художник задает параметры или даже обучает модель на своих картинках, но алгоритм самостоятельно интерпретирует и применяет эти инструкции. Зачастую художник становится куратором или фасилитатором (посредником). Но еще более очевидная параллель с плоскими онтологиями возникает ввиду того, что одним из ключевых аспектов работы систем генеративного ИИ является векторное представление всех входных данных в латентном пространстве.

Текстовые промпты, визуальные референсы, стилистические указания, исторические периоды и жанровые характеристики — всё это преобразуется в числовой вид. Это преобразование и создает своего рода «плоскую онтологию», где различные типы сущностей приводятся к общему знаменателю. На уровне латентного пространства нет иерархического различия между материальным и нематериальным, между абстрактными концепциями и конкретными визуальными элементами. Слово «импрессионизм» существует в том же векторном пространстве, что и конкретная цветовая палитра или текстура мазка. Это радикально «плоское» пространство, где все сущности обладают равным онтологическим статусом.

***

Рассмотрение AI-искусства через призму существующих теоретических концепций показывает, что многие явления, которые кажутся радикально новыми, имеют глубокие корни в истории искусства. От беньяминовского анализа технической воспроизводимости до современных теорий цифрового искусства — каждая из рассмотренных концепций находит свое применение в контексте генеративных технологий.

AI-искусство действительно создает новые художественные возможности и ставит интересные вопросы об авторстве, оригинальности и творческом процессе. Художник в работе с AI принимает на себя роли навигатора, куратора, интерпретатора — но не впервые в истории искусства творческие роли подвергаются переосмыслению.

Возможно, главная ценность AI как художественного инструмента состоит не в создании принципиально нового искусства, а в том, что он делает более явными те аспекты творческого процесса, которые всегда присутствовали, но оставались менее заметными: коллективность творчества, роль технических средств, влияние культурного контекста, множественность факторов, определяющих художественный результат.

В этом смысле AI-искусство предлагает не столько новые ответы, сколько новые способы постановки старых вопросов о природе творчества. И в этом, возможно, и состоит его основной теоретический интерес.