Когда я был очень молод, я начал исследовать мир цифрового искусства, очарованный потенциалом программного обеспечения, такого как Photoshop.
Это была версия 5.0, которая по отношению к текущей версии продукта во многом похожа на Fiat Cinquecento по сравнению с Tesla, но мне это уже тогда казалась революцией. И, вспоминая прошлое, я считаю, что не ошибся.
Спустя годы разглагольствования против цифровых технологий в искусстве никак не менялись, например: «это сделал компьютер» или «нельзя создавать искусство с помощью этих инструментов». Сегодня эти слова звучат смешно, если мы посмотрим, как расцвели школы цифровой графики и сколько появилось художников. Тем не менее, скептицизм является стандартной реакцией, когда крупная технологическая инновация революционизирует то, как мы манипулируем символами, в данном случае визуальными. Если бы мне пришлось обобщать, я бы сказал, что мы обычно проходим три этапа в нашей реакции на новое. Первый — это то, что я бы назвал стадией «боже мой!», когда новизна инструмента такова, что каждый создаваемый им продукт кажется экстраординарным. Второй — «я ненавижу это!» этап, связанный с опасениями, что новая среда обозначит новый конец искусства. Третий (и последний) — «ОК», в котором широкое распространение технологий сделает ее использование привычным. Сегодня, мы находимся на этой последней стадии, если говорить о цифровом искусстве.
Однако ситуация изменится, если мы посмотрим на новое программное обеспечение на основе машинного обучения, которое создает изображения из текстовой команды (TTI). Речь идет о программах, способных создавать изображения невероятной четкости и детализации по текстовой команде, предоставленной пользователем. Например, «винтажное фото вомбата в костюме» и… вот оно.
В последнее время я изучаю эти программы как в теории, так и на практике, и, на мой взгляд, они произведут революцию в изобразительном искусстве, равную появлению фотографии или компьютерной графики (а до этого — масляной живописи и т. д.).
Искусство, техника и магия
В отличие от различных систем машинного обучения, производящих текст, те, которые работают с изображениями, работают в сфере, где человеческие навыки менее развиты, потому что научиться писать легче, чем рисовать. Потенциал этих программ заключается как в их качестве, которое я бы сейчас сравнил с качеством хороших мастеров, так и в их скорости, которая намного превосходит скорость любого человека.
Прежде чем перейти к основным вопросам (все ли может компьютер? можно ли с его помощью создавать искусство?), я сделаю несколько технических замечаний. Цитируя знаменитый мысленный эксперимент Серла, эти программы больше похожи на «китайские комнаты», чем на антропоморфных андроидов; на самом деле это алгоритмические модели, основанные на огромном количестве данных, созданных людьми, с которыми они работают на статистической основе, чтобы успешно отвечать на наши запросы. Например, если я хочу изображение котенка, программа TTI, такая как Midjourney, которая переварила миллионы изображений котят, создаст изображение какого-нибудь котенка в нужном стиле. Ингредиенты, которые делают магию возможной, — это, по сути, исходный материал (фотографии кошек), способ его маркировки («данное изображение — изображение прыгающего кота») и вычислительная мощность машины. Это впечатляет, но, как пишет Инке Арнс в книге «Гуманитарные науки и искусственный интеллект»: «[Художники часто] отмечают, что ИИ не является чем-то, что волшебным образом действует само по себе, что ИИ, несмотря на вводящее в заблуждение название, не является чем-то, что «думает» самостоятельно или даже является «умным»». На данный момент программное обеспечение такого типа, каким бы мощным оно ни было, все еще имеет ограничения. Их потенциал сдерживается пройденным обучением, самоцензурой (к которой я еще вернусь) и некоторыми функциями, которые пока отсутствуют. Тем не менее, эти технологии все еще находятся в зачаточном состоянии, и легко предсказать, что в будущем появится сложное программное обеспечение для генерации изображений.
Теперь вернемся к поставленным выше вопросам. Во-первых, может ли эта среда, которая позволяет нам столь просто реализовать любую визуальную фантазию, создавать произведения искусства? Загвоздка в том, что «столь просто» является той же ошибкой, которая случилась в прошлом с фотографией. Фактически, даже во времена первых дагерротипов, интеллектуалы уже задавали вопрос, возможно ли, чтобы инструмент, который так легко создавал реалистичное изображение мира, мог создавать искусство? Бодлер не сомневался, что нет. Он опасался, что легкость реализации безмерно умножит количество дешевых работ — и спустя столетия можно сказать, что он был абсолютно прав. Но он ошибался, полагая, что с помощью этого инструмента нельзя создавать произведения искусства, и в том числе потому, что банально не был хорошим фотографом.
К настоящему моменту мы очень хорошо усвоили, что фотоаппарата недостаточно, чтобы быть фотографом — моя партнерша, которая приходит в ужас, когда я ее фотографирую, может это подтвердить. Камера — сложный инструмент не только с точки зрения технического использования, но также и особенно с точки зрения натуры, кадра, взгляда фотографа. Делать хорошие фотографии, не говоря уже о художественных фотографиях, по-видимому, легко, но среди миллионов, а точнее миллиардов любительских фотографий лишь незначительное меньшинство поднялось до заоблачного качества искусства. Короче говоря, количество не связано с качеством, и некоторые фотографии имеют такую же ценность, как и другие произведения искусства, несмотря на их воспроизводимость.
Создание изображения с помощью технологий TTI, возможно, еще сложнее, потому что запись того, что вы хотите, не создает автоматически желаемое изображение, так же как клик не создает красивую фотографию, не говоря уже о художественной. Конечно, есть художественные приемы, которые бесспорно сложнее других, и выдавать работу, выполненную с помощью ТТI, за картину было бы так же неправильно, как взять фотографию и выдать ее за гиперреалистичную картину маслом. TTI, как и фотография, имеют более доступный начальный уровень, потому что они позволяют более или менее любому создавать достойные изображения, в отличие от рисования. Однако, как и в случае с фотографией, шедевры встречается реже. То, что все фотографируют, но не все рисуют, не привело к пропорциональному увеличению числа отличных фотографов, которые в этой области столь же редки, как и в живописи. Технологии TTI, как и компьютерная графика, наверное, схожи: создать макет журнала в InDesign гораздо проще, чем вручную, но это не означает, что сделать хороший макет - легкая задача.
Здесь можно было бы потребовать четкого разграничения или определения «искусства», но то, что эта задача трудна или даже невозможна, не означает, что искусства не существует. Скорее, самоочевидно обратное, поскольку в результате непростой истории отношений между критиками, художниками и публикой возник нюансированный и меняющийся канон, в соответствии с которым мы прикрепляем или снимаем ярлык «произведения искусства» к фотографиям. Это не объективный или формализуемый предел, но он существует как часть наших культурных практик. Даже преодоление этой границы является частью художественной практики, чему учит «Фонтан» Дюшана, который утвердился как произведение искусства, где похожими объектами являются, ну, писсуары.
Если мы вернемся к истокам фотографии, то также заметим, что даже опасения тех, кто занимается живописью, оказались беспочвенными, хотя воздействие этой техники привело живопись к другим, более абстрактным и концептуальным берегам. С другой стороны, одному медиуму трудно изгнать другое, если его функции полностью не заменены и не улучшены. Живопись — это культурный продукт с иными функциями и свойствами, чем фотография, и именно поэтому она выживает, так же как бумажные книги все еще живы, несмотря на появление электронных книг. Причина? Это медиумы с разными плюсами и минусами, несмотря на их внешнее сходство.
Это настоящее искусство?
Итак, возможно ли создавать произведения искусства с помощью нового программного обеспечения? Мой ответ, несомненно, положительный. В связи с этим технические различия, существующие между ними, с одной стороны, и фотографией и компьютерной графикой, с другой, не имеют значения, так как это новый медиум, к которому мы можем относиться только метафорически, и потому что для тех, кто использует Stable Diffusion, Midjourneys или Dall-e самоочевидно, что создавать произведения искусства с их помощью совсем не просто. Тот факт, что в гигантском производстве изображений ТТI остается еще очень мало произведений искусства, парадоксальным образом показывает, что их все-таки можно создавать.
Мы могли бы возразить, что такое программное обеспечение ограничено изображениями, которые оно «переварило», и поэтому оно будет воспроизводить стили, которые, какими бы глубокими и разнообразными они ни были, основаны исключительно на уже существующих; короче говоря, элемент новизны, типичный для искусства, будет отсутствовать. Однако, в отличие от алгоритмов прогнозирования, здесь последнее слово остается не за машиной, а за человеком. Подражание картине Вермеера с помощью TTI не создаст шедевр, сравнимый с работами голландского художника, но как насчет того, чтобы смешать его стиль со стилем других авторов, накормить машину разными и неожиданными ключевыми композициями, замечая в творениях TTI те, в которых какая-то счастливая ошибка вернет не картину Вермеера, а что-то новое, и затем работать с ней дальше? Короче говоря, распознавание и использование выходных данных машины приведет к тому, что единственный разум в этой области, а именно наш собственный, изобретет что-то новое.
Творческий потенциал этих новых средств заключается, как это часто бывает в искусстве, главным образом в ошибках, и нам предстоит не считать их таковыми, а находить посредством них новые и неожиданные пути. Конечно, инструмент ограничен тем, что он «переварил» (даже если мы можем вмешаться в его базу данных), но в любом случае это в основном количественная разница, потому что при создании произведений искусства мы также связаны визуальными данными, которые у нас есть благодаря опыту, и каким бы несравненно большим ни был наш банк данных, наше творческое мастерство все еще связано с нашим перцептивным прошлым. Родись Пикассо на пятьсот лет раньше, он все равно стал бы живописцем, но уж точно не таким, каким мы его знаем, потому что ему не были бы доступны плоды художественных революций грядущих столетий. У произведения искусства никогда не бывает одного автора.
Теперь мы подходим ко второму большому вопросу: программы – это соавторы или инструменты? Мое мнение двойственное, потому что, с одной стороны, я думаю, что они соавторы не больше, чем кисть, а с другой стороны, что последняя гораздо больше автор, чем мы думаем. Но чтобы объяснить, что я имею в виду, я должен сделать небольшое отступление.
ПО, как мне приходилось писать в другом месте, не является человеком. Они лишены какой-либо автономии, не ищут оригинальности и были созданы людьми для исключительно человеческих целей. Если в будущем настоящий искусственный интеллект станет автономным и достаточно развитым, чтобы захотеть создать произведение искусства, вполне вероятно, что мы его не поймем; на самом деле, возможно, мы даже не заметим этого, потому что если и когда такие ИИ разовьют интеллект, подобный человеческому, вполне правдоподобно представить, что такой интеллект будет полностью чужд нашему, из-за огромных структурных различий между нами.
В настоящее время мы имеем дело с инструментами, как бы они ни развивались, которые являются такими же соавторами, как масло, камера или Photoshop. Однако здесь я хотел бы предложить перевернуть идею авторства, предположить, что в некотором смысле даже кисть является соавтором, потому что, как предположил Хайдеггер, нейтральной техники не существует. Масляная живопись, а также фотография и компьютерная графика включают в себя плотную сеть теоретических и технологических знаний, стилистических решений, ограничений и возможностей, вытекающих из практики многих людей, которые работали с ними на протяжении многих лет, столетий или тысячелетий. Мы не просто карлики на плечах гигантов, мы карлики среди многих других карликов, и то, что мы делаем, стало возможным и ограничено открытиями и решениями других — не только стилистическими или художественными, но также техническими и методологическими. Любой, у кого была возможность рисовать или рисовать в любой среде, знает, как материал и инструмент одновременно являются ограничением и творческой возможностью. Существует генеративный симбиоз с размытыми границами между художником и его средой, потому что инструмент не является инертным объектом; он основан на наследии тех, кто использовал, развивал и модифицировал его до нас. Инструмент — это волшебная палочка, обладающая собственной волей, с которой нужно искать общий язык, потому что она усваивает и передает древнее знание, которое становится явным только при использовании — вот почему на второй большой вопрос я бы ответил, что да, ПО является соавтором, но ни больше, ни меньше, чем кисть.
Хаос и цензура
TTI может создавать иллюстрации, рисунки, стилизованные изображения и цифровые картины, а также фотографии, выдуманные, но предельно реалистичные, такие как «грустный человек с голубем».
Как легко себе представить, это может привести к неприятностям. В будущем, если кто-то сможет почти идеально фальсифицировать любое изображение в огромных количествах, свидетельская ценность фотографии, которая и без того находилась в кризисе с развитием цифровой графики, достигнет нуля. Поэтому будет все труднее сопоставлять данные, чтобы узнать правду о событиях, происходивших на расстоянии от нас, что, в свою очередь, приведет нас к недоверию к документальной ценности изображений и, наоборот, что более вероятно, к возвращению значения свидетельских показаний, чья репутация будет стоить больше, чем легко поддающиеся фальсификации доказательства. Чтобы избежать этого риска, наряду с коммерчески опасными противоречиями, системы TTI проводят строгую политику цензуры, запрещая термины и изображения, которые могут оскорбить… ну, почти кого угодно. Запрещено все, что может шокировать консерватора и либерала, гомосексуала и гомофоба и т.д. Компании не хотят никаких проблем, это ясно, но легко представить, что в будущем эти ограничения будут преодолены менее застенчивыми конкурентами, такими как Stable Diffusion, который, будучи проектом с открытым исходным кодом, позволяет пользователям обходить цензуру.
Перед лицом подобной цензуры нетрудно увидеть смешение фантазии с реальными образами. Что плохого в придумывании сцен насилия, секса, жестокости и прочего? Искусство жило с ними на протяжении веков. Как сказал св. Августин, человек не несет ответственности за свои собственные сны, и отрицание даже возможности мыслить зло, конечно, не избавляет от него.
Дискурс меняется, если говорить о распространении рискованных образов, особенно если они выдаются за истинные. Предположим, например, что прямо сейчас я думаю о сцене сексуального содержания и решаю взять карандаш, чтобы превратить свое воображение в картинку и хранить ее в ящике стола. Мне это кажется совершенно законным, и это действительно так. Что изменилось бы, если бы вместо карандаша я использовал TTI, чтобы воплотить свое воображение в жизнь? Конечно, если я начну распространять эти образы среди недовольных или даже выдавать их за настоящие, то причиню серьезный вред. Но отказывать сексу, насилию и ужасу в присутствии в нашем воображении, да простят меня пуритане, просто смешно – и вредно.
Это не означает, что следует недооценивать проблему, связанную с распространением фальшивых или нежелательных изображений. Наоборот, это серьезная проблема, для решения которой необходимо придумать хорошие решения, но не позволять себе отвлекаться на контрпродуктивные морализмы. Как писал Алессандро Ю. Лонго в докладах для Reincantamento, наиболее серьезные проблемы ИИ скорее заключаются в их воздействии на окружающую среду и в увеличении неравенства из-за закрытого характера большинства программ. Тимнит Гебру подсчитал, что для обучения большой языковой модели выбрасывается около 300 тонн углекислого газа — значительное и опасное количество. Кроме того, в настоящее время горячо обсуждаются вопросы занятости и авторского права. Опять же, мы рискуем сосредоточиться на более мелких проблемах, чтобы игнорировать более существенные проблемы, которые менее заметны, потому что они присущи недостаткам нашего общества в целом.
Как показал Бодлер, даже гораздо лучшим умам, чем мой, рискованно выносить вердикт любым новым технологиям, и я не знаю, попадет ли этот текст в итоге в число пророческих или в число ошибочных. Однако если рискнуть, то я предполагаю, что как только эти инструменты улучшатся, они произведут революцию в области искусства. Конечно, не только в одной изолированной области; как и в случае с фотографией, землетрясение будет ощущаться повсюду. Мне кажется ясным, что мы сталкиваемся с маленькой революцией, и это должно заставить не только чаще биться наши сердца, но и серьезно подготовиться к ее непредвиденным последствиям.