Родившегося в 1956 году искусственного интеллекта с демографической точки зрения можно считать бумером. И, как и многие представители того поколения, он зачастую был склонен к чрезмерному оптимизму, обещая больше, чем мог бы предоставить.
Первоначальная цель искусственного интеллекта — комплектация машины, способной решить любую проблему с помощью массового повторения процедур случайных проб и ошибок — отошла в сторону, когда стало очевидно, что компьютеры того времени недостаточно мощны, чтобы работать именно таким образом. В последующие десятилетия компьютеры научились справляться с простыми утилитарными задачами: системы, основанные на правилах (также известные как экспертные системы или системы, основанные на знаниях), и по сей день не творят чудес, но они выполняют множество полезных, хотя и немного рутинных работ, кроме того они обеспечивают соотношение цены и качества. Что же касается самого искусственного интеллекта, то к середине 1970-х о нем почти забыли, отправив его на свалку технической и интеллектуальной истории. Его новое возрождение началось только тогда, когда выяснилось, что благодаря беспрецедентному сочетанию доступных для поиска данных и вычислительной мощности современные компьютеры могут посредством проб и ошибок решать громоздкие задачи, и, в частности, в последние несколько месяцев был создан искусственный интеллект с новыми возможностями, который смог ошеломить мир, внезапно предоставив больше, чем он когда-либо обещал, и, возможно, даже больше, чем большинство ожидало.
Конечно, между неудачными «коннекционистскими» методами первого искусственного интеллекта и нынешним «машинным обучением» есть существенные технические различия, но оба они сходятся в предположении, что компьютеры лучше учатся на действиях или на примерах, чем на формальном обучении: факт, который обрадовал бы Руссо и встревожил бы Дидро, если бы кто-то из них задумался бы об образовании электронных машин. Революция машинного обучения достигла изобразительного искусства в середине 2010-х годов, когда художники обнаружили, что новый режим ИИ под названием генеративно-состязательные сети, или GAN, особенно хорошо подходит для манипулирования изображениями[1]. Ко времени подготовки этой статьи (начало 2023 года), искусство GAN, или искусство, созданное искусственным интеллектом, является одним из основных продуктов цифрового искусства, и его стратегии обработки изображений хорошо известны. Во-первых, художники GAN должны собрать корпус изображений, которые считаются связанными; затем алгоритм машинного обучения обрабатывает этот «набор данных», ищет черты, которые могут быть общими для этих изображений, и формализует общие черты между ними. Результатом этого индуктивного процесса является математическая матрица, которую ученые-компьютерщики называют «скрытым пространством», и которая примерно соответствует тому, что философы в прошлом назвали бы определением, идеей, формулой или квинтэссенцией исходного набора данных. Это определение, которое сегодня не является ни вербальным, ни визуальным, а математическим (векторным), в свою очередь, будет использоваться для распознавания содержания внешних изображений или для создания новых изображений, полученных из того же набора данных. Так, например, если набор данных содержит изображения собак, система распознает настоящую собаку, когда ее покажут, или создаст реалистичные изображения несуществующих собак, когда ее попросят — создаст, очевидно, из чистого воздуха, но на самом деле сопоставляя каждую новую собаку со всеми (и только) уже известными системе собаками.
Наступление генеративного ИИ, захлестнувшее планету начиная с весны 2022 года, существенно не изменило эту концептуальную основу. Удобные для пользователя инструменты преобразования текста в изображение, такие как Midjourney или DALL-E 2, могут создавать изображения благодаря простым вербальным или визуальным подсказкам, но их результаты в настоящее время имеют тенденцию быть слишком общими, поскольку они основаны на «мудрости толпы» помеченных изображений (пары «текст-изображение»), извлеченных из интернета. Тем не менее, потенциал технологии, которая однажды может создавать автоматизированные, настраиваемые и точно контролируемые изображения на основе вербальных и визуальных входящих сигналов, не остался незамеченным сообществом дизайнеров, что, как и следовало ожидать, привело к новому возрождению дебатов на тему человеческий разум против машины.
В результате споры и дискуссии о природе творчества скрыли из поля зрения иные следствия появления изображений, генерируемых ИИ, которые уже ощущаются как в дизайнерских профессиях и в научных кругах. Инструменты машинного обучения, основанные на устаревшей GAN или на более поздних алгоритмах преобразования текста в изображение, представляют нам техническую логику создания изображений на основе ИИ, но также и формируют новое представление о визуальной коммуникации и меняют то, как мы вообще работаем с изображениями. Культурное освоенное новых прорывных технических инструментов, как правило, приводит к образованию петель обратной связи между старыми и новыми практиками. Однако в данном случае необычно то, что внутренняя логика создания изображений под управлением ИИ — далеко не предвещающая какого-то будущего постчеловеческого развития — на самом деле, по-видимому, возрождает давно забытые визуальные стратегии, которые господствовали в искусстве и теории искусства в прошлом.
Создание изображений на основе ИИ является, по своей сути, двойным упражнением в сходстве — визуальном сходстве — которое алгоритмы GAN должны найти, а затем воспроизвести. Первая часть процесса машинного обучения является аналитической: возвращаясь к упомянутому выше примеру, система должна сначала выяснить, что общего у всех этих изображений собак. Какие визуальные особенности делают собаку похожей на всех других собак, следовательно, на номинальную собаку. Этот индуктивный процесс создаст (латентное) определение архетипической собаки. Затем следует генерация образа: сколько вариаций мы можем внести в образ этой идеальной собаки, чтобы он визуально отличался от своего архетипа, но все же оставался узнаваемым как собака — поскольку он похож на всех собак, известных системе. Вторую часть процесса, генеративную часть, мы должны назвать «имитация» — и на самом деле подобное часто называли именно так и в прошлом: здесь система ИИ якобы имитирует свою собственную архетипическую собаку (или, в более поздних версиях технологии, внешнее изображение, которое система распознала как номинальную собаку, сравнивая его с набором данных о собаках или совокупностью собак).
Однако когда это будет сделано, может последовать еще один шаг. Предположим, мы хотим имитировать два набора данных одновременно, чтобы создать гибрид или слияние из двух совокупностей изображений. Есть множество способов подобного добиться, но все они основаны на извлечении некоторых отличительных признаков из первого набора данных и введении их во второй, который, следовательно, сохранит некоторые свои собственные свойства и потеряет другие. Давайте далее предположим, что передаваемые признаки могут быть не отдельными элементами, которые можно вырезать и вставлять, а вместо этого возникать из невыразимой, более тонкой ауры, тона или аромата. В прошлом это общее, всепроникающее ощущение называлось стилем, и примерно в 2016 году ученые-компьютерщики начали называть эту операцию «трансфер стиля»[2]. Термин прижился и теперь встроен в некоторые из самых популярных инструментов для создания изображений на основе ИИ.
Техническое возрождение термина «подражание» произошло совсем недавно. Хотя подражательное обучение длительное время оставалось авторитетным направлением развития искусственного интеллекта, само это слово заняло центральное место только после основополагающей исследовательской работы, опубликованной DeepMind от Google в ноябре 2022 года[3]. Независимо от терминологии, визуальное подражание и тансфер стиля — это то, что в основном делают технологии создания изображений на основе ИИ, и мы делаем то же самое, когда используем их. Поэтому само собой разумеется, что ученые, занимающиеся ИИ, пытаясь воспроизвести с помощью математических средств некоторые базовые и, по-видимому, исторически ему свойственные всегда операции человеческого сознания, в какой-то момент почувствовали инструментальную необходимость обратиться к этим архаичным терминам. Чего ученые-компьютерщики, вероятно, не знали (если только они не изучали сравнительное литературоведение или не были женаты на историке искусства), так это того, что термины «подражание» и «стиль» вызывали споры в гуманитарных науках на протяжении большей части ХХ века, и что дизайнеры и художественные критики, проходившие обучение во второй половине прошлого века их либо старательно избегали, либо всячески пытались их устранить.
Можно было бы написать целые монографии об истории и причинах изгнания подражания и стиля из теории искусства и литературной критики ХХ века. Древние никогда не сомневались в том, что всякое искусство должно быть подражанием чему-либо (Платон и Аристотель расходились лишь в том, чему именно должны подражать живописцы и скульпторы); Цицерон считал, что писатели должны подражать стилю других писателей, хотя термин «стиль» от латинского stilus, инструмент для письма, который Цицерон выбрал с помощью метонимии для обозначения персонального литературного стиля, не получил распространения в английском языке до тех пор, пока уже не получил широкое распространение. В начале Нового времени гуманист эпохи Возрождения был специалистом по подражанию цицероновской латыни, профессиональным писателем, который пытался использовать слова и фразы Цицерона для выражения идей, которых во времена Цицерона не существовало. Гуманисты эпохи Возрождения разработали для решения этой задачи очень сложные композиционные стратегии; они, в свою очередь, повлияли на архитекторов эпохи Возрождения, которым также часто ставили задачу создавать новые здания несколько древними, тем самым открывая способ композиции, явно предназначенный для передачи узнаваемых среди разнообразного содержания абстрактных образов или тонов. Примерно в то же время итальянский художник эпохи Возрождения Джорджо Вазари начал использовать термин «манера» для обозначения того, что в XVIII в. стало известно как вкус, а в XIX в. — как стиль. Именно тогда стиль стал одним из краеугольных камней новой дисциплины истории искусства[4].
Существует масса причин, почему модернистские художники, особенно дизайнеры, могли чувствовать отвращение к идеям подражания и стиля, которые господствовали в европейской теории искусства XIX в. Если форма следует за функцией, подражание традиционным формам при отсутствии их первоначальных функций является ошибкой если не хуже; с модернистской точки зрения, викторианская «битва стилей» и последовавшая за ней стилистическая эклектика олицетворяли все, что пошло не так в архитектуре с начала промышленной революции. Усугубляя такие функционалистские позиции, многие архитекторы ХХ в. все еще находились очарованными мифом о романтическом прометеевском творце; но такие дальновидные гении, а-ля Говард Рорк, не следовали прецедентам или природе. Тем не менее, отцы-основатели архитектурного модернизма не до конца отказались от понятия стиля; Ле Корбюзье, например, стремился создать «новый» архитектурный стиль, а в начале 30-х годов в США сам модернизм, как известно, стал «стилем» — «интернациональным». Тотальный крестовый поход против идеи стиля, похоже, набрал обороты только в 70-х и 80-х годах — это был скорее позднемодернистский, чем модернистский проект. Именно тогда всякое подражание стало рассматриваться как эпигонство, если не плагиат, и теория искусства и литературная критика вынуждены были использовать множество синонимов, иносказаний и эвфемизмов, чтобы обсуждать «подражание», не говоря о нем: вдохновение, влияние (часто связанное с «озабоченностью»), чувственность, влечение, сродство, подход и т. д. В качестве альтернативы классическому подражанию, предполагавшему слияние и преображение, постструктуралистская лингвистика в 70-е годы изобрела понятие интертекстуальности, якобы новой формы композиционной копипасты, где единственной необходимой ссылкой на прецедент являлся коллаж из фрагментов или цитат, извлеченных из их первоначального контекста и явно и последовательно перепрофилированных[5]. Постмодернистские архитекторы той эпохи достаточно часто поступали точно так же, по-видимому, не обращая внимания на тот факт, что коллажи и реди-мейды были и остаются квинтэссенцией модернистского творчества[6].
Именно поэтому существует определенная ирония в том, что новейшие разработки электронных технологий могут теперь способствовать возрождению тропов теории искусства, которые модернизм ХХ в. пытался устранить из визуальной культуры. Подражание и стиль, выброшенные модернистами через дверь из теории искусства, через окно техники возвращаются в художественную практику. Проблема в том, что, поскольку подражание и стиль отсутствовали в большинстве критических рассуждений в изобразительном искусстве в течение последних двух поколений, мы все вместе — но особенно на европоцентричном, модернистском Западе — немного отошли от практики, и мы не знаем, как поступить с этим неожиданным и коварным возрождением некоторых традиционных и давно опороченных способов создания изображений[7]. Классические теоретики, а затем и классицисты прекрасно знали, что всякое творение обязательно включает некоторое осознание (или признание) прецедента; что всякое изобретение основывается на той или иной форме ассимиляции или даже подражания (что включает в себя отрицание, то есть подражание наоборот). Из этого осознания со временем возникла целая энциклопедия эстетических и когнитивных теорий, направленных на оттачивание и продвижение лучших практик подражания. Поскольку технологии теперь начинают автоматизировать подражание, тем самым как легитимируя, так и обобщая ее использование, мы некоторым образом должны вернуться к представлениям о том, что означает подражание, как оно работает и как мы можем с ним работать. В любом случае, как и все остальные инструменты, искусственный интеллект, будь то генеративный или нет, может быть только настолько разумным, насколько интеллектуальны задачи, которые мы перед ним ставим.
[1] Ian Goodfellow et al. Generative Adversarial Nets. NIPS 2014, Proceedings of the 27th International Conference on Neural Information Processing Systems 2 (December 2014): 2672–80.
[2] Leon A. Gatys, Alexander S. Ecker, and Matthias Bethge. A Neural Algorithm of Artistic Style. Submitted August 26, 2015, revised September 2, 2015; Leon A. Gatys, Alexander S. Ecker, and Matthias Bethge. Image Style Transfer Using Convolutional Neural Networks. 2016 IEEE Conference on Computer Vision and Pattern Recognition (Las Vegas, June 2016): 2414–23.
[3] Scott Reed, et al. A Generalist Agent // Transactions on Machine Learning Research. November 2022.
[4] Jas Elsner. Style // Critical Terms for Art History, ed. Robert Nelson and Richard Shiff, 2nd ed. Chicago: University of Chicago Press, 2003. P/ 98–109; George Kubler. Toward a Reductive Theory of Visual Style / Berel Lang. The Concept of Style. Philadelphia: University of Pennsylvania Press, 1979. P. 119–128. См.так же свежую работу Мэри Хваттум (Mary Hvattum) и ее будущую книгу Style and Solitude. Cambridge, MA: MIT Press, 2023. Термин «стиль», конечно, по-прежнему широко используется во многих контекстах (например, в индустрии моды), а в последнее время он стал использоваться в преднамеренно противоположном духе общественными деятелями, дизайнерами-постмодернистами и др.
[5] Кристева Ю. Бахтин, слово, диалог и роман / Французская семиотика: От структурализма к постструктурализму / Пер. с франц., сост., вступ. ст. Г.К. Косикова. - М.: ИГ Прогресс, 2000. - с. 427-457. Официальное освящение теории Кристевой состоялось благодаря тексту Ролана Барта «Texte, theorie du» в издании Encyclopaedia Universalis 1974 года (том 15, с. 1013–17).
[6] Clement Greenberg. Collage / Art and Culture. Critical Essays. Boston: Beacon Press, 1961. P. 70–84.
[7] Я мог бы привести лишь отдельные анекдотичные случаи преемственности и повсеместности практики визуального подражания в неевропейских и доиндустриальных культурах; надеюсь, эта тема будет перехвачена и подвергнута критике другими.