Как нейросети воскрешают мертвецов

0
157

Как нейросети воскрешают мертвецов

Искусственный интеллект может обучаться на файлах с произведениями конкретного артиста — а затем продолжать «творить» в его стиле, даже если он уже мертв.

Добавьте к этому технологию генерирования речи, которая также может воспроизводить голос человека со всеми его индивидуальными оттенками и интонациями, если проглотит достаточно записей, — и вы получите бессмертных аватаров для каждого из нас. О том, какие этические, правовые и творческие проблемы порождает возможность создать цифровую копию человека.

В июле голос знаменитого шеф-повара, путешественника и документалиста Энтони Бурдена был воскрешен из мертвых. В фильме, посвященном жизни этого человека, он вслух читает письмо к другу: «Моя жизнь превратилась в дерьмо, — говорит он. — Ты, как и я, успешный человек. Счастлив ли ты?»Однако Бурден никогда не произносил этих слов — он только написал их. Его голос был сгенерирован искусственным интеллектом. Режиссер фильма «Подорожник» Морган Невилл заказал этот фрагмент у компании, занимающейся созданием голосовых дипфейков. Сам он защищает свое решение, но большинство зрителей восприняли такой ход как надругательство над памятью о Бурдене.

Это уже не первый случай, когда технологии используются для воскрешения мертвых знаменитостей: на фестивале Коачелла выступала голограмма Тупака Шакура, трехмерный анимированный Фред Астер танцевал в рекламе пылесосов Dirt Devil, а Питер Кушинг появился в фильме «Изгой-один. Звездные войны: Истории». Но дипфейки, то есть синтез реалистичных копий голосов и изображений людей при помощи нейросетей, — это совершенно новый уровень.

С другой стороны, искусственный интеллект может использоваться не только для того, чтобы вызывать призраков прошлого. Он также способен обеспечить артистам творческое бессмертие.

Как нейросети воскрешают мертвецов

Технология и некромантия

Появление в XIX веке звукозаписи открыло новые возможности для увековечивания человеческой речи. В 1870-х годах, работая над изобретением фонографа, Томас Эдисон подчеркивал, что этот прибор позволит навечно запечатлеть «голоса, изречения и последние слова великих людей». Голос человека — это сложное и неповторимое сочетание биологических и физиологических особенностей, привычек и характера, социальной и культурной истории. Звукозапись отделила голос от тела и подарила ему собственную жизнь.

Но сохранение голоса было не единственной целью изобретателей. В XX веке почти каждая новая коммуникационная технология применялась также для связи с потусторонним миром.

Медиумы в ходе спиритических сеансов использовали стук, имитирующий звук недавно изобретенного телеграфа. А «фоновидящие» утверждали, что могут связываться с умершими по телефону. В 1920 году в журнале American Magazine вышло интервью с Эдисоном, в котором тот рассказывал о работе над «приспособлением для общения с людьми, покинувшими этот мир». Надежда на то, что коммуникационные технологии могут обеспечить канал связи с миром мертвых, как мы видим, появилась не вчера.Цифровые технологии предоставили новые возможности для реализации этих оккультных фантазий. Начиная от изобретения телеграфа и до появления телевизоров и компьютеров электронные медиа неизменно связывались со сверхъестественными явлениями. Радиоспектакль «Война миров» и телесериал «Сумеречная зона» сформулировали в свое время идею, что новые коммуникационные технологии искажают время и пространство. Аналогичным образом сегодня воспринимаются киберпространство, виртуальная реальность и интернет.

Историк медиа Джеффри Сконс проследил, как со временем эти представления переросли в обеспокоенность по поводу господства цифровых технологий над нашей жизнью. Но они по сей день расширяют наши возможности в самых разных сферах.

Так, искусственный интеллект, помимо всего прочего, в каком-то смысле стал новым инструментом для установления контакта с привидениями. Replika — это чатбот, управляемый обученной на переписках нейросетью. Его цель — создание цифровых двойников, которые могут стать живыми памятниками тем, кто покинул нас.

Как нейросети воскрешают мертвецов

От некромантии к некрофилии

Все коммуникационные технологии имеют дело с духами умерших. И только аудиосредства служат носителями живой сущности: голос, рождающийся внутри человеческого тела, сообщает нечто неуловимое о личности и душе человека.

Музыкальная запись облекает эти свойства голоса в творческий замысел и стиль — записанная речь неотделима от своего автора. По этой причине использование записей чужого голоса вызывает сильную эмоциональную реакцию — иногда резкую критику, а иногда неистовую поддержку.

Диджеи изрядно оскандалились, когда начали использовать чужую музыку. Смешивая записи на пультах и в студиях, диджеи и продюсеры помещали музыкальные фрагменты в новый контекст, зачастую существенно меняя их изначальный смысл. Джазовый музыкант Джеймс Мтуме, игравший вместе с Майлзом Дэвисом, презрительно назвал эту практику «творческой некрофилией» — преступлением священной грани между жизнью и смертью.

Музыкант Холли Херндон, которая использует ИИ при написании музыки, называет творческой некрофилией применение этой технологии в голосовых дипфейках и генеративной музыке. Херндон не является противницей ИИ как такового, она рассматривает машинное обучение в качестве творческого инструмента. Но, по ее словам, есть четкое различие между ее подходом и проектами вроде OpenAI Jukebox — нейросетью, обученной на наборах данных из самых разных жанров музыки, которая генерирует песни и тексты в стиле живых и умерших знаменитостей.

Оживляя умерших исполнителей при помощи синтетических голосовых моделей, ИИ осуществляет мечту о воскрешении мертвых. Но использование голосовых дипфейков — спорная практика с точки зрения этики. Так, голосовой клон Бурдена критиковали, исходя из предположения, что ему самому это могло бы не понравиться.

Как пишет в журнале New Yorker Хелен Рознер, аутентичность — неотъемлемая часть образа Бурдена. В «Подорожнике» Невилл не сообщает зрителям, что Бурден на самом деле никогда не произносил этих слов, поэтому режиссер попросту обманул зрителей.

Будущее творческих дипфейков

Искусственный интеллект трансформирует творческий ландшафт. Скоро артисты смогут сами решать, чей призрак им вызвать из машины дипфейков: можно будет «воскресить» самого себя или заставить кого-нибудь из мертвых классиков восстать из баз данных в виде зомби. Последние, в свою очередь, получат возможность заглянуть в наш мир из мира загробного.

ИИ — это творение человека. Решения о маркировке творческих работ, использующихся в алгоритмах глубокого обучения, имеют настолько же важное значение с точки зрения наследия артиста, как и сами данные в архиве. Скоро артист сможет извлечь из файлов с творческими работами ядро собственной творческой идентичности, которое содержало бы весь личный архив, отдельные его фрагменты или ничего.

Согласуя свое наследие с собственной голосовой идентичностью, творческим стилем и возможными новыми контекстами, порожденными ИИ, артисты смогут творить прямо из могилы. Но прежде им нужно будет определить условия своей посмертной творческой деятельности, решая, как, когда и кем их музыкальный архив может быть использован для обучения алгоритмов.

По словам исследователя Кейт Кроуфорд, создатели ИИ-систем руководствуются представлением о том, что «все вокруг — это данные, которые можно свободно использовать». Согласно этому взгляду, отдельные объекты — будь то магшоты или музыкальные фрагменты — лишены личного, общественного и политического значения; ничто не должно мешать скармливать их нейросетям, чтобы заработать на этом. В таких условиях воскрешение при помощи ИИ может запятнать память об умершем. Но артист сможет применить избирательный подход к собственному звуковому архиву, позволив использовать для создания голосовых моделей только отдельные элементы своего творчества.

Артист также сможет либо ограничить, либо расширить потенциальный круг обстоятельств своего «воскрешения». Он сможет очертить границы использования своего голоса — например, запретив использовать его в коммерческих целях или для выражения идей, противоречащих его собственным. Он сможет даже запретить озвучивать принадлежащие ему слова.

Законодательство в области интеллектуальной собственности и авторского права не поспевает за развитием новых технологий, и не все судебные органы признают посмертные права. Тем не менее артисты и их наследники, если позаботятся об этом заранее, смогут предотвратить превращение своего голоса в товар и сами принять решение относительного своего посмертного творчества.

Технологии и дальше будут способствовать расширению горизонтов искусства. Как бы тщательно артист ни готовился к будущему, неизбежно появятся неожиданные творческие и коммерческие контексты. История аудиовизуальных технологий наполнена призраками. Но вместо того, чтобы позволять использовать свои голоса для призыва тусклых призраков прошлого, артисты могут использовать ИИ для создания яркого будущего.