Группа профессиональных дикторов аудиокниг, подкастеров и независимых журналистов подала коллективный иск против компании Google. Истцами по делу выступили известная актриса Линдси Доркус, начитавшая более 100 аудиокниг для крупнейших издательств, театральная актриса и чтец Виктория Нассиф, а также группа заслуженных расследователей и журналистов: Кэрол Марин, Филип Роджерс, Элисон Флауэрс, Робин Амер и Йоханс Лакур. Авторы иска обвиняют технологического гиганта в массовом несанкционированном использовании их голосов для обучения коммерческих нейросетей, сообщает iXBT.
В исковом заявлении утверждается, что Google грубо нарушила закон штата Иллинойс о конфиденциальности биометрической информации (BIPA). Согласно материалам дела, для создания моделей, которые сегодня обеспечивают работу разговорного помощника Gemini Live, аудиообзоров в NotebookLM, функции автоматического дубляжа на YouTube, облачного сервиса синтеза речи Google Cloud Text-to-Speech и голосового ассистента Google Assistant на миллиардах устройств, корпорация использовала сотни тысяч часов записей человеческой речи.
Из этих аудиоматериалов алгоритмы извлекли уникальные биометрические идентификаторы конкретных спикеров, среди которых оказались и голоса истцов.
Заявители особо подчёркивают, что никто из них не был проинформирован о том, что их интеллектуальная собственность и биологические данные станут источником для озвучивания коммерческих ИИ-продуктов Google. Ни у кого из пострадавших не спросили разрешения, и никто из них не давал своего согласия.
Юристы описывают голосовой слепок как «цифровой отпечаток человеческого голоса, который, в отличие от стандартных персональных данных, невозможно заменить в случае компрометации. Номер социального страхования можно перевыпустить, а кредитную карту — аннулировать, но человек, чей голосовой слепок был украден, не может вернуть его обратно или изменить, поскольку биология и врождённые речевые паттерны остаются с ним на всю жизнь».
Главная драма судебного процесса заключается в том, что технологии Google на основе голосов истцов теперь напрямую конкурируют с ними же на профессиональных рынках, где эти люди зарабатывают себе на жизнь. Так, сервис Google Cloud Text-to-Speech сейчас активно лицензируется издательствами аудиокниг как дешёвая альтернатива живому человеческому чтению, лишая работы профессиональных дикторов. Функция аудиообзоров в сервисе NotebookLM генерирует готовые подкасты из письменных источников, обесценивая многолетнюю работу журналистов-расследователей, создающих сложные разговорные форматы. Наконец, автоматический перевод видео на YouTube уничтожает рынок локализации и дубляжа, который исторически кормил актёров озвучивания. При этом каждый из указанных ИИ-продуктов Google оценивается для конечного заказчика в малую долю от стоимости услуг реальных специалистов.