OpenAI ha anunciado en un mensaje en X que “están trabajando para pausar el uso de Sky”. Sky es la voz que recordaba, en el nuevo ChatGPT, el tono de Scarlett Johansson en la película Her, donde un hombre se enamora de su asistente virtual. El mensaje, publicado de madrugada en California, incluye un post sobre cómo han escogido y entrenado las voces de actores para ChatGPT. En ese comunicado hay un párrafo sorprendente donde la compañía comenta específicamente el caso de Johansson: “Creemos que las voces de IA no deberían imitar deliberadamente la voz particular de una famosa. La voz de Sky no es una imitación de Scarlett Johansson, sino que pertenece a una actriz profesional diferente que utiliza su propia voz natural. Para proteger su privacidad, no podemos compartir los nombres de nuestros talentos de voz”.
We’ve heard questions about how we chose the voices in ChatGPT, especially Sky. We are working to pause the use of Sky while we address them.
Read more about how we chose these voices: https://t.co/R8wwZjU36L
— OpenAI (@OpenAI) May 20, 2024
Aunque OpenAI permite conversar con voces desde septiembre de 2023, el revuelo con la voz de Sky solo llegó con la presentación del pasado lunes de su nuevo modelo, ChatGPT-4o, que disminuye la latencia y permite conversaciones en tiempo real. Durante la presentación hubo algún momento donde el modelo parecía flirtear con empleados de la compañía. El propio Sam Altman publicó en X el escueto mensaje “her” durante el acto. Los paralelismos no eran casualidad ni exageración. La propia compañía los promovía. Otros empleados lanzaron mensajes sobre la película.
La especulación en X sobre los motivos de OpenAI para “pausar” esa voz en concreto apuntan a una posible demanda de Johansson, algo que nadie ha confirmado.
OpenAI explica en su comunicado que empezaron a buscar actores y actrices para sus voces a principios 2023. La personalidad de los elegidos debía incluir al menos todos estos rasgos: “Distintos orígenes o que pudieran hablar varios idiomas, voz que parezca atemporal, que inspire confianza, que sea cálida, atractiva, que sea carismática, con un tono rico y fácil de escuchar”, siempre según el comunicado.
La compañía recibió 400 propuestas. Los candidatos debieron grabar varias frases y conversaciones y se les explicó exactamente para qué eran. También explican que la remuneración fue alta: “Cada actor recibe una compensación por encima de las tarifas del mercado, y continuará siendo así mientras sus voces se usen en nuestros productos”.
El pasado verano grabaron ya en persona en San Francisco sus voces para ChatGPT. De cara al nuevo modelo presentado la semana pasada, las cinco voces escogidas continuaron colaborando con nuevo material. El comunicado no da ningún otro detalle de qué ocurrirá con la voz Sky, más allá de que habrá “más opciones”: “De cara al futuro, habrá aún más opciones, ya que planeamos introducir nuevas voces en ChatGPT para adaptarnos mejor a los diversos intereses y preferencias de los usuarios”.
Puedes seguir a EL PAÍS Tecnología en Facebook y X o apuntarte aquí para recibir nuestra newsletter semanal.