Connect with us
Anunciate en esta Pagina

TECNOLOGIA

OpenAI dice que trabaja en una inteligencia artificial que imita las voces humanas

Published

on

OpenAI presentó una nueva herramienta de inteligencia artificial que puede imitar voces humanas con una precisión sorprendente. El generador de voz de IA tiene una variedad de usos potenciales, incluso para servicios de accesibilidad, pero también podría generar preocupaciones sobre desinformación y otras formas de abuso.

OpenAI compartió muestras el viernes de las primeras pruebas de la herramienta, llamada Voice Engine, que utiliza una muestra de 15 segundos de alguien hablando para generar una réplica convincente de su voz. Luego, los usuarios pueden proporcionar un párrafo de texto y la herramienta lo leerá con la voz generada por IA.

Ya hay varios servicios de voces generadas por inteligencia artificial disponibles para el público pero, como sucedió con el innovador chatbot ChatGPT, OpenAI demostró ser particularmente hábil para lograr una adopción generalizada de herramientas de IA.

Una herramienta de conversión de texto a voz basada en inteligencia artificial podría ayudar con la traducción, podría ayudar a los niños a leer e incluso ayudar a las personas que han perdido la capacidad de hablar, dice la compañía. Pero a algunos escépticos les preocupa que también pueda alimentar la creación de desinformación o facilitar la difusión de estafas.

OpenAI dice que Voice Engine es utilizado actualmente solo por un "pequeño grupo de socios confiables", incluidas empresas de tecnología de educación y salud, y utilizará sus pruebas para determinar si se permite y cómo sería un uso más generalizado. Esos evaluadores acordaron no recrear las voces de las personas sin su consentimiento explícito e identificar claramente a los oyentes que lo que están escuchando es generado por IA, según la compañía.

"Reconocemos que generar un discurso que se parezca a las voces de las personas tiene serios riesgos, que son especialmente importantes en un año electoral", afirmó OpenAI en una publicación de blog. La compañía reconoció la necesidad de realizar cambios importantes a medida que el audio generado por IA esté más disponible, aunque no planea lanzar Voice Engine al público de inmediato. Por ejemplo, la empresa sugirió eliminar gradualmente la autenticación basada en voz para las cuentas bancarias.

“Cualquier implementación amplia de tecnología de voz sintética debe ir acompañada de experiencias de autenticación de voz que verifiquen que el hablante original está agregando conscientemente su voz al servicio y una lista de voces prohibidas que detecte y evite la creación de voces que sean demasiado similares a voces prominentes”, dijo OpenAI.

Voice Engine puede utilizar una muestra de voz en un idioma para crear una réplica de voz que pueda hablar en varios otros idiomas.

La publicación de su blog incluye un ejemplo de un clip de audio de un humano leyendo un pasaje sobre la amistad, junto con audio generado por IA que suena como si la misma persona leyera el mismo pasaje en español, mandarín, alemán, francés y japonés. En cada una de las muestras generadas por IA se mantiene el tono y el acento del hablante original.

La vista previa de Voice Engine se produce mientras los usuarios esperan el lanzamiento público de Sora, la herramienta de video generada con inteligencia artificial que OpenAI presentó el mes pasado. Sora puede crear videos de 60 segundos de apariencia realista a partir de instrucciones de texto, con la capacidad de presentar escenas con múltiples personajes, movimientos movimiento y detalles del fondo elaborados. ChatGPT de OpenAI también puede generar imágenes a partir de un mensaje de texto.

Por otra parte, OpenAI también anunció este lunes que pondrá ChatGPT a disposición de cualquier persona sin la necesidad de registrarse para utilizar el servicio.

La compañía señaló que puede usar cualquier texto cargado en ChatGPT para mejorar sus modelos, pero dijo que esto se puede desactivar a través de la configuración incluso sin una cuenta. Sin embargo, sin una cuenta, los usuarios no podrán guardar ni revisar el historial de chat ni acceder a diversas funciones, incluidas conversaciones de voz e instrucciones personalizadas.


Articulos Recientes

El Cibao8 horas ago

Hija de chofer recolector publica emotivo mensaje tras su partida

Santiago– Autoridades locales y familiares han solicitado que se haga justicia tras la muerte de Deivy Carlos Abreu Quezada, un...

El Cibao12 horas ago

Apresan uno de los matadores de puertoriqueño en Santiago

SANTIAGO.- La Policía Nacional informa que fue arrestado de manera oportuna Willi José León García alias “Willito”, implicado en el...

El Cibao13 horas ago

Alcalde de Santiago expondrá sobre aportes del ayuntamiento al desarrollo de la ciudad

Ulises Rodríguez expondrá aportes del ayuntamiento a la transformación de Santiago de los Caballeros SANTIAGO. El alcalde Ulises Rodríguez expondrá lo que son aportes fundamentales de la...

El Cibao2 días ago

“Santiago bajo presión: déficit de 42 millones de galones de agua sacude al Cibao y enciende alerta por crisis hídrica”

SANTIAGO. — Las condiciones del tiempo han provocado serias afectaciones en los sistemas de abastecimiento de agua en la región,...

Home2 días ago

ESTOS SON LOS MAS BUSCADOS POR LA POLICIA EN COTUI

COTUI, PROVINCIA SÁNCHEZ RAMÍREZ.- La Dirección Nacional de Investigaciones Criminales (Dicrim) publicó un listado de los cincos presuntos delincuentes más buscados, acusados de...

EL MUNDO2 días ago

“Terremoto en Wall Street: Netflix se desploma tras la salida de su fundador y enciende alarmas en el mercado”

Nueva York. — El gigante del streaming Netflix sufrió una fuerte caída del 10,02 % en la bolsa de Wall...

EL MUNDO2 días ago

“Ormuz al borde del colapso: Irán cierra el grifo del petróleo mundial y desata nueva tensión con EE. UU.”

Teherán. — Irán afirmó este sábado que ha vuelto a imponer un “control estricto” sobre el Estrecho de Ormuz, revirtiendo...

El Cibao2 días ago

“Asalto mortal en Puñal: ejecutan a puertorriqueño en pleno centro de diversión y desata alarma por ola de violencia”

Puñal, Santiago de los Caballeros. — Un ciudadano puertorriqueño fue ultimado de un disparo en la cabeza durante un asalto...

EL PAIS2 días ago

QUE PEIDIGA: “Guerra en el mar: golpe histórico al narco deja 1.6 toneladas de cocaína incautadas tras violento enfrentamiento en Pedernales”

Santo Domingo. — En una de las operaciones más contundentes contra el narcotráfico en lo que va de año, agentes...

El Cibao2 días ago

“Consternación en la música típica: hallan muerto con signos de violencia al legendario Ranfis Torres en su residencia”

San José de las Matas, Santiago de los Caballeros. — El músico y compositor de música típica dominicana Ranfis Torres,...

Facebook

OpenAI presentó una nueva herramienta de inteligencia artificial que puede imitar voces humanas con una precisión sorprendente. El generador de voz de IA tiene una variedad de usos potenciales, incluso para servicios de accesibilidad, pero también podría generar preocupaciones sobre desinformación y otras formas de abuso.

OpenAI compartió muestras el viernes de las primeras pruebas de la herramienta, llamada Voice Engine, que utiliza una muestra de 15 segundos de alguien hablando para generar una réplica convincente de su voz. Luego, los usuarios pueden proporcionar un párrafo de texto y la herramienta lo leerá con la voz generada por IA.

Ya hay varios servicios de voces generadas por inteligencia artificial disponibles para el público pero, como sucedió con el innovador chatbot ChatGPT, OpenAI demostró ser particularmente hábil para lograr una adopción generalizada de herramientas de IA.

Una herramienta de conversión de texto a voz basada en inteligencia artificial podría ayudar con la traducción, podría ayudar a los niños a leer e incluso ayudar a las personas que han perdido la capacidad de hablar, dice la compañía. Pero a algunos escépticos les preocupa que también pueda alimentar la creación de desinformación o facilitar la difusión de estafas.

OpenAI dice que Voice Engine es utilizado actualmente solo por un "pequeño grupo de socios confiables", incluidas empresas de tecnología de educación y salud, y utilizará sus pruebas para determinar si se permite y cómo sería un uso más generalizado. Esos evaluadores acordaron no recrear las voces de las personas sin su consentimiento explícito e identificar claramente a los oyentes que lo que están escuchando es generado por IA, según la compañía.

"Reconocemos que generar un discurso que se parezca a las voces de las personas tiene serios riesgos, que son especialmente importantes en un año electoral", afirmó OpenAI en una publicación de blog. La compañía reconoció la necesidad de realizar cambios importantes a medida que el audio generado por IA esté más disponible, aunque no planea lanzar Voice Engine al público de inmediato. Por ejemplo, la empresa sugirió eliminar gradualmente la autenticación basada en voz para las cuentas bancarias.

“Cualquier implementación amplia de tecnología de voz sintética debe ir acompañada de experiencias de autenticación de voz que verifiquen que el hablante original está agregando conscientemente su voz al servicio y una lista de voces prohibidas que detecte y evite la creación de voces que sean demasiado similares a voces prominentes”, dijo OpenAI.

Voice Engine puede utilizar una muestra de voz en un idioma para crear una réplica de voz que pueda hablar en varios otros idiomas.

La publicación de su blog incluye un ejemplo de un clip de audio de un humano leyendo un pasaje sobre la amistad, junto con audio generado por IA que suena como si la misma persona leyera el mismo pasaje en español, mandarín, alemán, francés y japonés. En cada una de las muestras generadas por IA se mantiene el tono y el acento del hablante original.

La vista previa de Voice Engine se produce mientras los usuarios esperan el lanzamiento público de Sora, la herramienta de video generada con inteligencia artificial que OpenAI presentó el mes pasado. Sora puede crear videos de 60 segundos de apariencia realista a partir de instrucciones de texto, con la capacidad de presentar escenas con múltiples personajes, movimientos movimiento y detalles del fondo elaborados. ChatGPT de OpenAI también puede generar imágenes a partir de un mensaje de texto.

Por otra parte, OpenAI también anunció este lunes que pondrá ChatGPT a disposición de cualquier persona sin la necesidad de registrarse para utilizar el servicio.

La compañía señaló que puede usar cualquier texto cargado en ChatGPT para mejorar sus modelos, pero dijo que esto se puede desactivar a través de la configuración incluso sin una cuenta. Sin embargo, sin una cuenta, los usuarios no podrán guardar ni revisar el historial de chat ni acceder a diversas funciones, incluidas conversaciones de voz e instrucciones personalizadas.

Exit mobile version