Contents

El director de operaciones de OpenAI se negó a responder si Sora está entrenado en videos de YouTube

/es/images/openai-coo-refused-to-answer-if-sora-is-trained-on-youtube-videos.png

Sora, un modelo de conversión de texto a vídeo impulsado por IA desarrollado por OpenAI, provoca asombro y aprensión en igual medida. Esta notable herramienta permite a los usuarios crear contenido visual cautivador a partir de meras descripciones verbales, pero al mismo tiempo amenaza con desplazar a los creativos humanos con sus prodigiosas capacidades. Al sintetizar secuencias de movimiento coherentes que abarcan hasta sesenta segundos, Sora trasciende las limitaciones convencionales del lenguaje para manifestar imágenes vívidas que rivalizan con la cinematografía profesional.

Sora, una startup de generación de vídeos musicales respaldada por Microsoft, ha presentado recientemente su producto inicial, que marca un hito importante ya que representa el primer lanzamiento de este modelo de IA en particular. Sin embargo, vale la pena señalar que la tecnología se encuentra actualmente en pruebas y no se ha puesto a disposición del público en general en este momento. En consecuencia, sigue habiendo un amplio margen para perfeccionar y mejorar con respecto a diversas facetas del sistema.

¿OpenAI entrenó a Sora en videos de YouTube?

El mes pasado, el CEO de YouTube ya advirtió a OpenAI que no usara sus videos para entrenar a Sora. En una entrevista más reciente en la Cumbre de Tecnología de Bloomberg, el director de operaciones, Brad Lightcap, habló sobre las posibles aplicaciones comerciales de sus productos de inteligencia artificial. En la conversación también apareció Sora, uno de los productos destacados de la startup que tiene potenciales aplicaciones comerciales. Hablando de Sora, el entrevistador planteó la pregunta:"¿Qué datos de entrenamiento se utilizaron para entrenar el modelo?"

Más específicamente, el entrevistador presionó al funcionario de OpenAI para que aclarara definitivamente si entrenaron a Sora en videos de YouTube. Sin embargo, Lightcap parecía reacio a dar una respuesta directa. En cambio, discutió varios aspectos, incluida la generación de contenido, la utilización de este contenido como datos para la capacitación de modelos, la garantía de transparencia con respecto al uso de datos, los beneficios potenciales para los creadores de contenido y más. Sin embargo, no mencionó YouTube ni una sola vez en su descriptiva “no respuesta” sobre si OpenAI ha entrenado a Sora en videos de la plataforma o no.

El director de operaciones, Brad Lightcap, se negó a responder la pregunta.

En esencia, nos encontramos lidiando con un problema bastante desafiante que aún no ha aportado su conjunto completo de soluciones. Aunque OpenAI ha proporcionado ciertos conocimientos sobre la veracidad del contenido en línea, el enfoque principal parece ser garantizar la transparencia en sus orígenes. Además, si bien la organización ha mencionado la utilización de varias fuentes para entrenar sus modelos lingüísticos, los detalles específicos sobre estas fuentes de datos, así como cualquier participación con el contenido de YouTube, siguen sin estar claros.

Para recordar, a la CTO de la compañía, Mira Murati, también se le hizo la misma pregunta sobre Sora a principios del mes pasado. Tampoco pudo dar una respuesta clara a la pregunta.

Los informes indican que a principios de 2021, OpenAI utilizó vídeos de YouTube como medio para entrenar su modelo de lenguaje avanzado, GPT-4, a pesar de violar las directrices de la plataforma. Parece que Google también incurrió en prácticas similares. En cuanto al conjunto de datos de capacitación de Sora Corporation, hay indicios que sugieren un uso potencial del contenido de vídeo de YouTube. Algunos especulan que el modelo podría estar disponible para el público en general a mediados del año 2024, con una fecha de lanzamiento estimada dentro del mes de agosto.

*️⃣ Enlace fuente:

entrevista, el entrevistador presionó al funcionario de OpenAI, no pude dar una respuesta clara,