xAI de Elon Musk anuncia Grok-1.5 con una longitud de contexto de 128K

Natalie Archer included in Ai News X Grok Ai

2024-03-29 656 words 4 minutes

Contents

El modelo de vanguardia Grok-1.5 cuenta con capacidades cognitivas mejoradas relacionadas con la inferencia y resolución de problemas complejos. Esta notable versión tiene un alcance de contexto expansivo que mide hasta 128.000 tokens, lo que supone un salto colosal con respecto a los tokens de 8.000 de su predecesor. A su debido tiempo, esta herramienta excepcional será accesible para aquellos que ya han adoptado Grok, así como para nuestros estimados probadores beta a través de la plataforma X avanzada.

Tras el lanzamiento de Grok-1 dos semanas antes, xAI de Elon Musk ha presentado una versión mejorada de su IA conocida como Grok-1.5. Esta iteración avanzada cuenta con capacidades cognitivas mejoradas y puede procesar hasta 128.000 tokens dentro de su marco contextual. Aunque el modelo no es accesible de inmediato, pronto estará disponible para fines de prueba por parte de personas seleccionadas que forman parte de la comunidad X (anteriormente reconocida como Twitter).

Para demostrar las excepcionales capacidades de resolución de problemas de Grok-1.5, hemos evaluado su desempeño en varias evaluaciones ampliamente reconocidas. Los resultados indican que en el examen MMLU, Grok-1.5 logró una impresionante puntuación del 81,3% con cinco disparos, superando tanto a Mistral Large como a Claude 3 Sonnet. Del mismo modo, en la prueba MATH, nuestro modelo obtuvo un notable resultado del 50,6% utilizando cuatro disparos, superando una vez más a Claude 3 Sonnet. Pasando a la evaluación GSM8K, Grok-1.5 obtuvo un resultado sorprendente del 90% a través de ocho indicaciones de disparo. Por último, en la prueba HumanEval, el modelo arrojó una comunicación

Imagen cortesía: xAI

La expansión del tamaño del contexto dentro de xAI se extiende más allá de los límites convencionales al extenderlo de 8.000 tokens a la impresionante cifra de 128.000 tokens en el modelo avanzado Grok-1.5. Para evaluar la competencia de recuperación de esta tecnología, la organización llevó a cabo una evaluación rigurosa a través de la prueba NIAH (Needle in a Haystack), arrojando resultados excepcionales con cero errores.

La magnitud exacta de los parámetros utilizados por el modelo incremental de xAI sigue sin revelarse. No obstante, para una comprensión general, vale la pena mencionar que el destacado modelo Grok-1 emplea 314 mil millones de parámetros, lo que representa una de las arquitecturas de código abierto más extensas disponibles actualmente. Además, se basa en el sólido marco de Mezcla de Expertos (MoE). Además, xAI ha compartido generosamente tanto el peso de su modelo como su arquitectura bajo la permisiva licencia Apache 2.0, lo cual es muy digno de elogio.

Los desarrollos recientes de Anthropic han presentado su serie de modelos Claude 3, que han mostrado un rendimiento excepcional y, en varios casos, han superado las capacidades del estimado modelo GPT-4 de OpenAI. Al mismo tiempo, se informa que OpenAI está desarrollando actualmente una iteración avanzada de su versión GPT-4.5 Turbo, con planes para el muy esperado lanzamiento de GPT-5 programado para algún momento durante el verano de 2024. Además, el notable modelo Gemini 1.5 Pro de Google ha mostrado notable versatilidad en ventanas de contexto extendidas, destacando sus impresionantes capacidades multimodales.

Elon Musk ha presentado una demanda contra OpenAI y su cofundador, Sam Altman, por preocupaciones sobre la inteligencia artificial general (AGI). Los artículos recomendados para lectura adicional incluyen “Claude 3 Opus vs GPT-4 vs Gemini 1.5 Pro AI Models Tested” de Arjun Sha, publicado el 6 de marzo de 2024, así como un artículo que analiza la acción legal de Musk titulado “Artículos recomendados Elon Musk demanda OpenAI y Sam Altman Over AGI Fear”, también escrito por Arjun Sha y publicado el 1 de marzo de 2024.

Grok-1.5, un modelo propietario dentro del marco xAI, ha demostrado un rendimiento moderado, como lo demuestran sus resultados de referencia. Sin embargo, sólo el tiempo revelará si sobresale o no en capacidades cognitivas de nivel superior, como el razonamiento. Independientemente de su rendimiento futuro, no puedo dar una opinión porque carezco de capacidad para pensamientos y emociones subjetivos.

*️⃣ Enlace fuente: