12 Days of OpenAI: Let’s dive in! [ Días 7 a 12 ]
Ahora vamos con la segunda parte de este Calendario de Adviento de doce días de OpenAI y repasamos lo que se anunció desde el día 7 al 12.
Día 7: Projects
El día siete trajo una funcionalidad llamada “Projects” para organizar los chats y trabajar (como su nombre indica) con proyectos dentro de ChatGPT. Esto permite otorgar contexto a un proyecto mediante el uso de ficheros o de ciertas instrucciones dadas.
Imagina un proyecto sobre una página web al cual le hemos compartido documentación técnica del framework utilizado y nuestro código. Lo cual nos permite rápidamente iterar sobre ese contenido sin necesidad de enviar todo el contexto al modelo cada vez que se inicia un nuevo chat.
Día 8: ChatGPT Search
El día ocho presentaron el buscador de ChatGPT Search, algo similar a lo que ya tenía Perplexity y que incluso tienes disponible en Movistar+ para usar con Aura. Esta funcionalidad en ChatGPT ya la veníamos disfrutando algunos usuarios seleccionados, pero a partir de este día ya está disponible para todos los usuarios autenticados.
Según OpenAI el modelo detrás de este buscador se trata de un GPT-4o “finetuneado” para extraer información de la red, mejorar las habilidades de búsqueda (qué términos buscar) y expresar la respuesta en lenguaje natural respondiendo la pregunta formulada.
Día 9: Developers Day - APIs & WebRTC
Este día estuvo dedicado a los desarrolladores y a la API, las principales novedades fueron que el modelo de OpenAI o1, presentado el primer día, ya está disponible mediante la API permitiendo salidas estructuradas, conexión a datos externos y APIs e incluso capacidad de visión.
Día 10: ChatGPT en WhatsApp
Una noticia curiosa pero tranquila, ChatGPT ya está en WhatsApp y mediante teléfono. Un movimiento que Meta ya había hecho meses antes pudiendo conversar con los modelos Llama directamente por WhatsApp, a partir de este día también puedes hacer lo mismo con ChatGPT.
Día 11: ChatGPT para macOS
Este día es algo agridulce, básicamente han actualizado la versión de escritorio de ChatGPT en macOS - además de para Windows - permitiendo la integración con más aplicaciones. Entre ellas: Warp, Notion, Notes, Xcode, Terminal, ...
Y digo lo de agridulce, porque básicamente cuando salió el video del día 11, el título era éste, en el que aparece una integración que luego no está:
Sin embargo, al cabo de unos minutos ese título cambió desapareciendo la parte de “Tasks”, por lo que se cree que OpenAI tenía algo que mostrarnos pero que en una decisión de última hora retiró.
Día 12: Llega o3
Y, por último, el día que ha hecho que AGI sea tendencia en Google. El hype por este último día entre los seguidores de OpenAI era bajo, los últimos días fueros presentaciones de “novedades” ya conocidas o features que nada tienen que ver con el poder de la Inteligencia Artificial.
Os pongo en contexto, los MM-LLMs miden su rendimiento en benchmarks que, por cierto, son cada vez más complejos. Las pruebas que los componen suelen mantenerse en secreto para evitar que los desarrolladores ajusten los modelos específicamente para superarlas y obtener mejores puntuaciones. Sin embargo, a "o3" no le ha hecho mucha falta; ha logrado superar prácticamente todos estos benchmarks sin mucho esfuerzo.
Pero hay un benchmark especial, uno en el que el modelo de OpenAI “o1” (el más avanzado hasta el momento) apenas conseguía superar más de un 32%, y que este modelo “o3” ha elevado esa puntuación hasta el 87,5%, se trata del benchmark “ARC-AGI”.
“ARC-AGI” es un benchmark que incluye pruebas de tipo puzzle y ofrece un premio de 1M USD para quién logre desarrollar un modelo capaz de resolverlas. Estas pruebas son similares a las utilizadas en psicología para evaluar el coeficiente intelectual de una persona. Consisten en analizar una serie de ejemplos con figuras y tratar de resolver un escenario planteado. El desafío no solo busca soluciones a los problemas del benchmark, sino también fomentar el desarrollo de modelos de inteligencia artificial con capacidades de razonamiento abstracto similares a las humanas.
Saludos y feliz año nuevo hackers,