Google amplía capacidades con Gemini 1.5 Pro y presenta Gemini 1.5 Flash y Gemma 2

En la apertura del Google I/O 2024, los de Mountain View han revelado importantes novedades relacionadas con Gemini. En primer lugar, destaca el lanzamiento de Gemini 1.5 Flash, un modelo de inteligencia artificial ligero y optimizado para tareas que demandan baja latencia y costos reducidos. Por otro lado, Gemini 1.5 Pro ha duplicado su capacidad y ha ampliado su disponibilidad.
Según informó Google, Gemini 1.5 Flash está diseñado principalmente para ser implementado en chatbots o aplicaciones que requieren extraer datos de documentos muy extensos. Su tamaño compacto permite una ejecución a gran escala de manera más económica.
Gemini 1.5 Flash ha sido desarrollado con un fuerte énfasis en la velocidad y la eficiencia. Además, está preparado para el razonamiento multimodal, es decir, la interpretación de información a través de texto, audio e imágenes, y para operar con una amplia ventana de contexto. Los interesados podrán probarlo desde hoy en Google Cloud a través de VertexAI y en Google AI Studio, ambos con una ventana de contexto de hasta 1 millón de tokens.
No obstante, Google no ha especificado cuánto más pequeño es Gemini 1.5 Flash en comparación con su IA más potente. Los californianos solo mencionaron que es «más liviano en comparación con Gemini 1.5 Pro», sin detallar más.
Cabe aclarar que no se trata de un reemplazo de Gemini Nano, el modelo más eficiente desarrollado por Google, pensado para tareas on-device. De hecho, Gemini Nano ahora es multimodal, permitiendo a los usuarios utilizar no solo texto como método de entrada, sino también imágenes, sonidos o la voz. La multimodalidad llegará a esta IA de la mano de los dispositivos Pixel más adelante en el año.
Gemini 1.5 Pro amplía su ventana de contexto a 2 millones de tokens
En cuanto a Gemini 1.5 Pro, la IA más potente de Google recibirá hoy nuevas características, comenzando con una ventana de contexto aún más amplia que la actual. Cuando la compañía anunció este modelo, su gran novedad fue la introducción de una ventana de contexto de 1 millón de tokens. Esto le permitía procesar sobre la marcha 1 hora de vídeo, 11 horas de audio y bases de código con 30,000 líneas de código o más de 700,000 palabras.
Si eso te parecía impresionante, la compañía ha decidido incrementarla a 2 millones de tokens. Según explicó Sundar Pichai, CEO de Google, esta actualización es crucial para alcanzar el objetivo de «contexto infinito». Inicialmente, la ventana de contexto ampliada estará disponible en una vista previa privada para desarrolladores. Aún no se ha mencionado cuándo se lanzará para todos.
Lo que sí se ha informado este martes es que Gemini 1.5 Pro con 1 millón de tokens de contexto estará disponible para todos los desarrolladores a nivel global. Además, esta versión mejorada de la IA también se implementa desde hoy en Gemini Advanced, la versión más potente del chatbot de Google, ahora disponible en 35 idiomas.
Ten en cuenta que Gemini Advanced es una herramienta de pago, con un costo mensual de 19,99 dólares en Estados Unidos y 21,99 euros en Europa. Originalmente, esta herramienta utilizaba Gemini Ultra 1.0, pero se actualizará a la nueva versión de Gemini 1.5 Pro. Para aprovechar al máximo la ventana de contexto de 1 millón de tokens, Google permitirá subir archivos directamente desde Drive a Gemini Advanced. La compañía asegura que los documentos se mantendrán privados y no se utilizarán para entrenar su IA.
Gemma 2 está en camino
Aprovechando el I/O 2024, Google ha anunciado novedades sobre Gemma, su IA de código abierto basada en Gemini. La compañía ha introducido PaliGemma, su primer modelo abierto de «lenguaje visual» destinado a tareas de etiquetado y subtitulado de imágenes. Los interesados pueden acceder a ella a través de Kaggle.
Pero eso no es todo, Gemma también recibirá una gran actualización con el lanzamiento de su segunda versión. La nueva generación del modelo contará con 27,000 millones de parámetros y estará disponible a partir de junio. Según Google, Gemma 2 podrá superar en rendimiento a modelos que son dos veces más grandes.


