Microsoft revela Phi-3 Vision, una IA avanzada que interpreta imágenes y texto

Gabriela Navarro Redactora May-Mar-AMÚltima actualización: May-Jue-PM

0 223 2 minutos de lectura

Microsoft revela Phi-3 Vision, una IA avanzada que interpreta imágenes y texto 1 — #image_title

Microsoft ha anunciado la disponibilidad de Phi-3 Mini, un modelo de inteligencia artificial ligero y potente que compite directamente con GPT-3.5. La presentación se realizó durante el evento Build 2024, donde el gigante tecnológico destacó varias novedades en su línea de modelos de lenguaje. Phi-3 Mini no fue la única revelación importante del día, ya que Microsoft también introdujo Phi-3 Vision y Phi-Silica, un modelo compacto diseñado para ejecutarse en los ordenadores Copilot+ PC.

Phi-3 Mini: Poder y Ligereza en la IA

Aunque la comunidad ya conocía bastante sobre Phi-3 Mini, quedaba por confirmar un detalle crucial: su disponibilidad. Este modelo de lenguaje, presentado hace solo unas semanas, ha captado la atención de los medios gracias a sus impresionantes características. Phi-3 Mini destaca por su capacidad para ejecutarse en dispositivos móviles y ordenadores básicos sin sacrificar potencia.

El Phi-3 Mini puede manejar 3.800 millones de parámetros. Microsoft reveló que este modelo se entrenó con cuentos infantiles que utilizan más de 3.000 palabras simples para explicar conceptos complejos. Esto resultó en una IA capaz de rivalizar con GPT-3.5, el modelo base de la primera versión de ChatGPT, y que puede operar directamente en un ordenador.

Ahora, Phi-3 Mini está disponible a través de la nube de Azure, permitiendo a los desarrolladores acceder fácilmente a sus capacidades.

Phi-3 Vision: Comprensión Multimodal

Otro gran anuncio en Build 2024 fue Phi-3 Vision, un modelo de inteligencia artificial multimodal que puede comprender tanto texto como imágenes. Este nuevo miembro de la familia Phi-3 es el primer modelo de este tipo que Microsoft lanza y puede interpretar imágenes y responder preguntas sobre ellas, similar a lo que ofrece GPT-4o, pero a una escala menor.

Esto Te Puede Interesar... Agroferias del IMA el 14 y 15 de abril: lista completa de lugares

Phi-3 Vision es capaz de realizar tareas de razonamiento visual, como comprender gráficos y diagramas y generar información a partir de ellos. También puede analizar imágenes del mundo real y extraer texto, aunque no puede generar imágenes como algunos modelos de OpenAI.

Lo más impresionante de Phi-3 Vision es su tamaño. Con 4.200 millones de parámetros, este modelo supera a otros más grandes en tareas de razonamiento visual, comprensión de gráficos, tablas y OCR. Microsoft diseñó esta IA para que se ejecute localmente en una amplia gama de dispositivos, incluyendo móviles y ordenadores.

Phi-Silica: La IA Integrada en Copilot+ PC

Microsoft guardó una sorpresa especial para el final: la presentación de Phi-Silica, una IA creada para ejecutarse en los ordenadores Copilot+ PC. Este modelo es el más pequeño de la familia Phi-3, con 3.300 millones de parámetros, y está optimizado para aprovechar los chips Snapdragon X Elite de Qualcomm.

Phi-Silica está diseñada para operar en la NPU de Copilot+ PC, proporcionando inferencias locales ultrarrápidas. Esta IA es notable por ser el primer modelo de lenguaje implementado localmente en Windows. Durante la presentación, Satya Nadella, director ejecutivo de Microsoft, explicó que Phi-Silica reutiliza el caché KV de la NPU y se ejecuta en la CPU para generar aproximadamente 27 tokens por segundo. Además, es energéticamente eficiente, permitiendo liberar la CPU y GPU para otros cálculos. Según Microsoft, la latencia del primer token es de 650 tokens/segundo y el modelo requiere alrededor de 1,5 vatios de energía.

Gabriela Navarro Redactora May-Mar-AMÚltima actualización: May-Jue-PM

0 223 2 minutos de lectura

Microsoft revela Phi-3 Vision, una IA avanzada que interpreta imágenes y texto

Phi-3 Mini: Poder y Ligereza en la IA

Phi-3 Vision: Comprensión Multimodal

Phi-Silica: La IA Integrada en Copilot+ PC

Deja una respuesta Cancelar la respuesta

Los 15 errores que te impiden bajar de Peso , GUIA 2024 PARA ADELGAZAR GRATIS

ACNÉ | Que es el Acné?

Moody’s ve en Cobre Panamá una fuente de ingresos para consolidar la recuperación fiscal de Panamá

La inusual incursión en el fútbol: La historia de ‘La Barbie’, exjefe narco, dueño del Club Atlético Veragüense en la Liga Panameña de Fútbol

Ricardo Martinelli busca revocar con Recurso de Casación la condena por el caso New Business mientras denuncia irregularidades procesales

Éxito en el Home Port: Más de 6 mil turistas llegan a Panamá a través de los cruceros El Viking Mars y el Norwegian Joy

Emprendedora latina revoluciona la comunicación para personas sordas con la aplicación Sign-Speak basada en Inteligencia Artificial

Fuerte Crecimiento en las Utilidades Bancarias en el Centro Bancario Internacional: Alza del 50.8% a Octubre de 2023

Phi-3 Mini: Poder y Ligereza en la IA

Phi-3 Vision: Comprensión Multimodal

Phi-Silica: La IA Integrada en Copilot+ PC

Los peligros del exceso de cafeína en los adolescentes

Grok, la última creación de Elon Musk y X, ahora es capaz de reconocer imágenes

Publicaciones relacionadas

Pagos de becas del IFARHU se trasladan a Veraguas la próxima semana

Minsa CAPSI de Tortí atenderá solo urgencias este 6 de junio por interrupción eléctrica

CSS suspenderá servicios en la Policlínica Manuel María Valdés por trabajos de fumigación

MOP y la Oficina de las Naciones Unidas de Servicios para Proyectos firman acuerdo para fortalecer la red vial

Deja una respuesta Cancelar la respuesta

Los 15 errores que te impiden bajar de Peso , GUIA 2024 PARA ADELGAZAR GRATIS

ACNÉ | Que es el Acné?

Moody’s ve en Cobre Panamá una fuente de ingresos para consolidar la recuperación fiscal de Panamá

La inusual incursión en el fútbol: La historia de ‘La Barbie’, exjefe narco, dueño del Club Atlético Veragüense en la Liga Panameña de Fútbol

Ricardo Martinelli busca revocar con Recurso de Casación la condena por el caso New Business mientras denuncia irregularidades procesales

Éxito en el Home Port: Más de 6 mil turistas llegan a Panamá a través de los cruceros El Viking Mars y el Norwegian Joy

Emprendedora latina revoluciona la comunicación para personas sordas con la aplicación Sign-Speak basada en Inteligencia Artificial

Fuerte Crecimiento en las Utilidades Bancarias en el Centro Bancario Internacional: Alza del 50.8% a Octubre de 2023