La firma Red Hat presentó Red Hat AI Inference Server, una mejora de su portafolio de Inteligencia Artificial diseñado para simplificar las implementaciones de IA generativa a nivel corporativo.
Esta nueva herramienta permite una inferencia más rápida, estable y económica a gran escala en entornos de nube híbrida.
Disponible como solución independiente o integrado en Red Hat OpenShift AI y RHEL AI, este servidor de inferencia está optimizado para implementar aplicaciones inteligentes con mayor eficiencia, flexibilidad y rendimiento.
«Una inferencia más rápida y eficiente se perfila como el nuevo punto de decisión para la innovación en IA generativa», explicó el vicepresidente y gerente general de la Unidad de Negocio IA de Red Hat, Joe Fernandes.
- Lee también: Trader gana 50 millones de dólares con PEPE
Red Hat promueve el desarrollo de modelos IA
Red Hat presentó en el evento homónimo, realizado en Boston del 19 al 22 de mayo, las nuevas mejoras que promueven los desarrollos de IA en todos sus modelos.
Como complemento a la nueva solución Red Hat AI Inference Server, la firma extendió su catálogo de modelos validados en Hugging Face reduciendo su tamaño y aumentando su velocidad de inferencia. Esto último reduce el consumo de recursos y los costos operativos.
Por otro lado incorporó Llama Stack, desarrollado por Meta, y el Modelo de Protocolo de Contexto (MCP) de Anthropic. Estas tecnologías permiten el uso de API estandarizadas, que simplifican el desarrollo e implementacion de aplicaciones y agentes de IA.
A través de la unificación de la interfaz, dichos recursos tecnológicos permiten acceder a funciones como inferencia con vLLM, generación aumentada por recuperación (RAG), evaluación de modelos y mecanismos de seguridad integrados.
También se presentaron mejoras clave en la versión 2.20 de Red Hat OpenShift AI para crear, entrenar, desplegar y monitorear modelos de IA a gran escala.
Por último, Red Hat Enterprise Linux AI 1.5 incorpora soporte multilingüe mejorado, que incluye español, alemán, francés e italiano, mediante InstructLab, y extiende su disponibilidad a Google Cloud Marketplace, sumándose a AWS y Azure.