Red Hat lanza AI 3.4
Red Hat anunció durante el Red Hat Summit avances significativos en su portafolio de inteligencia artificial con el lanzamiento de Red Hat AI 3.4, una plataforma que busca cerrar la brecha entre la experimentación con IA y el despliegue operativo en entornos de producción. La propuesta se basa en un enfoque ‘del hardware al agente’ (metal-to-agent) que permite a las organizaciones gestionar modelos y agentes autónomos en toda su infraestructura de nube híbrida. El anuncio también incluyó avances de la colaboración de Red Hat con CoreWeave, que extiende esta plataforma a entornos de nube gestionada de alto rendimiento.
Uno de los ejes centrales de la nueva versión es la entrega de Model-as-a-Service (MaaS), que ofrece una interfaz única y gobernada para que los desarrolladores accedan a modelos curados, mientras los administradores pueden rastrear el consumo y aplicar políticas de uso. Esta capa se construye sobre un motor de inferencia distribuida de alto rendimiento impulsado por vLLM y llm-d.
AgentOps y gobernanza para agentes autónomos
Red Hat AI 3.4 introduce herramientas de AgentOps que acompañan a los agentes a lo largo de todo su ciclo de vida, desde el desarrollo hasta la producción. Esto incluye rastreo integrado, observabilidad, gestión de identidad criptográfica (SPIFFE/SPIRE) y capacidades para auditar los pasos de razonamiento y las llamadas a herramientas de cada agente. El objetivo es que las organizaciones puedan verificar qué entidad realizó cada acción y con qué nivel de privilegio.
“La era agéntica representa una evolución de nuestra plataforma: de ejecutar aplicaciones tradicionales a potenciar sistemas inteligentes y autónomos. Estamos definiendo el estándar abierto sobre cómo la empresa ejecuta la IA. Al proporcionar una base de metal-to-agent para la inferencia de IA, MaaS y AgentOps, Red Hat ofrece la garantía operativa que las organizaciones necesitan para innovar a escala manteniendo un control riguroso.” destacó Joe Fernandes, vicepresidente y gerente general de la Unidad de Negocio de IA, Red Hat.
La plataforma también incorporó un centro de evaluación (evaluation hub) independiente del framework utilizado, que reemplaza los métodos de prueba fragmentados por un enfoque unificado para medir calidad, precisión y riesgo. Asimismo, incluye pruebas de seguridad automatizadas y red-teaming —basadas en tecnología de Chatterbox Labs y el proyecto Garak— para detectar vulnerabilidades como jailbreaks e inyecciones de prompts, combinadas con NVIDIA NeMo Guardrails para la protección en tiempo de ejecución.
“Los agentes autónomos de larga ejecución en la empresa exigen un nuevo nivel de control de infraestructura y seguridad para garantizar operaciones confiables a escala. Red Hat AI Factory with NVIDIA proporciona una base unificada impulsada por el código abierto que otorga a los desarrolladores y operadores la gobernanza y la confianza necesarias para el futuro agéntico.” señaló John Fanelli, vicepresidente de Software Empresarial, NVIDIA.
Por su parte, Urvashi Chowdhary, vicepresidenta de Gestión de Productos de Servicios de IA en CoreWeave, destacó: “La colaboración de CoreWeave con Red Hat se basa en un compromiso compartido con la apertura y en ofrecer una base de inferencia de alto rendimiento que permita a las empresas escalar sus cargas de trabajo de IA más complejas. Juntos, hemos entregado un modelo de implementación para Red Hat AI Inference en el Servicio Kubernetes de CoreWeave para ejecutar el mismo stack tanto de forma local como en la nube, con un rendimiento de grado de producción”
Otros aspectos destacados son:
Soporte de hardware ampliado. Red Hat AI 3.4 ofrece soporte desde el primer día para GPU NVIDIA Blackwell y AMD MI325X, y extiende su arquitectura para correr de forma nativa en nubes gestionadas de terceros, incluyendo CoreWeave, Azure e IBM Cloud.
Decodificación especulativa. Esta función, disponible de forma general, mejora la velocidad de respuesta entre 2 y 3 veces con impacto mínimo en la calidad, reduciendo el costo por interacción.
Gestión de prompts y MLflow. Los prompts se tratan como activos de datos de primera clase, almacenados en un registro central. MLflow proporciona seguimiento de experimentos y gestión de artefactos tanto para IA generativa como predictiva.
Automatización de tareas complejas. Herramientas como AutoRAG y AutoML automatizan desde la selección de estrategias de recuperación hasta la construcción y optimización de modelos predictivos.
Disponibilidad. Se espera que Red Hat AI 3.4 esté disponible a finales de mayo de 2026.