Google presenta TPU optimizada para inferencia, protocolo de agente de IA abierta y conjunto de medios generativos de pila completa para empresas

El audaz trío de IA de Google: Ironwood, Agent2Agent y Vertex Generative Media establecen un nuevo paradigma para la IA empresarial

En la conferencia Cloud Next 25 de hoy, Google Cloud ha presentado tres anuncios innovadores sobre IA que marcan un cambio radical en la infraestructura, la interoperabilidad y las capacidades creativas de la inteligencia artificial empresarial. Cada lanzamiento — el Ironwood TPU, el protocolo Agent2Agent y el paquete Vertex AI Generative Media — es un logro por sí solo. Pero en conjunto, forman una tesis convincente: el futuro de la IA se basa en la inferencia primero, impulsado por agentes y multimodal de forma nativa.

Desde redefinir la supercomputación con los asombrosos 42,5 exaflops de cómputo optimizado para la inferencia de Ironwood, hasta estandarizar la comunicación entre agentes de IA con Agent2Agent, pasando por comprimir semanas de producción creativa en horas con la canalización generativa de Vertex, Google Cloud no solo está iterando. Está orquestando una superestructura de IA empresarial con ambiciones que van mucho más allá de la norma actual, fragmentada y con uso intensivo de recursos.

"La era de la inferencia": Ironwood TPU redefine la infraestructura de la IA

Bajo el zumbido industrial de la refrigeración líquida y el brillo de los centros de datos a hiperescala, está naciendo un nuevo tipo de inteligencia, no en el aprendizaje, sino en la comprensión. Ironwood, la unidad de procesamiento tensorial de séptima generación de Google, marca un punto de inflexión decisivo en la evolución del hardware de la IA: es el primer chip de la empresa construido específicamente para la inferencia, el acto de implementar modelos ya entrenados para razonar, responder y reaccionar a escala.

"Esta es una nueva frontera de computación", comentó un arquitecto de sistemas familiarizado con la implementación de Ironwood. "Hemos tenido hardware centrado en el entrenamiento durante una década. Pero la inferencia es donde se entrega valor en tiempo real: a los usuarios, en los flujos de trabajo, en los resultados empresariales".

Con hasta 9.216 chips refrigerados por líquido que ofrecen unos increíbles 42,5 exaflops, Ironwood supera incluso al superordenador actual más potente del mundo, El Capitán, en un factor de 24. Sus actualizaciones de SparseCore, 192 GB de HBM por chip y red de interconexión de chips de 1,2 Tbps crean una malla de baja latencia y gran ancho de banda optimizada para las demandas distribuidas de los grandes modelos lingüísticos y las simulaciones científicas por igual.

Pero quizás lo más notable es que Ironwood ofrece el doble de rendimiento por vatio que su predecesor y es casi 30 veces más eficiente que el TPU v1 de 2018, un salto arquitectónico que señala una nueva viabilidad económica y medioambiental para la implementación de la IA a gran escala.

"Estás viendo un sistema que puede mantener el razonamiento sobre billones de tokens, a través de modalidades, en tiempo real, y hacerlo a la mitad del costo energético", señaló un analista de la nube. "Eso no es solo rendimiento. Es una ventaja estratégica".

Agent2Agent: Solucionando el problema de integración más acuciante de la IA

Mientras que Ironwood muestra su potencia de cálculo bruta, el protocolo Agent2Agent de Google aborda otro problema: la comunicación entre agentes. Lanzado hoy con el apoyo de más de 50 socios empresariales, entre ellos Salesforce, SAP, PayPal y Deloitte, A2A introduce un protocolo abierto que permite a los agentes de IA coordinar tareas e intercambiar contexto a través de sistemas, marcos de trabajo y proveedores aislados.

En esencia, A2A busca responder a un dilema de larga data en la industria: si cada herramienta de IA opera en su propio jardín amurallado, ¿cómo pueden trabajar juntas para resolver problemas empresariales de extremo a extremo?

Construido sobre HTTP, JSON-RPC y SSE, el diseño de código abierto de A2A sigue cinco principios rectores: arquitectura segura por defecto, soporte de tareas largas con bucles de retroalimentación, mensajería agnóstica de la modalidad (texto, vídeo, audio) y plena autonomía del agente sin dependencia de herramientas. Características clave como las Tarjetas de Agente para el descubrimiento de capacidades y los ciclos de vida de las tareas proporcionan estructura para colaboraciones complejas.

¿Un caso de uso convincente? La contratación. Un gerente podría encargar a un asistente de IA que buscara candidatos. Ese agente involucra a agentes de búsqueda especializados, programa entrevistas, gestiona los bucles de retroalimentación y realiza comprobaciones de cumplimiento, todo ello a través de la mensajería entre agentes habilitada por A2A.

Los analistas sugieren que el impacto a largo plazo puede ser más profundo que las meras ganancias de productividad.

Vertex AI Generative Media: Una plataforma, todas las modalidades, de grado empresarial

Mientras que Ironwood alimenta el back-end y Agent2Agent orquesta los flujos de trabajo, el paquete Generative Media ampliado de Vertex AI permite a las empresas crear, marcar y ofrecer experiencias, todo ello a partir de indicaciones de texto.

La principal novedad es Lyria, un modelo de texto a música que produce audio de alta fidelidad y con matices emocionales en todos los géneros. Las empresas ya lo están aprovechando para sustituir las bibliotecas de material de archivo por bandas sonoras personalizadas y libres de derechos que se ajustan a los estados de ánimo y las narrativas de las campañas.

Mientras tanto, Veo 2 introduce la generación de vídeo cinematográfico con herramientas de edición como inpainting (relleno), outpainting (extrapolación) y control de la trayectoria de la cámara, ofreciendo a las agencias nuevos niveles de dirección creativa. Chirp 3 aporta la clonación de voz personalizada a partir de solo 10 segundos de entrada y capacidades de diarización, desbloqueando nuevos usos en accesibilidad, branding y análisis de audio. Imagen 3 mejora el detalle, la iluminación y la eliminación de objetos para la generación de imágenes, reforzando el compromiso de Google con el contenido visual de calidad profesional.

Fundamentalmente, cada resultado se rige por características de seguridad de nivel empresarial:

Marcado de agua SynthID para la trazabilidad
Filtros de seguridad para bloquear indicaciones dañinas
Gobernanza de datos para proteger los datos de entrenamiento de los clientes
Indemnización de la propiedad intelectual para proteger a las empresas de las reclamaciones de derechos de autor

La síntesis estratégica: una visión más allá de la suma de sus partes

Lo que hace que este trío sea algo más que tres lanzamientos impresionantes es la coherencia filosófica entre ellos. Cada oferta está diseñada no solo para superar a sus rivales de forma aislada, sino para funcionar como un sistema interconectado:

Ironwood proporciona la columna vertebral escalable y optimizada para la inferencia para el servicio de modelos en tiempo real.
Agent2Agent permite a los agentes autónomos impulsados por esos modelos operar con fluidez a través de los sistemas.
Vertex Generative Media ofrece la carga útil creativa, convirtiendo la inteligencia en resultados, al instante y a escala.

Esta pila es más que una actualización técnica. Es un manifiesto: la IA debe ser proactiva, componible y segura para la empresa. Debe actuar en su nombre en todas las plataformas. Debe crear sin fricciones. Y debe hacerlo sin comprometer la energía, la ética o la integración.

En un mercado repleto de ecosistemas cerrados y soluciones limitadas, el enfoque modular, abierto y escalable de Google Cloud bien podría emerger como la capa de infraestructura preferida para la próxima ola de empresas nativas de la IA.

"Lo que han construido no es un producto", observó un investigador independiente de la IA. "Es un sistema operativo para la economía de la IA empresarial".

Palabra final: un gran avance para la infraestructura, pero la verdadera revolución no está ocurriendo en la empresa

Aunque los anuncios de Google son tecnológicamente impresionantes (al menos desde los comunicados de prensa autoproclamados), desde la arquitectura optimizada para la inferencia de Ironwood hasta la elegante apertura de Agent2Agent y la potencia generativa de extremo a extremo de Vertex, seguimos siendo escépticos de que estos avances impulsen una transformación a corto plazo en los entornos empresariales tradicionales.

De hecho, creemos que la verdadera innovación se está desarrollando en otros lugares: con consumidores, creadores y startups nativas de LLM que construyen productos fuera de los muros de las organizaciones establecidas. Como observó Andrej Karpathy, esta puede ser la primera tecnología transformadora que invierte la curva de adopción habitual de arriba abajo, entregando un valor exponencial a los individuos mucho antes de que las corporaciones o los gobiernos absorban completamente su potencial.

Las pilas de IA actuales, por muy sofisticadas que sean, siguen enfrentándose a la misma fricción empresarial: sistemas heredados, gastos generales de cumplimiento, normas de protección de la marca y aversión al riesgo. Para las grandes organizaciones, incluso las mejores herramientas a menudo solo las hacen incrementalmente mejores en lo que ya hacen, lo que, creemos firmemente, no es el futuro que está por venir.