Apple explica la nueva arquitectura de Siri: Google está dentro, pero no como muchos imaginaban

Apple explica la nueva arquitectura de Siri: Google está dentro, pero no como muchos imaginaban

Después del Apple Event de la WWDC26 , tuve la oportunidad de asistir a una charla técnica sobre las novedades en IA que se vieron en la keynote, con unos ponentes espectaculares: Craig Federighi, Mike Rockwell, Amar Subramanya y Sebastien Marineau-Mes. Apple ha querido poner orden en una de las grandes preguntas que sobrevolaban su nueva generación de inteligencia artificial: qué papel juega realmente Google dentro de Apple Intelligence . Y la respuesta, según explicaron en esta charla posterior a la keynote, es mucho más matizada de lo que podría parecer desde fuera. La colaboración existe , pero no convierte a Siri en una aplicación de Gemini ni hace que los datos del usuario pasen a manos de Google .

Apple fue bastante clara al separar tres capas: la experiencia de sistema, los modelos que ejecutan las tareas y la infraestructura privada que decide cómo y dónde se procesan las peticiones. La imagen que nos presentó Craig Federighi resume precisamente esa arquitectura: a la izquierda, todo lo que ocurre en el dispositivo; a la derecha, lo que puede escalar a la nube. En medio, un orquestador de sistema que decide qué información se necesita, qué modelo debe intervenir y cómo proteger la privacidad durante todo el proceso. Siri es una capa del sistema Apple insiste en que la nueva Siri no debe entenderse sólo como un chatbot independiente al que el usuario acude para mantener una conversación aislada.

La compañía la define más bien como una herramienta conversacional integrada en el flujo natural del sistema operativo, capaz de aparecer sobre una app, entender lo que hay en pantalla y actuar dentro del contexto en el que está el usuario. Eso explica por qué Siri puede invocarse desde diferentes lugares: mediante la voz, el botón lateral, la isla dinámica, menús contextuales, barras de herramientas o desde su propia aplicación. La app de Siri existe, pero no como el centro de la experiencia, sino como una forma de recuperar conversaciones anteriores, retomarlas o iniciar una nueva. En Applesfera Buenísimas noticias con iOS 27: estos son todos los iPhone compatibles confirmados La diferencia es importante porque Apple intenta marcar distancia con la idea clásica de “abrir un chat y preguntar”.

Su apuesta es que la inteligencia esté embebida en iOS 27 , iPadOS 27 , macOS 27 , watchOS 27 , visionOS 27, CarPlay y AirPods, funcionando como una extensión del sistema y no como un producto separado. El orquestador, la pieza clave de Apple Intelligence En el centro de todo está el llamado “system orchestrator”, una capa de software que decide cómo resolver cada petición . Este orquestador puede consultar el contenido indexado por Spotlight, acceder a acciones disponibles dentro de las apps, interpretar lo que hay en pantalla o recurrir a modelos locales y en la nube según la complejidad de la tarea. La parte más relevante es que esta decisión se toma intentando minimizar los datos que salen del dispositivo .

Si el usuario pregunta, por ejemplo, qué va a llevar cada persona a una barbacoa, la búsqueda entre mensajes se realiza localmente. Solo los fragmentos estrictamente necesarios para razonar la respuesta se envían al modelo que debe procesarla. Rockwell lo ejemplificó con una petición encadenada: primero Siri busca información personal en el dispositivo y después, si el usuario pregunta qué bebidas combinan con esos platos, se consulta conocimiento general sin enviar quién escribió los mensajes ni cuándo lo hizo. Para Apple, esa separación entre contexto personal y conocimiento del mundo es una de las claves de su enfoque.

Private Cloud Compute, ahora también sobre infraestructura de terceros Cuando una petición supera lo que puede resolverse en local, Apple recurre a Private Cloud Compute. La promesa es conocida: extender a la nube las garantías de privacidad del iPhone. Según la compañía, las peticiones no se almacenan, no son accesibles para Apple y se procesan únicamente para responder a esa solicitud concreta. La novedad está en que Apple ha extendido ese modelo para poder ejecutar modelos más potentes , como FM Cloud Pro, utilizando infraestructura de Google Cloud y tecnología de NVIDIA.

Pero Apple subraya que esto no significa que Google tenga acceso a los datos ni que pueda desplegar software libremente en esos nodos. Apple usa infraestructura de Google Cloud y tecnología de NVIDIA para ejecutar modelos más potentes en Private Cloud Compute. Asegura que Google no accede a los datos ni controla el software de esos servidores. La compañía afirma que solo Apple puede desplegar software en esos servidores , aunque estén alojados en infraestructura de terceros.

Además, los dispositivos Apple solo se comunican con nodos autenticados de Private Cloud Compute. En otras palabras: Google aporta capacidad de infraestructura y parte de la colaboración técnica, pero no recibe las peticiones de Siri como si fueran consultas a Gemini. Los nuevos modelos de Apple: del iPhone a la nube Apple presentó una familia de modelos de tercera generación para Apple Intelligence. En el dispositivo están AFM Core y AFM Core Advanced.

El primero es la evolución del modelo local actual, el segundo representa un salto más ambicioso, diseñado para ejecutar capacidades multimodales directamente en el iPhone, el iPad o el Mac. AFM Core Advanced puede procesar texto, imagen y audio, además de generar texto y voz. Apple explicó que este modelo usa una arquitectura dispersa o “sparse”, que permite disponer de un modelo grande sin activar todos sus parámetros en cada petición. En vez de cargar continuamente distintas partes del modelo por cada token, el sistema analiza la petición completa, elige la parte adecuada y la mantiene durante toda la tarea.

En Applesfera Cómo instalar las nuevas betas de Apple: macOS Golden Gate 27, iPadOS 27, watchOS 27 y tvOS 27 paso a paso La compañía puso un ejemplo muy gráfico: Core Advanced tiene unos 20.000 millones de parámetros, pero en función de la petición utiliza entre 1.000 y 4.000 millones. Eso permite conseguir capacidades propias de un modelo grande con un coste computacional mucho más parecido al de modelos pequeños y especializados. La nueva voz de Siri nace de esa arquitectura Uno de los efectos más visibles de ese salto en modelos locales es la nueva voz de Siri, que al menos en inglés, es absolutamente impresionante y realista. Apple explicó que no habría podido construir estas voces sin Core Advanced , porque la arquitectura permite dedicar solo la parte necesaria del modelo a voz y habla, sin tener que ejecutar todo el sistema completo.

La compañía asegura que esto le permite ofrecer voces de alta calidad directamente en el dispositivo. No se trata solo de que Siri suene más natural, sino de que la síntesis de voz forme parte del mismo sistema multimodal capaz de entender texto, audio, imagen y contexto de pantalla. Siri estrena una voz más realista gracias a Core Advanced y podrá mejorar más rápido con Apple Silicon y la nube. Para Apple, esta arquitectura también es una base de futuro.

La idea no es lanzar una versión cerrada de Siri, sino construir una plataforma que pueda mejorar con el tiempo , aprovechando tanto Apple Silicon como los modelos en la nube cuando sea necesario. Y esta velocidad de mejora incremental es algo que venimos años pidiéndole a Siri: ahora por fin será posible. Google colabora, pero Apple mantiene el control La parte más delicada de la charla fue, inevitablemente, la colaboración con Google. Federighi explicó que varios modelos de la familia, incluidos Core Advanced, FM Cloud y el modelo de imagen en la nube, han sido creados como builds personalizados para Apple Silicon , entrenados y refinados usando salidas de Gemini.

En el caso de FM Cloud Pro, el modelo más capaz para tareas exigentes como razonamiento complejo o generación de texto avanzada, Apple trabajó con Google y NVIDIA para llevarlo a producción dentro de una infraestructura compatible con Private Cloud Compute . Esa es la pieza que permite escalar cuando el dispositivo no basta. Apple colaboró con Google y NVIDIA para escalar sus modelos en la nube, pero insiste en que no usa Gemini comercial ni envía datos personales a Google. Pero el mensaje de Apple fue muy insistente: esto no convierte a Apple Intelligence en una capa sobre los servicios comerciales de Google .

No se usa la app de Gemini, no se usan los modelos que Google vende a sus clientes, no se usa Google Search como base de conocimiento y no se envían datos personales a Google para que los procese como parte de sus propios servicios. Apple World Knowledge: conocimiento externo sin Google Search Para las preguntas que requieren información del mundo - actualidad, datos generales o conocimiento externo - Apple habló de su propio servicio Apple World Knowledge . Este sistema sería el encargado de aportar información cuando Siri necesita salir del contexto personal del dispositivo. La distinción es relevante porque Apple intenta evitar la lectura más simple: que si hay una colaboración con Google, entonces Siri consulta Google para responder .

Según la arquitectura presentada, no es así . Apple separa los modelos, la infraestructura, el conocimiento del mundo y el contexto personal del usuario. Esa separación también permite modular las respuestas. Una petición puede resolverse por completo en el dispositivo, puede requerir una búsqueda local en datos personales, puede necesitar razonamiento en Private Cloud Compute o puede apoyarse en Apple World Knowledge.

El usuario no tiene que decidirlo : lo hace el sistema. Personalización sin convertir al usuario en un perfil publicitario Apple dedicó parte de la charla a explicar cómo piensa equilibrar personalización y privacidad . Su tesis es que una IA personal necesita saber cosas del usuario, pero que ese conocimiento debe permanecer bajo su control y, siempre que sea posible, en el dispositivo. La compañía puso como ejemplo que Siri podría aprender preferencias del usuario para responder mejor a preguntas como dónde cenar o qué plan recomendar.

Pero insistió en que esa personalización no se basa en construir un perfil publicitario ni en enviar todo el historial personal a servidores externos. La frase clave es que el dato vive en el dispositivo. Cuando hace falta usarlo, Siri extrae solo las piezas necesarias para esa petición concreta. El resto permanece local .

Y si algo se procesa en Private Cloud Compute, Apple asegura que se elimina tras responder y que ni siquiera la propia compañía puede inspeccionarlo. La consciencia de pantalla cambia la relación con Siri Otra de las grandes novedades es la capacidad de Siri para entender lo que el usuario está viendo. Si hay una imagen en pantalla, una página web, una nota, un documento o una interfaz de una app, Siri puede usar ese contexto para interpretar mejor la pregunta. Apple lo ejemplificó con una imagen de nubes: el usuario podía preguntar “¿por qué son así?” sin describir lo que estaba viendo.

Siri analizaba la imagen, entendía el fenómeno y respondía en contexto . Después, podía crear una nota con un plan de viaje relacionado con esa misma información. Este tipo de interacción cambia la carga del usuario. Ya no hace falta explicar todos los detalles de partida ni copiar y pegar información de una app a otra.

Siri puede leer el contexto, entenderlo y actuar sobre él, siempre bajo el mismo marco de privacidad que Apple quiere convertir en seña de identidad. Los desarrolladores también entran en la arquitectura Apple no quiere que estas capacidades se queden solo en sus propias aplicaciones. La compañía recordó que los desarrolladores pueden aprovechar Spotlight semántico para indexar contenido dentro de sus apps, de forma que Siri y el sistema puedan encontrarlo cuando el usuario lo necesite. También pueden exponer acciones de sus apps para que Siri las use dentro de flujos más amplios.

El ejemplo de Notas podría aplicarse a otras apps de notas, mensajería o productividad. La idea es que Siri no sea solo una interfaz para apps de Apple, sino una capa capaz de trabajar con el ecosistema . En Applesfera Apple deja a Europa sin su nueva Siri en los iPhone: el pulso con la DMA entra en su fase más dura Además, Apple mencionó el Foundation Models Framework , que permite usar modelos locales desde Swift, y Core ML, que sigue siendo la vía para llevar modelos propios u open source al dispositivo aprovechando CPU, GPU y Neural Engine. La inteligencia artificial, en la visión de Apple, debe estar disponible en varias capas: sistema, apps, modelos locales y modelos en servidor.

Siri se acerca a los agentes, pero Apple no quiere correr La charla también abordó una de las palabras de moda: agentes. Apple reconoció que Siri ya tiene una arquitectura con elementos agentivos , en el sentido de que puede recibir información, razonar, tomar decisiones y ejecutar acciones. Pero evitó prometer una visión agresiva de agentes autónomos capaces de operar sin supervisión amplia. Apple prepara una Siri más agentiva, pero prioriza control, seguridad y comprensión antes que autonomía total.

Craig Federighi fue prudente al describir el estado de la industria . Admitió que hay experimentos interesantes, especialmente en programación, pero señaló que trasladar esos flujos a consumidores y tareas de largo recorrido todavía requiere resolver problemas de control, seguridad, utilidad y comprensión por parte del usuario. La postura de Apple parece clara: Siri se construye sobre una arquitectura preparada para comportamientos más agentivos en el futuro, pero la compañía quiere que cada paso sea comprensible, seguro y controlable. No se trata solo de que la IA pueda hacer más cosas, sino de que el usuario entienda qué está haciendo y por qué.

La nueva Siri es menos un producto y más una infraestructura Lo que Apple presentó en esta charla no fue solo una explicación técnica de Siri, sino una declaración de estrategia . La compañía quiere competir en IA sin renunciar a su narrativa histórica: integración vertical, control de la experiencia, privacidad como arquitectura y uso de Apple Silicon como ventaja diferencial. La colaboración con Google es importante, pero Apple intenta colocarla en un segundo plano operativo . Google ayuda a construir y escalar ciertos modelos, pero la experiencia, la orquestación, la privacidad, el conocimiento del mundo y la relación con el usuario siguen bajo el paraguas de Apple.

La nueva Siri, por tanto, no es simplemente una voz más inteligente ni una app de chat integrada en iOS. Es la manifestación visible de una arquitectura mucho más amplia: modelos locales, nube privada, conocimiento externo, contexto personal, comprensión de pantalla y acciones dentro de apps. Si Apple consigue que todo eso funcione con naturalidad, Siri dejará de ser una promesa pendiente para convertirse, por fin, en la capa inteligente del ecosistema. Y eso dará lugar a posibilidades nunca vistas gracias a la interacción software y hardware de la compañía.

En Applesfera | Resumen de la WWDC 2026: Siri AI, iOS 27 y todas las novedades que Apple ha presentado En Applesfera | Apple anuncia Siri AI: estas son todas las novedades que por fin podremos disfrutar en iPhone, iPad, Mac y Apple Watch