La carrera de la inteligencia artificial entre Estados Unidos y China acaba de sumar un capítulo especialmente delicado. Durante los últimos meses, buena parte de la conversación se centró en quién tenía los modelos más potentes para programar, razonar o resolver tareas complejas. Pero ahora la disputa entró en un terreno mucho más sensible: la ciberseguridad. El protagonista es GLM-5.2, el nuevo modelo de Zhipu AI, también conocida como Z.ai.
Según un análisis de Semgrep, este modelo de pesos abiertos logró superar a Claude Code en una prueba de detección de vulnerabilidades IDOR y quedó por encima de Claude Opus 4.8 cuando ambos fueron evaluados con una configuración mínima de prompt y entorno. La propia empresa tituló su informe con una frase muy gráfica: “tenemos un Mythos en casa”. Introducing GLM-5.2: Frontier Intelligence, Open Weights Significant improvements in coding and agentic tasks Strong long-horizon capabilities with a 1M context window Two levels of reasoning effort: GLM-5.2 (max) pushes the limits, while GLM-5.2 (high) strikes a strong… pic.twitter.com/SjGPSVhePJ Z.ai (@Zai_org) June 16, 2026 El salto chino no está solo en programar mejor Hasta ahora, muchos modelos abiertos habían demostrado ser útiles para tareas de código, automatización o razonamiento general, pero seguían claramente por detrás de los sistemas cerrados más avanzados cuando se trataba de trabajos complejos de seguridad. GLM-5.2 empieza a cambiar esa percepción porque no solo compite en programación , sino también en análisis de repositorios, búsqueda de fallos y tareas agénticas largas.
Semgrep explica que GLM-5.2 es un modelo Mixture-of-Experts con unos 750.000 millones de parámetros totales, aunque solo activa alrededor de 40.000 millones por token. Esa arquitectura le permite tener un tamaño enorme sin que cada consulta tenga el mismo coste que mover el modelo completo. Además, el informe destaca su contexto extendido de hasta un millón de tokens, una característica especialmente importante cuando una IA necesita seguir relaciones entre archivos, permisos y rutas de autorización dentro de un proyecto. Graphistry llegó a una conclusión parecida desde otro ángulo.
En sus pruebas de investigación cibernética, GLM-5.2 obtuvo una tasa de resolución de 28 sobre 59, igualando a configuraciones con Claude Opus 4.7 y 4.8 en determinados benchmarks. Aun así, la empresa remarca un matiz clave: el modelo no lo explica todo, porque el “harness”, es decir, el entorno que guía al modelo durante la tarea, puede cambiar mucho el resultado final GLM 5.2 is ranking the highest on cost per session and everyone is raving about this model which means if cost/session is high it might actually be a sign that the model is useful pic.twitter.com/cDbfdECMc4 OpenCode (@opencode) June 30, 2026 El verdadero problema es que sus pesos están abiertos La diferencia central con modelos como los de Anthropic u OpenAI es que GLM-5.2 puede descargarse, ejecutarse localmente y modificarse. Semgrep aclara que “pesos abiertos” no significa exactamente “código abierto”, porque los pesos están disponibles, pero no necesariamente todo el entrenamiento o los datos utilizados. Aun así, para equipos de seguridad esto es muy atractivo porque permite trabajar dentro de entornos privados sin enviar código sensible a terceros.
El lado oscuro es evidente. Axios señala que, al poder ejecutarse fuera de plataformas comerciales, este tipo de modelos reduce la capacidad de supervisión sobre usos maliciosos. A diferencia de un servicio cerrado, donde un proveedor puede detectar abuso y bloquear cuentas, un modelo local puede funcionar sin esa capa de control. Por eso el debate no es solamente técnico.
The Wall Street Journal informó que investigadores de seguridad ya consideran que los sistemas chinos han igualado a algunos modelos estadounidenses en ciertos escenarios de búsqueda de bugs, aunque todavía estarían por detrás en otras tareas. Esa combinación —más capacidad, menor coste y mayor disponibilidad— es la que está encendiendo las alarmas. Lo más llamativo es que esto ocurre mientras EEUU intenta limitar el acceso a sus modelos más avanzados por motivos de seguridad. Si los sistemas cerrados se vuelven más difíciles de usar, pero los modelos chinos abiertos avanzan rápido, el equilibrio de poder puede cambiar.
La paradoja es evidente: Washington busca contener los riesgos, pero esa misma cautela podría darle más espacio a China para ocupar el terreno abierto de la IA. GLM-5.2 no demuestra que China ya haya ganado la carrera. Pero sí deja una señal difícil de ignorar: la distancia con los modelos frontera de EEUU se está estrechando justo en una de las áreas donde esa ventaja importaba más. Fuente: Xataka.