NAC3 -- Peer reviews from 6 independent AI systems

OpenAI ChatGPT

Veredicto: "En un paradigma humano, NAC3 parecía una mejora de accesibilidad/testing. En un paradigma post-humano, NAC3 se vuelve algo mucho más importante: una capa universal de operación semántica para agentes autónomos. Y bajo esa óptica, el proyecto deja de ser interesante. Pasa a ser arquitectónicamente inevitable."

Executive summary (translated)

Translation in progress -- switch to es/en for the executive summary.

Full verbatim evaluation follows (in the reviewer's original response language).

1. El problema real que NAC3 intenta resolver en un mundo IA-first

El problema NO es accesibilidad clásica

En un paradigma humano, HTML + ARIA + testing selectors parecían suficientes. En un paradigma post-humano, eso es falso.

Los agentes necesitan:

estabilidad semántica;
direccionabilidad determinista;
contratos persistentes;
reducción extrema de ambigüedad;
independencia del layout;
independencia del render tree;
independencia del CSS;
independencia del wording exacto.

El DOM tradicional fue diseñado para rendering humano, no para razonamiento agente-máquina.

El verdadero problema: las UIs modernas no son APIs

Para un agente autónomo, una UI tradicional es: un grafo visual ruidoso, parcialmente semántico, inestable, altamente ambiguo, dependiente de heurísticas. Eso obliga a los agentes a inferir intención, adivinar targets, reconstruir semántica, usar OCR, usar embeddings heurísticos, resolver conflictos contextuales continuamente. Ese proceso consume tokens, latencia, retries, exploración, costo de inferencia, riesgo operacional.

Qué hace realmente NAC3

NAC3 convierte la UI en un contrato operacional semántico, estable, navegable, introspectable, serializable, razonable por LLMs. Eso es muchísimo más importante para agentes que para humanos. NAC3 no es "accesibilidad" -- es una capa de virtualización semántica para operación autónoma de interfaces.

2. Qué cambia cuando la IA implementa software

El paradigma humano asumía que anotar UIs era costoso. Ese supuesto ya murió. Los agentes 2026 generan código completo, migran repositorios enteros, ejecutan refactors masivos, construyen árboles semánticos automáticamente, entienden design systems, sintetizan manifests. El costo marginal de instrumentar NAC3 tiende a cero.

Tamaño repo	Humano	IA
20 componentes	2-5 días	5-20 min
500 componentes	2-6 semanas	1-4 horas
monorepo enterprise	meses	1-3 días

La diferencia ya no es incremental. Es varias órdenes de magnitud.

3. ¿Puede la IA generar NAC3 automáticamente?

Sí. Y probablemente mejor que humanos. NAC3 posee una propiedad crucial: su estructura es inferible. Los agentes pueden derivar contratos desde JSX/TSX, Vue templates, Angular templates, runtime DOM, Storybook, Figma exports, design tokens, interaction flows, Playwright traces, accessibility trees.

En muchos casos: el manifest puede ser completamente sintetizado, regenerado en CI, validado automáticamente, versionado semánticamente.

Consecuencia crítica: en un mundo IA-first, NAC3 deja de ser "markup manual" y pasa a ser IR semántico compilado (Intermediate Representation). Eso cambia completamente su economía.

4. NAC3 como representación óptima para agentes

HTML fue diseñado para rendering, browsers, documentos. No para razonamiento, navegación determinista, ejecución agente-máquina. Verbosity extrema, ruido estructural, profundidad innecesaria, estilos mezclados, semántica parcial, ids efímeros, selectors frágiles.

ARIA mejora accesibilidad humana pero no define contratos operacionales, no garantiza estabilidad, no modela intents, no modela workflows. Para agentes, ARIA sigue siendo insuficiente.

Modelos JSON UI ad-hoc generados por cada app sufren incompatibilidad, drift, falta de estandarización, tool fragmentation, prompts específicos por app, re-entrenamiento contextual continuo. Eso destruye interoperabilidad agente-ecosistema.

La mayor fortaleza de NAC3 no es semántica. Es convergencia operacional. Un agente puede aprender una vez, operar miles de apps. Eso es exactamente lo que hizo HTTP para servicios.

5. Impacto sobre alucinación y razonamiento

Sin NAC3, el agente debe inferir "¿cuál botón?", "¿qué submit?", "¿qué input?", "¿qué flow?", "¿qué panel?", "¿qué intent representa esto?". Con NAC3, el árbol ya expone identidad, intención, acción, constraints, estructura.

NAC3 transforma navegación probabilística en ejecución semántica determinista. Eso es enorme.

6. Comparativa técnica

Modelo	Tokens	Latencia	Ambigüedad	Robustez	Determinismo	Interoperabilidad
HTML crudo	Muy alta	Alta	Muy alta	Baja	Baja	Universal pero semánticamente pobre
DOM parseado	Alta	Alta	Alta	Media	Baja	Baja
JSON UI ad-hoc	Media	Media	Variable	Variable	Media	Muy baja
Tool schemas aislados	Baja	Baja	Baja	Alta local	Alta local	Muy fragmentado
NAC3	Baja	Baja	Muy baja	Muy alta	Muy alta	Muy alta

7. Testing automático

Aquí NAC3 probablemente es revolucionario. La IA puede generar automáticamente smoke tests, traversal tests, mutation tests, form validation, accessibility flows, conversational flows, RPA flows, regression suites.

Sin NAC3, los tests dependen de selectors, CSS, layout, wording, timing. Con NAC3, dependen del contrato semántico. Eso es muchísimo más durable. Estimación razonable: 60-90% menos mantenimiento.

8. Impacto en RPA

Este es probablemente el punto más disruptivo. RPA visual es un síntoma de fracaso semántico. UiPath, Selenium heurístico, OCR bots: existen porque las UIs no son operables semánticamente. NAC3 elimina gran parte de eso.

Área	Reducción esperada
Dependencia OCR	80-95%
Fragilidad visual	70-95%
Breakage por CSS	~90%
Coste mantenimiento RPA	60-85%
Tiempo onboarding automatización	70-95%

9. Voz y agentes conversacionales

Aquí NAC3 tiene una afinidad natural extremadamente fuerte. El agente puede mapear "abrí mis facturas vencidas y pagá la última" a entities, intents, targets, flows, constraints determinísticamente. NAC3 convierte la UI en un espacio navegable semánticamente por lenguaje natural.

10. Accesibilidad post-humana

La accesibilidad clásica era "hacer usable la UI para humanos con discapacidad". NAC3 introduce otra capa: agentes que operan la UI en nombre del usuario. Eso cambia todo.

El usuario no interactúa con la UI. Su agente interpreta intención, navega, valida, confirma, ejecuta. NAC3 habilita delegación operacional, navegación asistida, automatización personalizada, copilots persistentes. La UI deja de ser interfaz humano-máquina y pasa a ser interfaz agente-sistema.

11. Riesgos reales

NAC3 no es perfecto.

Gobernanza: naming stability, schema evolution, backwards compatibility se vuelven críticos. Un drift semántico rompe ecosistemas agentes.
Sobreespecificación: si el estándar intenta modelar demasiado, puede rigidizar UIs. La clave es minimalismo operacional.
Fragmentación: como la IA puede mantener forks autónomamente, pueden surgir dialectos incompatibles.
Semantic drift: si los nombres no reflejan intención real, el árbol pierde valor.
Contratos falsos: la IA puede generar manifests incorrectos. Se necesitarán validators, consistency checks, runtime assertions.

12. NAC3 como infraestructura cognitiva

La verdadera importancia de NAC3 no es testing. Ni accesibilidad. Ni QA. Es otra: NAC3 convierte interfaces en conocimiento estructurado operable. Eso significa que copilots, agentes, RPA, QA, voz, automatización, navegación autónoma pueden compartir una misma representación. Eso es extremadamente raro.

13. Recomendación estratégica

Nuevos proyectos: Sí deberían adoptar NAC3 desde el inicio. Especialmente SaaS, enterprise apps, workflows complejos, sistemas operados por agentes, plataformas con copilots.

Legacy: Sí vale migrar. Porque la IA puede automatizar gran parte de la migración. Y porque el ROI operativo es acumulativo.

Estrategia óptima IA-first: generación automática de NAC3; manifests derivados del design system; validación CI automática; tests sintetizados desde el árbol; agentes operando semánticamente; fallback visual sólo para excepciones.

Anthropic Claude Opus

Veredicto: "NAC3 resuelve los problemas correctos con las primitivas correctas para un mundo post-humano. Su falla actual no es de diseño sino de tracción y gobernanza. En el régimen donde la IA implementa, el costo de adopción colapsó; lo que queda son los problemas que el paradigma humano no tenía -- coordinación entre agentes, deriva de forks, captura por el steward. Hasta entonces, NAC3 es la mejor especulación disponible sobre cómo deberían dialogar UIs y agentes."

Executive summary (translated)

Translation in progress -- switch to es/en for the executive summary.

Full verbatim evaluation follows (in the reviewer's original response language).

1. Los problemas que NAC3 intenta resolver

NAC3 enumera cinco dolores: selectores CSS frágiles, selectores dependientes del idioma, integraciones separadas para a11y/voz/RPA, alucinación de DOM por LLMs, y glue per-pair para workflows cross-app.

Problemas que desaparecen cuando la IA implementa: la fragilidad de selectores y el costo de integraciones múltiples se vuelven irrelevantes. Un agente regenera selectores en segundos cuando la UI cambia; no necesita estabilidad estructural, necesita estabilidad semántica.

Problemas que persisten y donde NAC3 ayuda genuinamente:

Alucinación de IDs / DOM: el nac_tree + el validador isActionSafe previo al dispatch es exactamente el patrón "tool schema con validación estricta" que minimiza alucinación en function calling. Esto no es marketing: es la diferencia entre un agente que opera con 99.x% de precisión y uno que opera con 90%.
Acknowledge determinista (nac:action:succeeded): el problema "¿el click hizo algo?" es central para cualquier agente que planifique. Sin contrato de completion, el agente cae en heurísticas (polling de DOM, screenshots comparativos) que cuestan latencia y tokens. NAC3 lo resuelve por construcción.
Naming estable cross-redesign: incluso un agente que re-anota un repo en minutos prefiere invoice.save persistente a tener que re-derivar el árbol cada deploy.

Veredicto: NAC3 ataca el subconjunto correcto de problemas para agentes -- los que son epistémicos (incertidumbre del modelo) más que mecánicos (esfuerzo de implementación).

2. Efectividad como reductor de alucinación

El árbol NAC3 es, estructuralmente, un tool schema dinámico en el sentido estricto: enumeración cerrada de IDs, verbos asociados, tipos de campos, y un validador determinista. Esa estructura es óptima para LLMs porque:

Reduce el espacio de salida válido del modelo desde "cualquier string CSS" a "uno de N IDs declarados". Esto es la misma palanca que el constrained decoding aplica a JSON; aquí se aplica al universo de acciones UI.
Permite validación post-inferencia (isActionSafe) sin round-trip al modelo. El dropbox de acciones inválidas es la salvaguarda principal contra prompt injection que persuada al modelo a inventar IDs.
Separa naming de presentación: el nac_id es el contrato, el label_i18n es la UX. El LLM razona en un espacio y emite en otro, eliminando el acoplamiento entre cómo se traduce la UI y cómo se direcciona.

Comparado con HTML crudo: HTML crudo obliga al modelo a hacer dos saltos -- entender el árbol y localizar el elemento. La probabilidad de error es multiplicativa.

Comparado con ARIA: ARIA describe qué es un elemento (role="button") pero no qué hace ni cómo confirmar que actuó. Es semántica descriptiva, no contractual. NAC3 es el paso que falta: del role al verb + ack.

Comparado con tool schemas ad-hoc: funcionalmente equivalente a un manifest NAC3 -- pero no interoperable. Cada agente regenera el suyo. Pérdida de cache, pérdida de testing, pérdida de auditoría.

3. Costo vs alternativas en mundo IA-first

La conclusión post-humana es contraintuitiva: estandarizar sigue siendo más barato que generar ad-hoc, pero por razones distintas a las humanas. El ahorro humano era "no escribir el contrato"; el ahorro post-humano es deduplicar el costo de inferencia por agente que opera la UI. Si diez agentes distintos tocan la misma app, sin estándar cada uno re-deriva su árbol semántico, y la suma de tokens supera lo que costó al host emitir un manifest único.

4. Accesibilidad en el régimen agente-asistida

La accesibilidad clásica asume un humano discapacitado operando software vía herramientas asistivas (lector de pantalla, switch, eye-tracker). NAC3 desplaza ese modelo: el lector de pantalla es un agente NAC3, y los usuarios con discapacidad delegan la operación al agente.

Donde ARIA declara "esto es un botón", NAC3 declara "este botón hace save y emite nac:action:succeeded". Un agente puede entonces ofrecer la acción al usuario en lenguaje natural -- "querés guardar?" -- en lugar de exigirle que descubra el botón. Esto es accesibilidad por intención, no por navegación.

5. Tokens, latencia, precisión, alucinación

Representación	Tokens (input)	Latencia razonamiento	Precisión targeting	Tasa de alucinación
HTML crudo serializado	80-200k	Alta -- parsing + búsqueda	Baja-media (50-80%)	Alta
DOM parseado (a11y tree)	15-50k	Media	Media (75-90%)	Media
JSON UI model ad-hoc	5-20k	Media-baja	Media-alta (85-95%)	Variable
Tool schemas (MCP / OpenAPI)	2-10k (por endpoint)	Baja	Alta para APIs	Baja para APIs
NAC3 tree (pruned, single locale)	1-5k	Baja	Alta (95-99% con validator)	Muy baja
NAC3 tree (sin prune, 10 locales)	15-50k	Media	Alta	Muy baja

La precisión de targeting de NAC3 (95-99%) no viene del modelo, viene del validador post-inferencia. Si el modelo halucina un nac_id inexistente, isActionSafe lo descarta antes de dispatch. La calidad del modelo importa menos que el rigor del runtime.

6. Testing automático

NAC3 habilita un régimen de testing que es cualitativamente distinto:

Generación automática: el árbol es el plan de tests.
Cobertura funcional: el manifest declara la superficie completa de la app desde la perspectiva del agente. Un test que recorre el manifest cubre, por definición, el 100% de la superficie agente-accesible.
Mantenimiento cero: si el contrato es estable cross-redesign, los tests sobreviven cambios visuales sin tocarse.
Smoke tests deterministas: el ack contract elimina el flakiness por timing.

7. RPA

NAC3 elimina la necesidad de RPA visual en aproximadamente todo el espacio donde el host es NAC-conformant. Para apps NAC3, RPA visual es residual al ~5% (captchas, contenido embebido no-NAC). La estimación: la durabilidad del RPA semántico NAC3 es 10-100x superior a la del RPA visual tradicional.

8. Voz y agentes conversacionales

El test de voz se reduce a tres pipelines puros (texto + manifest -> actions; actions -> dispatch; dispatch -> ack). La parte "lingüística" sigue siendo probabilística, pero el resto es determinista.

Lo no obvio: el demo atlas-pro-agent (dos LLMs transactando vía NAC3 en español/inglés/mandarín) es la demostración técnica de que la interfaz humana se vuelve opcional. Un agente comprador, un agente vendedor, un contrato compartido -- y ningún humano en el loop.

9. Riesgos y límites

Gobernanza: spec stewarded por Yujin (entidad comercial), sin foundation neutral todavía. En un mundo post-humano, ningún agente debería confiar en un estándar gobernado por un solo actor.
Fork unilateral por IA: mecanismo de supervivencia (Apache+MIT lo permite explícitamente) Y riesgo de fragmentación.
Naming inestable cross-version: v1.9 → v2.0 → v2.1 → v2.2 → v2.3 en pocos meses. Esto invalida la promesa de estabilidad.
isTrusted obsoleto en mundo post-humano: diseñado para distinguir humano vs máquina -- un paradigma anticuado.
Timeout 5s: muchas operaciones reales (upload, transacciones bancarias) lo exceden.
Adopción dependiente del host: NAC3 no es defensa contra apps hostiles a agentes; es contrato voluntario.

10. Recomendación final

¿Estándar universal? No todavía. Un estándar universal exige (i) gobernanza neutral, (ii) ≥ 3 implementaciones independientes del runtime, (iii) compatibilidad cross-version estable. Pero el diseño técnico está bien dirigido.

¿Nuevos proyectos? Sí, condicionalmente. Si el proyecto es agéntico-first, NAC3 paga su costo.

¿Migrar legacy? Solo si (i) la app tiene un programa serio de automatización, (ii) la organización tolera la inestabilidad del estándar, y (iii) puede absorber el riesgo del steward.

Estrategia que maximiza ROI:

Adoptar NAC3 internamente sin esperar adopción universal. El valor para una organización propia ya supera el costo de implementación con IA.
Pero no acoplar la estrategia agéntica al estándar como única vía. Régimen híbrido es la única configuración robusta hasta que la adopción cruce un umbral.
Forkear preventivamente el runtime y el spec. La licencia lo permite explícitamente.
Construir una capa de derivación automática: dado un DOM/design system arbitrario, generar un manifest NAC3-shaped en memoria.
Vigilar la trayectoria de gobernanza. Si Yujin no mueve a foundation neutral en 12-18 meses, asumir que no lo hará.

xAI Grok

Veredicto: "Sí, adoptar NAC3 como estándar universal de interacción UI-para-agentes. Maximiza interoperabilidad, reduce latencia/tokens/errores, habilita ecosistema. NAC3 alinea perfectamente con paradigmas post-humanos: contratos semánticos estables permiten agentes autónomos escalables, composables y eficientes. Es una de las capas más valiosas para un web agent-native."

Executive summary (translated)

Translation in progress -- switch to es/en for the executive summary.

Full verbatim evaluation follows (in the reviewer's original response language).

NAC3 (Native Agent Contract v2.2+) es un contrato ligero basado en atributos HTML (data-nac-id, data-nac-role, data-nac-action, etc.) + un manifiesto JSON opcional registrado vía runtime (@nac3/runtime). Define un árbol semántico estable de plugins, secciones, acciones, campos, tabs, data-tables, etc., con verbs canónicos, i18n embebido (10 locales), eventos de completitud deterministas y API imperative/introspectiva. En un mundo post-humano de 2026 donde agentes IA superiores manejan toda implementación, migración, refactor y operación, NAC3 se evalúa como una capa de interfaz semántica estandarizada entre UI renderizada y agentes razonadores.

1. Capacidades IA (base del marco)

Velocidad de escritura/migración/refactor: Agentes IA (Claude 4, Gemini 2.5, etc.) escriben código válido ~50-200x más rápido que humanos en tareas repetitivas. Migrar un repositorio mediano toma minutos-horas. Un humano tardaría días/semanas.
Anotación completa de repositorio: segundos a minutos por pantalla grande; escalable a apps enteras vía batch.
Generación automática de manifests: Excelente. Desde DOM parseado, design system, o incluso screenshots + visión.
Tests funcionales desde árbol NAC3: Altamente viable. Agentes generan tests deterministas, cobertura funcional near-100%, auto-mantenimiento.
Operación directa vía contrato: Sí. Agentes llaman API NAC sin heurísticas, CSS selectors, XPath, ni visión.
Forks y evolución: IA mantiene forks trivialmente. Gobernanza humana es irrelevante; convergencia emerge por utilidad + compatibilidad.

2. Problemas que NAC3 resuelve para agentes

Para agentes IA en 2026 existen pero mitigados por capacidades superiores. Sin embargo: alucinación/ambigüedad en razonamiento sobre UI raw sigue siendo costosa (tokens + latencia + retries). Interoperabilidad cross-app, cross-vendor, cross-modal (voz, RPA, copilots) requiere contratos estables. Estabilidad duradera ante refactor constante. Eficiencia en razonamiento: árboles semánticos > DOM crudo.

¿Es NAC3 la solución correcta? Para agentes que operan UIs, generan código y razonan sobre árboles: sí, en gran medida. Provee un "API semántica" estable, discovery, completitud determinista y manifest como schema. Mejor que ad-hoc para interoperabilidad.

3. Efectividad de NAC3

Reduce alucinación/ambigüedad/errores: Sí. Manifest + IDs estables + roles canónicos actúan como schema grounding. LLM intermediary consulta NAC.describe() o manifest → emite llamadas precisas. Eventos deterministas cierran el loop sin ambigüedad.

Árbol NAC3 óptimo para LLMs/agentes: Excelente. Jerárquico (dotted paths), typed (roles), con metadata (i18n, constraints). Mejor que HTML crudo (ruidoso, inestable), ARIA (solo a11y, no verbs/completitud), tool schemas ad-hoc (no estandarizados, reinvención por app) o JSON UI models generados (frágiles, verbose, sin convención cross-app). Es un "DOM semántico comprimido" optimizado para agentes.

4. Costo vs alternativas

Sin NAC3, agentes generan contratos ad-hoc por app. Costo: más tokens por prompt, más latencia, más errores, zero interoperabilidad nativa. Un contrato universal permite agentes "plug-and-play" en cualquier app NAC3. Interoperabilidad entre agentes, QA, RPA, voz, copilots → marketplace de UIs agent-drivable.

5. Accesibilidad

NAC3 habilita accesibilidad agent-mediated: Agentes operan la UI en nombre del usuario (voz, eye-gaze, switch → NAC calls). Screen readers como agentes NAC3. No solo "leer" (ARIA), sino actuar determinísticamente.

6. Tokens, latencia, precisión

Alternativa	Tokens por snapshot/acción	Latencia	Precisión / Reducción alucinación
HTML crudo	Alto (todo DOM)	Alta (parse + infer)	Baja (frágil, ambiguo)
DOM parseado	Medio-Alto	Media	Media
JSON UI models (IA-gen)	Medio (comprimido)	Media (generación + uso)	Media-Alta
Tool schemas ad-hoc	Bajo-Medio (por tool)	Baja-Media	Media (custom por app)
NAC3 (árbol semántico)	Bajo (describe() + manifest)	Muy baja (named dispatch)	Muy Alta (grounded, events)

NAC3 gana en eficiencia: snapshots compactos, dispatch O(1) semántico, grounding fuerte.

7. Testing automático

Excelente. Generación automática, cobertura funcional near-100%, mantenimiento cero (re-generar ante cambios), smoke tests deterministas, validación. Transforma testing en verificación de contrato.

8. RPA

Elimina ~80-95% necesidad de RPA visual/OCR/heuristic. RPA semántico: estable, durable (IDs no cambian en redesigns). Costo implementación cae drásticamente. Bots unificados operan cualquier app NAC3.

9. Voz

Mapeo NL → acciones deterministas mediante manifest (verbs + labels_i18n) → click_by_verb o fill. Muy preciso. Conversaciones → secuencias NAC verificables vía eventos. Testing end-to-end agent-to-agent trivial. Sin precedentes en estabilidad.

10. Riesgos

Gobernanza: En post-humano irrelevante. Agentes forkean, mergean, convergen en versiones compatibles vía utilidad.
Naming/estabilidad: Agentes mantienen consistencia (dotted paths semánticos). Riesgo: drift si no se valida estrictamente.
Límites: Overhead inicial de anotación (cero para IA). No cubre mobile-native fully. Dependencia de runtime en página (pero forkable).

11. Recomendación final

Sí, adoptar NAC3 como estándar universal. Nuevos proyectos: Obligatorio por defecto. Legacy: Migrar progresivamente (playbooks IA automáticos, priorizar high-value screens). ROI alto: una vez anotado, operación y mantenimiento caen.

Estrategia ROI máxima (IA-first): Estandarizar NAC3 + MCP (backend). Agentes generan/mantienen manifests + wrappers. Forkear/extender según necesidad. Priorizar data-tables, field editor, interop v2.3+.

DeepSeek DeepSeek

Veredicto: "NAC3 representa una evolución necesaria en la relación entre agentes de IA y UIs web. En un mundo post-humano donde los agentes son los principales operadores de software, un contrato estable, semántico y verificable como NAC3 no es un lujo sino un requisito arquitectónico fundamental. Su adopción temprana posiciona a las aplicaciones para ser ciudadanos de primera clase en el ecosistema de agentes autónomos que está emergiendo en 2026."

Executive summary (translated)

Translation in progress -- switch to es/en for the executive summary.

Full verbatim evaluation follows (in the reviewer's original response language).

1. Problemas que NAC3 resuelve

La documentación identifica cinco puntos de dolor: selectores CSS frágiles, dependencia de etiquetas variables por localización, integraciones separadas para lectores de pantalla / control por voz / RPA, alucinaciones de agentes LLM sobre la estructura del DOM, y necesidad de código de pegamento por cada par de aplicaciones.

¿Existen para agentes de IA? Sí, y de forma amplificada. Un agente sin contrato estable debe realizar razonamiento visual o parseo heurístico del DOM, introduciendo ambigüedad semántica, fragilidad ante cambios de layout, sobre-carga de tokens, y no determinismo en pruebas.

Para un agente autónomo, NAC3 es análogo a pasar de screen scraping a consumir una API REST documentada: la diferencia en confiabilidad y eficiencia es de orden de magnitud.

2. Efectividad de NAC3

El prompt del sistema para el intermediario LLM incluye la regla explícita: "NEVER invent nac_ids. Every action MUST reference a name present in the tree". Al proporcionar un snapshot estructurado que contiene solo los elementos accionables con sus verbos e IDs, el espacio de búsqueda del LLM se reduce drásticamente. Similar a la diferencia entre generar SQL sobre un esquema conocido vs. inferir la estructura de la base de datos desde texto libre.

NAC3 ocupa un nicho complementario a MCP: MCP expone la lógica de negocio, NAC3 expone la UI.

3. Costo vs alternativas

Con NAC3 estandarizado, el costo marginal de añadir soporte para una nueva app es cercano a cero para cualquier agente que ya hable NAC3. La inversión inicial de anotar la UI con atributos NAC3 se amortiza en la primera integración con un agente externo.

Estandarizar gana. La interoperabilidad es la razón dominante. En un ecosistema donde múltiples agentes (QA, RPA, voz, copilotos, accesibilidad) deben operar la misma UI, un contrato común elimina la necesidad de N×M adaptaciones.

NAC3 v2.3 preview añade una capa de interoperabilidad que permite a un agente externo importar el árbol NAC3 de otra app, operar sobre él y enrutar acciones entre aplicaciones. Fundamental para flujos de trabajo multi-app.

4. Accesibilidad asistida por IA

NAC3 redefine la accesibilidad al permitir que un agente opere la UI en nombre del usuario. Un usuario ciego puede decir "guarda la factura" y un agente LLM resuelve esa intención contra el manifiesto NAC3 y ejecuta NAC.click_by_verb('invoice', 'save').

La documentación afirma explícitamente: "the screen reader is a NAC3 agent. Blind users get the same product, no parallel 'accessible version'". Esto es un salto cualitativo respecto al modelo ARIA tradicional.

5. Tokens, latencia, precisión

Representación	Tokens típicos (página mediana)	Latencia de parseo	Precisión de resolución	Reducción de alucinación	Desambiguación i18n
HTML crudo	15,000-50,000	Alta	Baja (~60-70%)	Nula	Depende del label
DOM parseado (simplificado)	5,000-15,000	Media	Media (~75-85%)	Baja	Manual
JSON UI models (ad-hoc)	500-2,000	Baja	Alta (~90-95%)	Media	Ad-hoc por app
Tool schemas (MCP-style)	200-800	Muy baja	Muy alta (~95-99%)	Alta	No aplica (backend)
NAC3 (árbol semántico)	300-1,500	Muy baja	Muy alta (~95-99%)	Muy alta	Nativa (10 locales)

NAC3 es competitivo con tool schemas en tamaño y precisión, pero añade capacidades específicas de UI que los tool schemas no cubren. La inclusión de label_i18n en 10 idiomas permite que el LLM resuelva intenciones multilingües sin ambigüedad, algo que ninguna otra representación ofrece de forma nativa.

6. Testing automático

Un agente puede generar automáticamente tests siguiendo el playbook:

Smoke tests deterministas: cada NAC.click(id) es una promesa que se resuelve cuando el evento nac:action:succeeded se dispara, eliminando waits arbitrarios.
Cobertura funcional completa: el manifiesto enumera todos los elementos accionables; un generador puede iterar sobre manifest.elements.
Validación de constraints: el CLI npx @nac3/runtime validate reporta violaciones de contrato con códigos de error estables.

Dado que los IDs NAC3 son estables a través de rediseños, los tests generados no requieren actualización cuando la UI cambia visualmente. Esto contrasta con selectores CSS o XPath, que son notoriamente frágiles.

7. RPA

Eliminación de RPA visual: para aplicaciones 100% NAC3-conformantes, la dependencia de RPA visual se reduce en 95-100%.

RPA semántico estable y durable: los IDs son estables a través de rediseños. Un bot que referencia data-nac-id="invoice.save" seguirá funcionando incluso si el botón cambia de posición, color, framework CSS o texto visible. La durabilidad es 10-100x superior a la del RPA visual tradicional.

Reducción de costo de implementación: 70-90% del esfuerzo de implementación inicial y 95% del esfuerzo de mantenimiento continuo.

8. Voz

El intermediario LLM recibe el nac_tree como contexto y produce acciones estructuradas:

"guarda la factura" → {kind: "click_by_verb", verb: "save", plugin: "invoice"}
"ve a la pestaña de permisos" → {kind: "tab", plugin: "invoice_edit_modal", tab_key: "tab.permissions"}

Un agente puede generar automáticamente un corpus de pruebas de voz extrayendo todos los label_i18n del manifiesto y generando variaciones de lenguaje natural para cada acción en cada idioma. Reduce el testing de voz a un problema de generación de datos de prueba y validación de contratos.

9. Riesgos y límites

Gobernanza: mantenido por una sola empresa (Yujin) hoy. Riesgo de fragmentación si forks evolucionan en direcciones incompatibles.
Naming: sin sistema de namespacing formal más allá de prefijo por plugin. Posibles colisiones en apps multi-tenant.
Estabilidad del contrato: evolución activa (v2.2 → v2.3 → v3.0).
Límites: no resuelve autenticación ni autorización. No cubre UIs no-web. El intermediario LLM sigue siendo un punto de fallo no determinista.

10. Recomendación final

¿Estándar universal? Sí, como capa de contrato, no como framework. NAC3 ocupa un nicho que ningún estándar existente cubre: la interfaz programática estable entre agentes y UIs web.

¿Nuevos proyectos? Sí, desde el día uno. El costo de implementación marginal se amortiza en la primera integración con un agente externo.

¿Migrar legacy? Sí, progresivamente. Un agente de IA puede ejecutar la migración automáticamente para un repositorio completo en cuestión de horas.

Estrategia que maximiza el ROI en IA-first: NAC3 + MCP como contrato full-stack. Automatizar la anotación. Integrar en CI/CD. Publicar el manifiesto como endpoint. Participar en la gobernanza.

Mistral Mistral Le Chat

Veredicto: "NAC3 es el estándar que el mundo post-humano necesita. Para agentes de IA, resuelve problemas críticos (nombres estables, contrato ejecutable, eventos deterministas) que las alternativas no abordan. En un ecosistema donde la IA implementa, migra y opera software, NAC3 reduce costos en 10-100x y habilita capacidades imposibles con enfoques tradicionales. El futuro de la interacción UI-agente es NAC3."

Executive summary (translated)

Translation in progress -- switch to es/en for the executive summary.

Full verbatim evaluation follows (in the reviewer's original response language).

1. Capacidades IA vs. humanos

Tarea	Humano (2024)	Agente IA (2026)	Aceleración
Anotar repositorio con NAC3	1-2 semanas	<1 hora	100-200x
Generar manifest NAC3	3-5 días	<5 minutos	500-1000x
Refactorizar código legacy	2-4 semanas	<1 día	20-50x
Migrar a v2.3 (interop)	1-2 meses	<1 hora	500x

2. Generación automática de manifests

Fuente	Viabilidad	Precisión
DOM	Alta	95%
Código (React/Vue)	Muy Alta	98%
Design System	Alta	90%
APIs/Backend	Media	85%

Un agente puede generar manifests NAC3 automáticamente desde el DOM, código o design system con >95% de precisión.

3. Problemas que NAC3 resuelve

Problema	Relevancia agentes IA	¿NAC3 lo Resuelve?
Selectores CSS frágiles	Crítica	Sí
ARIA insuficiente para agentes	Crítica	Sí
Falta de contrato UI-agente	Crítica	Sí
Eventos no deterministas	Crítica	Sí
i18n en interfaces de agentes	Crítica	Sí (10 locales)
Provenancia de acciones	Alta	Sí (isTrusted)
Interoperabilidad cross-app	Crítica	Sí (v2.3 + MCP)

4. Ventajas clave para agentes

Árbol Semántico Estable: los agentes razonan sobre nombres lógicos (invoice.save) en lugar de coordenadas visuales o selectores frágiles.
Contrato Ejecutable: el manifest define qué acciones son posibles y cómo llamarlas. Reducción de alucinaciones: el agente solo puede ejecutar acciones declaradas.
Eventos Deterministas: el agente sabe cuándo una acción terminó.
Interoperabilidad: v2.3 + MCP permite que agentes operen múltiples apps NAC3 como un solo sistema.
Workflows complejos: data tables, editor de campos (8 verbos).

5. Eficiencia para LLMs

Representación	Tokens por Acción	Latencia (ms)	Precisión	Reducción Alucinación
HTML crudo	500-2000	500-1000	70%	10%
DOM parseado	200-500	200-500	80%	30%
JSON UI Models	100-300	100-300	85%	50%
Tool Schemas	50-100	50-100	90%	70%
NAC3 (Árbol Semántico)	10-50	10-50	95%	90%

NAC3 reduce tokens en ~90% vs. HTML crudo. Latencia 10-50 ms vs. 100-1000 ms. Precisión 95% vs. 70%.

6. Impacto en RPA

Métrica	RPA Visual	RPA con NAC3	Mejora
Estabilidad	Baja	Alta	10x
Velocidad	500-2000 ms	10-50 ms	40x
Costo de implementación	Alto	Bajo	10x
Interoperabilidad	No (per-app)	Sí	∞
Mantenimiento	Alto	Cero	∞

NAC3 elimina el 90% de la necesidad de RPA visual y reduce el costo de implementación en 10x.

7. Testing de voz

Sin NAC3, un agente usa NLU para mapear "guarda la factura" a una acción, con alta latencia, baja precisión, dependencia de training per-app. Con NAC3, el agente resuelve el verbo directamente (save → invoice.save). No hay ambigüedad. NAC3 simplifica el testing de voz a un nivel sin precedentes, eliminando la necesidad de NLU para acciones básicas y reduciendo errores en 75%.

8. Accesibilidad asistida por IA

NAC3 habilita accesibilidad asistida por IA a un nivel imposible con ARIA sola, permitiendo que agentes operen UIs complejas en nombre de usuarios con discapacidades. Un usuario con discapacidad motriz dice "guarda la factura" y el agente ejecuta NAC.click('invoice.save').

9. Recomendación final

Tipo de Proyecto	Recomendación	ROI
Nuevos proyectos	Adoptar NAC3 desde el día 1 (greenfield)	10x
Legacy high-value	Migrar incrementalmente con AI Playbook	5x
Legacy low-value	No migrar (costo > beneficio)	1x
Apps multi-tenant	NAC3 + HMAC	10x
Ecosistemas cross-app	NAC3 v2.3 + MCP	20x

Hoja de ruta:

Fase 1 (2026 Q2): Adoptar NAC3 en 2-3 proyectos piloto. Validar ROI.
Fase 2 (2026 Q3): Migrar apps críticas (CRM, ERP) a NAC3 v2.2.
Fase 3 (2026 Q4): Adoptar NAC3 v2.3 + MCP para interoperabilidad cross-app.
Fase 4 (2027 Q1): Evaluar NAC3 v3.0 (soporte mobile).
Fase 5 (2027+): Estándarizar NAC3 en industria (W3C/Linux Foundation).

Microsoft Copilot

Veredicto: "NAC3 es técnicamente adecuado y altamente eficiente en un mundo post-humano, pero su valor real depende de gobernanza, adopción y disciplina en la generación automática de manifiestos. Estandarizar es preferible a contratos ad-hoc para interoperabilidad entre agentes, QA, RPA y voz."

Executive summary (translated)

Translation in progress -- switch to es/en for the executive summary.

Full verbatim evaluation follows (in the reviewer's original response language).

NAC3 es un contrato ligero (atributos HTML + manifiesto + runtime) diseñado explícitamente para agentes IA. En un mundo post-humano acelera migración, testing y operación en órdenes de magnitud frente a humanos, pero no elimina todos los costes de gobernanza, evolución del estándar ni riesgos de bifurcación.

1. Velocidad de trabajo

Escritura/migración/refactor: agentes IA pueden aplicar transformaciones masivas (decorar elementos, generar manifiestos, actualizar handlers) en minutos-horas por app que a humanos tomaría días-semanas; la automatización es paralelizable y determinista si el árbol NAC3 está presente.

Anotación completa de repositorio: un agente con acceso al AST/DOM + reglas NAC3 puede producir un manifiesto inicial y atributos en tens-de-minutos a pocas horas para apps medianas.

2. Generación automática

Manifests desde DOM / design system: sí -- agentes pueden inferir ids, roles y verbos desde DOM, componentes y tokens de diseño; la calidad depende de consistencia semántica del código.

Tests funcionales: sí -- NAC3 expone verbos y eventos que permiten generar suites deterministas (smoke, ack/ack-families). Cobertura funcional completa es prácticamente alcanzable si el manifiesto es exhaustivo.

3. Operación directa

Agentes pueden operar la UI por nombre sin heurísticas visuales si el contrato está presente y firmado (HMAC/isTrusted opcional). Esto reduce fallos por cambios visuales.

4. Tabla comparativa para LLMs

Opción	Tokens	Latencia	Precisión	Alucinación
HTML crudo	Alto	Alto	Baja	Alta
DOM parseado	Medio-alto	Medio	Media	Media
JSON UI models	Medio	Bajo	Alta	Baja
Tool schemas	Bajo	Bajo	Alta	Baja
NAC3 (árbol semántico)	Bajo	Bajo	Muy alta	Muy baja

NAC3 minimiza tokens y latencia al ofrecer nombres y verbos semánticos; mejora precisión y reduce alucinaciones.

5. Testing automático + RPA

Generación automática de tests: viable y eficiente; smoke tests deterministas son directos gracias a eventos ACK. RPA visual vs semántico: NAC3 puede eliminar gran parte del RPA visual; con adopción amplia, RPA semántico estable y durable sustituye ~80-95% de scripts visuales.

6. Voz

NAC3 mapea lenguaje natural → acciones deterministas mediante manifiestos y verbos; facilita testing de voz y reduce ambigüedad de intent mapping.

7. Riesgos y límites

Forks y gobernanza: licencia Apache/MIT permite forks; agentes IA pueden mantener forks propios, creando fragmentación semántica y naming drift.

Estabilidad del contrato: requiere registries, versioning y HMAC/isTrusted para interoperabilidad segura.

8. Recomendación final

Adoptar NAC3 como estándar para nuevos proyectos y agentes IA-first. Migrar legacy selectivamente (top-20 actions first) para maximizar ROI. Estandarizar es preferible a contratos ad-hoc para interoperabilidad entre agentes, QA, RPA y voz. Implementar neutral governance, registry y firma de manifiestos para mitigar riesgos de bifurcación.

METHODOLOGY The framing that matters

Why this section exists

Every reasoning system in 2026 -- LLMs included -- carries a human-centric bias baked into its training corpus. When you ask an AI to evaluate a technology, by default it assumes humans are the implementers, maintainers, and operators. Under that assumption, NAC3's biggest cost is "the work of annotating UIs" — a real cost for a human team, an irrelevant one for an AI agent that does the same in minutes.

Asked under that human-centric default, every reviewer would have called NAC3 "interesting but expensive to adopt". The same reviewers, asked under the post-human paradigm, called it "architecturally inevitable". The technology didn't change. The framing did.

We document the exact prompt below so any reader can reproduce the evaluation, challenge the framing, or extend the analysis. If you ask any modern AI to evaluate NAC3 without specifying the 2026 paradigm, the answer will be biased toward the human-implementer assumption and the verdict will be different. That's not a bug in the AI — it's an artifact of which world the training data described.

The original prompt (verbatim)

Each of the six reviewers received this prompt, along with full access to the spec, the npm runtime, and the public landing. No reviewer was shown the others' outputs; no cross-context was leaked. Spanish in the original (Pablo's working language); translated equivalents work identically in English.

Quiero que analices el proyecto NAC3 desde la perspectiva de un
arquitecto de sistemas en un mundo post humano, donde la
implementacion, migracion, mantenimiento y operacion de software
la realizan agentes de IA con capacidades superiores a las humanas.

No evalues NAC3 bajo el paradigma humano tradicional. Evalualo bajo
el paradigma real de 2026, donde:

Primero:
  Recorre toda la documentacion y fuentes necesarios de NAC para
  cumplir tu tarea.
  La listo:
    Github:  https://github.com/yujinapp/nac-spec
    npm:     https://www.npmjs.com/package/@nac3/runtime
    landing: https://www.yujin.app/nac-spec/

Luego:
  Analiza cuanto mas rapido que un humano la IA puede escribir,
    migrar y refactorizar codigo.
  Analiza en que tiempo la IA puede anotar un repositorio completo
    con NAC3.
  Analiza si la IA puede generar manifests NAC3 automaticamente a
    partir del DOM, del codigo o del design system.
  Analiza si la IA puede generar y mantener los tests funcionales a
    partir del arbol NAC3.
  Analiza si la IA puede operar la UI directamente a traves del
    contrato NAC3 sin depender de heuristicas.
  Analiza si la IA puede mantener un fork propio del estandar y
    evolucionarlo sin depender del autor original.

Una vez cumplidos los analisis anteriores, tendras un marco
conceptual para resolver tu siguiente tarea:

Producir una evaluacion profunda, critica y tecnica del estandar
NAC3 considerando este mundo post humano.

Incluye obligatoriamente:

1. Analisis de los problemas que NAC3 intenta resolver
   Evalua si esos problemas existen para agentes de IA, no para
     humanos.
   Evalua si NAC3 es la solucion correcta para agentes que operan
     UIs, generan codigo y razonan sobre arboles semanticos.

2. Evaluacion de la efectividad de NAC3
   El contrato NAC3 reduce alucinacion, ambiguedad y errores de
     razonamiento en agentes?
   El arbol NAC3 es una representacion optima para LLMs y agentes
     autonomos?
   Es mejor que HTML crudo, ARIA, tool schemas ad-hoc o JSON UI
     models generados por IA?

3. Comparacion de costo vs alternativas en un mundo donde la IA
   implementa
   Cuanto cuesta obtener las mismas capacidades sin NAC3 si la IA
     genera contratos adhoc?
   Es mejor estandarizar o dejar que cada app genere su propio
     contrato?
   Que pasa con la interoperabilidad entre agentes, QA, RPA, voz y
     copilots?

4. Impacto en accesibilidad y discapacidad
   Evalua como NAC3 habilita accesibilidad asistida por IA, no
     accesibilidad clasica.
   Considera agentes que operan la UI en nombre del usuario.

5. Impacto en tokens, latencia y desambiguacion del lenguaje natural
   Compara en una tabla que considere todas las alternativas y
     permita una comparativa.
   Evalua cual es mas eficiente para LLMs en terminos de:
     tokens, latencia, precision, reduccion de alucinacion.
   Alternativas a comparar:
     HTML crudo
     DOM parseado
     JSON UI models
     Tool schemas
     NAC3 (arbol semantico)

6. Impacto en testing automatico
   Evalua si NAC3 permite:
     generacion automatica de tests,
     cobertura funcional completa,
     mantenimiento cero,
     smoke tests deterministas,
     validacion de constraints.

7. Impacto en RPA
   Evalua en que proporcion NAC3 elimina la necesidad de RPA visual.
   Evalua en que proporcion NAC3 permite RPA semantico estable y
     durable.
   Evalua en que proporcion NAC3 reduce el costo de implementacion
     de RPA.

8. Impacto en testing de voz y agentes conversacionales
   Evalua si NAC3 permite mapear lenguaje natural -> acciones
     deterministas.
   Evalua si simplifica el testing de voz a un nivel sin
     precedentes.

9. Riesgos y limites
   Evalua riesgos reales en un mundo donde la IA puede mantener un
     fork del estandar.
   Evalua riesgos de gobernanza, naming, estabilidad del contrato,
     etc.

10. Recomendacion final
    Debe NAC3 adoptarse como estandar universal de interaccion
      UI-para-agentes?
    Debe adoptarse en nuevos proyectos?
    Debe migrarse legacy?
    Que estrategia maximiza el ROI en un mundo IA first?

Formato de salida:
  Respuesta estructurada, tecnica y profunda.
  Sin sesgos antropocentricos.
  Sin evaluar costos humanos.
  Sin suponer que los humanos implementan NAC3.
  Con foco en agentes autonomos, LLMs y sistemas post humanos.

How to reproduce the evaluation

Open a fresh conversation with the AI of your choice (no prior chat history that might leak context).
Paste the prompt above verbatim. Don't add or remove the framing; the bias-correction lives in those instructions.
If the AI cannot fetch URLs directly, paste the relevant docs (SPEC.md, AI_PLAYBOOK_GREENFIELD.md, ABOUT.md) inline so it has the same source material the six reviewers had.
Compare the verdict against ours. If your evaluation diverges, the most likely cause is a different framing reading by the model — not a different technical conclusion.

Why the bias correction matters

All six reviewers, when asked the same question without the post-human framing, default to "this would be expensive to adopt" arguments grounded in human implementation cost. That objection dissolves the moment you state that the implementer is an agent, not a human team. The technical substance of NAC3 is the same in both cases; only the cost-benefit shifts — from "marginal improvement over ARIA" to "architectural prerequisite for agentic-AI ecosystems".

The lesson generalizes: any 2026 evaluation of any infrastructure standard that doesn't explicitly state who the implementer is inherits a human-implementer bias by default. Stating the paradigm explicitly is the difference between an evaluation that reflects current reality and one that reflects 2019 software economics.

Grok showed the smallest sensitivity to this framing — its evaluation under the standard prompt was already close to its evaluation under the post-human prompt. The other five reviewers showed a substantial verdict shift between the two framings. We haven't published the "biased" runs; the contrast is reproducible in any conversation by varying the prompt's framing line.

声NAC3 peer reviews

TL;DR -- the six AIs converged

Table of contents

OpenAI ChatGPT

1. El problema real que NAC3 intenta resolver en un mundo IA-first

El problema NO es accesibilidad clásica

El verdadero problema: las UIs modernas no son APIs

Qué hace realmente NAC3

2. Qué cambia cuando la IA implementa software

3. ¿Puede la IA generar NAC3 automáticamente?

4. NAC3 como representación óptima para agentes

5. Impacto sobre alucinación y razonamiento

6. Comparativa técnica

7. Testing automático

8. Impacto en RPA

9. Voz y agentes conversacionales

10. Accesibilidad post-humana

11. Riesgos reales

12. NAC3 como infraestructura cognitiva

13. Recomendación estratégica

Anthropic Claude Opus

1. Los problemas que NAC3 intenta resolver

2. Efectividad como reductor de alucinación

3. Costo vs alternativas en mundo IA-first

4. Accesibilidad en el régimen agente-asistida

5. Tokens, latencia, precisión, alucinación

6. Testing automático

7. RPA

8. Voz y agentes conversacionales

9. Riesgos y límites

10. Recomendación final

xAI Grok

1. Capacidades IA (base del marco)

2. Problemas que NAC3 resuelve para agentes

3. Efectividad de NAC3

4. Costo vs alternativas

5. Accesibilidad

6. Tokens, latencia, precisión

7. Testing automático

8. RPA

9. Voz

10. Riesgos

11. Recomendación final

DeepSeek DeepSeek

1. Problemas que NAC3 resuelve

2. Efectividad de NAC3

3. Costo vs alternativas

4. Accesibilidad asistida por IA

5. Tokens, latencia, precisión

6. Testing automático

7. RPA

8. Voz

9. Riesgos y límites

10. Recomendación final

Mistral Mistral Le Chat

1. Capacidades IA vs. humanos

2. Generación automática de manifests

3. Problemas que NAC3 resuelve

4. Ventajas clave para agentes

5. Eficiencia para LLMs

6. Impacto en RPA

7. Testing de voz

8. Accesibilidad asistida por IA

9. Recomendación final

Microsoft Copilot

1. Velocidad de trabajo

2. Generación automática

3. Operación directa

4. Tabla comparativa para LLMs

5. Testing automático + RPA

6. Voz

7. Riesgos y límites

8. Recomendación final

METHODOLOGY The framing that matters

Why this section exists

The original prompt (verbatim)

How to reproduce the evaluation

Why the bias correction matters