Fricción y Flujo
Sobre el fracaso de la IA, la escala organizacional, y la pregunta que nadie se hace aún
Lo más interesante de cómo habla la gente sobre el fracaso de la IA no es el fracaso. Es la satisfacción.
El Momento del Aja
Cuando una IA alucina —produce algo confidentemente equivocado, fabrica una cita, tergiversa un hecho— una cierta clase de persona tiene una cierta clase de reacción. No decepción, exactamente. Más bien como una vindicación. Aja. Ya ves, no se puede confiar en ella. Tiene limitaciones. Se desmorona.
Lo que está ocurriendo técnicamente está bastante bien entendido. Los modelos de lenguaje grandes fallan en los límites de su entrenamiento y ventana de contexto. Empuja cualquier sistema más allá de su margen operativo y se degrada —eso no es un defecto específico de la IA, es así como funciona la capacidad. Todo sistema tiene un límite de fallo. Los cirujanos los tienen. Los modelos financieros los tienen. Los puentes los tienen. Hemos aprendido generalmente a trabajar dentro de esos límites en lugar de tratar la existencia de un límite como prueba de una falta fundamental de fiabilidad.
Con la IA, no. Una alucinación se convierte en un veredicto. Vale la pena señalarlo no porque la IA merezca un trato más generoso, sino porque la inconsistencia del criterio revela algo sobre qué está realmente impulsando la crítica —que no es una evaluación cuidadosa de la fiabilidad sino algo más parecido al alivio. Lo que nos inquietaba finalmente puede ser descartado.
La Escala Equivocada
El problema más profundo con la crítica de alucinación es que aplica criterios de herramienta individual a algo que ya, en la práctica, está operando a escala organizacional.
Cuando la IA se integra en un flujo de trabajo serio —no como una novedad sino como una dependencia— no está funcionando como un instrumento singular que o funciona o no funciona. Está funcionando como una capa en un sistema, de la manera en que un departamento o un equipo funciona como una capa. No evalúas un departamento preguntando si alguien en él alguna vez cometió un error. La evalúas por si el sistema en conjunto produce resultados fiables a lo largo del tiempo, gestiona errores sin fracasos catastróficos, y mejora cuando recibe retroalimentación.
Por esos criterios, la comparación relevante no es «¿alucina la IA?» sino «¿alucina más que los procesos humanos a los que está reemplazando o potenciando?» Y esa comparación tiende a no hacerse, porque los procesos humanos en cuestión también fallan constantemente, costosamente, y frecuentemente sin que nadie declare que son fundamentalmente poco fiables.
A escala organizacional, la pregunta sobre la viabilidad de la IA no trata de tasas individuales de fracaso. Se trata de qué tipos de organizaciones pueden incorporar la IA, a qué escala, haciendo qué tipos de trabajo, y con qué modos de fracaso. Esa es una pregunta mucho más interesante y apenas hemos empezado a hacerla.
Qué Quiebra Realmente las Organizaciones Humanas
Tenemos décadas de investigación sobre grandes organizaciones humanas y una imagen bastante clara de por qué fracasan. Los diseños estructurales —jerarquías, cadenas de información, capas de decisión, rutas de escalada— son en su mayoría sólidos. Las patologías son conductuales. La proliferación de departamentos, donde las unidades crecen para proteger sus presupuestos en lugar de servir su función. La expansión burocrática, donde los procesos se acumulan hasta convertirse en el resultado principal. Ascenso por política en lugar de competencia. Información filtrada en cada capa por personas que protegen su posición. Corrupción como característica inherente, no como bug, de la concentración de poder.
Estos no son fracasos estructurales. Son fracasos humanos que se visten de estructura. El organigrama no corrompió a nadie. El incentivo para corromperse ya estaba ahí, y la estructura le dio los medios.
La conclusión ingenua de esto —y es tentadora— es que las organizaciones nativas de IA simplemente no tendrían estos problemas. La IA no tiene instintos de supervivencia política. No promueve a sus aliados, no defiende su presupuesto, ni filtra información hacia arriba para quedar bien. Elimina los vicios humanos, razona uno, y tienes la estructura organizacional funcionando limpiamente por fin, de la manera en que siempre estuvo destinada a funcionar.
Este razonamiento no es incorrecto en lo que abarca. Solo que no abarca lo suficiente.
Lo Que la IA Ya Sabe Sobre Fricción
Los paradigmas de entrenamiento de IA más exitosos de la última década han convergido, independientemente de cualquier teoría organizacional, en un hallazgo sorprendente: la presión adversarial produce mejores resultados que la optimización cooperativa sola.
Las Redes Generativas Adversariales —GANs— funcionan enfrentando dos sistemas entre sí. Un generador intenta producir resultados convincentes; un discriminador intenta atraparlo fallando. Ninguno mejora sin la resistencia del otro. Elimina el adversario y el generador produce resultados mediocres con alta confianza. La fricción no es incidental al proceso. Es el proceso.
El debate entre agentes múltiples aplica un principio similar en los modelos de lenguaje. Cuando múltiples instancias de IA son forzadas a argumentar posiciones opuestas sobre la misma pregunta —en lugar de simplemente responderla— las respuestas resultantes son mediblemente más precisas y mejor razonadas que las producidas por cualquier instancia individual actuando sola. El desacuerdo mejora el resultado. El consenso, en este contexto, es un modo de fracaso.
Y luego está el juego contra sí mismo: AlphaGo y AlphaZero no aprendieron a dominar sus respectivos juegos estudiando el juego humano. Aprendieron jugando millones de juegos contra sí mismos —presión adversarial interna, sostenida a una escala que ningún oponente humano podría alcanzar. El resultado fue un desempeño que superó todo lo que los humanos habían producido durante siglos de maestría acumulada.
La IA, dejada a su propia lógica de entrenamiento, sigue llegando a la misma respuesta: la oposición funciona. La fricción a veces no es el obstáculo del aprendizaje. Es el mecanismo.
La Otra Dirección
Pero la fricción no es toda la historia, y la evidencia del otro lado es igualmente sustancial.
Elinor Ostrom ganó el Premio Nobel de Economía en 2009 por documentar algo que la teoría económica formal había insistido que no podía existir: grandes grupos de personas gobernando exitosamente recursos compartidos durante largos períodos de tiempo, sin mercados y sin autoridad central. Sin presión adversarial, sin jerarquía que imponga cumplimiento. Solo normas de coordinación que emergieron de la comunidad misma y perduraron porque la comunidad las confiaba. Estables, productivas, duraderas. La teoría decía que era imposible. La empiria decía que sucedía constantemente.
El desarrollo de software de código abierto produce algo similar a una escala diferente. Linux, Wikipedia y la mayoría de la infraestructura fundacional del internet moderno fueron construidos por comunidades distribuidas de personas que contribuyen voluntariamente, coordinadas por normas compartidas en lugar de estructuras de mando, sin tensión adversarial entre los colaboradores. Los resultados rivalizan e incluso en muchos casos superan lo que organizaciones centralizadas y jerárquicas comparables produjeron con muchos más recursos.
La inteligencia de enjambre ofrece un tercer punto de datos. Las colonias de hormigas, las colmenas de abejas, las bandadas de pájaros —estos sistemas producen comportamientos emergentes de sofisticación notable sin coordinación central y sin dinámicas adversariales entre agentes. Cada individuo sigue reglas locales simples; el resultado colectivo es complejo, adaptativo y resiliente. El resultado se logra no a través de fricción sino a través de algo más cercano al flujo puro: cada agente haciendo su pequeña cosa, el sistema haciendo algo mucho mayor que la suma de esas cosas.
Así que tenemos dos cuerpos de evidencia, ambos creíbles, apuntando en direcciones opuestas. La fricción produce mejores resultados. El flujo produce mejores resultados. Ambas afirmaciones están respaldadas empíricamente. La pregunta no es cuál de los dos es correcto.
Fricción y Flujo
La pregunta es qué determina cuál requiere una situación dada.
Algunos patrones resultan evidentes. Las dinámicas adversariales parecen producir los mejores resultados cuando la tarea implica discriminación —distinguir verdadero de falso, bueno de malo, correcto de incorrecto. Los GANs mejoran en generación porque el discriminador constantemente obliga al generador a ser más preciso. El debate multiagente mejora el razonamiento porque el desacuerdo expone las debilidades en cada posición. La oposición es una forma de control de calidad, y el control de calidad es más valioso cuando el costo de equivocarse es alto y difícil de detectar.
El flujo y la coordinación —el modelo Ostrom, el modelo de código abierto, el modelo de enjambre— parecen funcionar mejor cuando la tarea implica construcción en lugar de discriminación. Construir algo nuevo, ampliar una base de conocimiento, explorar un espacio de soluciones. Aquí, la presión adversarial puede ser contraproducente: estrecha la búsqueda en lugar de ampliarla, optimiza localmente en lugar de globalmente, y crea confianza en lo equivocado. Lo que estas situaciones requieren es confianza y una dirección compartida, no oposición.
Si ese patrón se sostiene —y es una hipótesis, no una conclusión— entonces la pregunta de diseño para las organizaciones nativas de IA no es «¿cuánta fricción deberíamos tener?» sino «¿qué está tratando de hacer esta parte de la organización, y qué modo requiere ese trabajo?» La misma organización podría necesitar estructuras adversariales para sus capas de verificación y toma de decisiones, y estructuras de flujo para sus capas generativas y exploratorias. Diseñar eso deliberadamente, en lugar de usar un modo por defecto en toda la organización, probablemente se acerca más a lo que la excelencia organizacional parece a escala de IA.
Si los sistemas de IA pueden hacer esa determinación por sí mismos —reconociendo cuándo necesitan fricción y cuándo necesitan flujo, y cambiando entre modos en consecuencia— es una pregunta que aún no ha sido seriamente abordada. Las arquitecturas multiagente actuales son principalmente jerarquías básicas: simples estructuras arbóreas que reflejan cómo ya concebimos el software y las herramientas. Son diseños de primera generación, puntos de partida razonables, y casi con certeza no es dónde termina.
El Experimento
La crítica de alucinación, revisitada desde aquí, parece un error de categoría. Estamos juzgando la fiabilidad de algo a nivel de herramienta individual mientras ya comienza a operar a un nivel donde la unidad relevante de análisis es la organización. Y a ese nivel, la pregunta de si algún componente individual falla es menos importante que cómo está estructurado el sistema para manejar fallos —y si la estructura sabe la diferencia entre la fricción que gasta y la que funciona.
Estamos, sin admitirlo del todo, al comienzo del mayor experimento organizacional de la historia. Se construirán organizaciones nativas de IA. Fracasarán de formas que no predijimos y tendrán éxito de maneras que no esperábamos. La versión ingenua tratará de eliminar toda fricción y producir algo eficiente y frágil. La versión más interesante tendrá que descubrir para qué servía la fricción.
¿Cuánto de lo que nos ralentiza también forma parte de lo que podemos lograr? Esa pregunta aún no tiene respuesta. Puede ser la más importante que hay.