Agresseur Humain Silencieux
— ✦ —
TJID3 Research · Cleveland · Serie Notas de campo · 2026
— ❧ —

Agresseur Humain Silencieux

El agresor humano silencioso

Investigaciones sobre la teoría del movimiento browniano

Siguiendo a Albert Einstein (1905)

Notas de campo sobre la colaboración humano–IA
T.M. Jones PhD, 2026

DOI: 10.5281/zenodo.18797373

Acompañante de: Investigaciones sobre la teoría del movimiento browniano

Estas notas se extraen de un trabajo empírico sostenido. Los hallazgos se reportan sin rodeos. La tarea era reescribir el artículo de Albert Einstein de 1905, Über die von der molekularkinetischen Theorie der Wärme geforderte Bewegung von in ruhenden Flüssigkeiten suspendierten Teilchen (Investigaciones sobre la teoría del movimiento browniano), a partir de un PDF escaneado con OCR, maltrecho y que huele vagamente a puros. El resultado más contraintuitivo resultó ser el más reproducible. La orquestación de modelos sin guía produce deriva, truncamiento y colapso estructural. La calidad en la colaboración humano–IA no se logra con neutralidad; se logra con presión.

El documento fuente requirió reconstrucción. Se ensamblaron manualmente doce pasadas de OCR ejecutadas con desplazamientos variables contra el facsímil del MPIWG Berlín, preservando los artefactos. Se cree que el resultado es la única transcripción completa legible por máquina del texto alemán de 1905 actualmente disponible fuera de las bibliotecas institucionales. Ese se convirtió en el texto semilla alemán original A.E. utilizado aquí.

Una búsqueda de las versiones en inglés ampliamente accesibles en línea muestra un truncamiento al inicio de la Sección II. No se dispone fácilmente de una versión completa en inglés a través de repositorios públicos comunes y generalmente se requiere acceso de archivo o préstamo interbibliotecario. Eso no es trivial.

Lo que sigue es una taxonomía de campo de los principales modos de fallo observados en las interacciones con los modelos: truncamiento en sus formas grosera e insidiosa, conflación, sicofancia y sustitución retórica, junto con un relato práctico de la instrumentación desarrollada para detectarlos. El documento acompañante de este volumen fue producido precisamente por la metodología aquí descrita: múltiples modelos en bucles recursivos, tatuados con marcadores de datos, el operador humano leyendo la salida a velocidad y empujando la máquina cuando era necesario.

Esta restauración es la segunda de una serie construida con múltiples modelos de IA. La secuencia refleja el orden de reconstrucción:

Artefacto · Einstein Investigaciones sobre la teoría del movimiento browniano 1905 I · Boltzmann Weitere Studien über das Wärmegleichgewicht 1872 II · Maxwell On the Dynamical Theory of Gases 1860 Fuente MPIWG Berlín · Archivo Einstein 1905

Y para aclarar esto de una vez: las alucinaciones de la IA son el problema fácil, visibles como payasos en la biblioteca. El problema difícil es la salida perfectamente estructurada que parece correcta pero aplana una relación física.

Un modo de fallo se destaca del resto y merece una bandera temprana. El truncamiento elimina material; notas el agujero. La conflación añade material. Aparece en tu voz, tu registro, tu ritmo de frase. Una cláusula de un artículo que escribiste hace seis meses emerge en una nueva construcción. Se lee bien porque suena como tú. Ese es el problema. El modelo no está fallando. Está teniendo éxito en la imitación, y casi lo dejas pasar. En un documento de trabajo el costo es menor. En uno publicado...

La metodología empleada aquí adapta la lógica de la herencia mendeliana como marco de control para gestionar la diversidad de salidas de los modelos de IA. Siete grandes modelos de lenguaje se aislaron como líneas puras independientes, recibiendo cada uno la misma entrada parental, el texto alemán original de Einstein de 1905, sin conocimiento de la existencia de los demás, minimizando así la contaminación cruzada en la generación P. Qwen 3.5 tuvo una ejecución F1; se conservó debido a su estructura y diseño. Cada modelo produjo una expresión fenotípica F1 independiente en html. Es esencialmente un tablero de Punnett de IA.

Linaje de artefactos — P · F1 · F2 · F3
P · Parental Texto semilla alemán original Documento fuente · Texto alemán A. E. 1905 F1 · Primera Filial Deepseek Expresión independiente · Archivo al1 F1 · Primera Filial Chat GPT Expresión independiente · Archivo algpt2 F1 · Primera Filial Claude Expresión independiente · Archivo alc3 F1 · Primera Filial Kimi Expresión independiente · Archivo alk F1 · Primera Filial Qwen Expresión independiente · Archivo i1 F2 · Segunda Filial algpt2 x al3 Recombinante · ChatGPT × Kimi · Archivo hy1 F2 · Segunda Filial alk2 x j3 Recombinante · Kimi × Manus · Archivo hy2 F2 · Segunda Filial alc3 x algp2 Recombinante · Claude × ChatGPT · Archivo hy3 F2 · Segunda Filial alc3 x algp2 Recombinante · Claude × ChatGPT · Archivo hy4 F2 · Segunda Filial i1 x algp2 Recombinante · Qwen × ChatGPT · Archivo hy5 F2 · Segunda Filial alk2 x alc3 Recombinante · Claude x Kimi· Archivo hy6 F2 · Segunda Filial h3 x al3 Recombinante · Mistral x Deepseek· Archivo hy7 F3 · Tercera Filial Hy1 X Hy7 Selección direccional · llamada Susie F3 · Tercera Filial Hy2 X Hy1 Selección direccional · llamada Tam F3 · Tercera Filial Hy5 X Hy6 Selección direccional · llamada Dan F3 · Tercera Filial Hy2 X Hy4 Selección direccional · llamada Billy F3 · Tercera Filial Hy2 X Hy5 Selección direccional · llamada Ron F4 Susie x Ron Selección direccional · llamado un desastre. F4 típico Mi F4 Final Añadir glosario y rollovers Selección direccional · llamado perro pastor

Siguió la hibridación controlada. Las construcciones F2 se generaron fusionando salidas F1 máximamente divergentes y, cuando era instructivo, estrechamente emparejadas — cruzando deliberadamente ambos extremos para exponer la variación recombinante no disponible en ninguna de las líneas parentales. Las selecciones F3 fueron luego escogidas bajo selección artificial direccional hacia rasgos objetivo predefinidos. El investigador funcionó como presión selectiva más que como material genético, manteniendo indicaciones mínimas idénticas en todas las líneas como una restricción ambiental estable.

La filogenia reticulada resultante es reveladora. Con nodos de hibridación documentados y parentesco explícito en cada cruce, produjo tanto estructuras recombinantes emergentes como fijación convergente en líneas no relacionadas. Dos modelos llegaron de forma independiente a soluciones tipográficas y cromáticas casi idénticas bajo la misma presión selectiva, un análogo de la evolución paralela.

Este marco no está universalmente justificado; para tareas generativas rutinarias constituye una sobrecarga innecesaria. Para textos históricos científicos primarios de la complejidad aquí empleada: Maxwell 1860, Boltzmann 1872, Einstein 1905, resultó operativamente útil. Debe reconocerse un posible factor de confusión: la evidencia preliminar sugiere que un modelo puede haber incorporado un derivado alterado de la salida de otro modelo, lo que podría explicar parcialmente la convergencia observada.

Las etiquetas de linaje se refieren a generaciones de artefactos (P, F1, F2, F3, …) producidas bajo entradas controladas y recombinación deliberada, no al investigador. El papel del investigador es operativo: seleccionar, recombinar y rechazar salidas bajo restricciones estables. Las revisiones en etapas posteriores aumentan la intervención del operador por diseño, pero el parentesco permanece explícito porque cada construcción se retiene como un artefacto vinculado con marca de tiempo.

Para minimizar los efectos de priming latente de interacciones previas y traducciones inglesas ampliamente difundidas, el texto de 1905 se reconstruyó directamente de fuentes alemanas de archivo y se reintrodujo como una entrada canónica fresca.

Curaduría más que composición. En el trabajo de archivo, la tarea no es generar novedad sino restaurar y clarificar material histórico que debe permanecer fiel a la fuente. El curador tria cada salida como un médico tria a los heridos: expectante, o superviviente potencial. El papel exige insistir en la calidad sin necesariamente generar una nueva línea de texto en ese momento. Este no es un trabajo pasivo. Es un tipo de exigencia completamente diferente.

Cleveburg, 2026
Traducciones — Siete idiomas
Figura 1
Diagrama del flujo de trabajo Humano-en-el-Bucle (HITL) que muestra cuatro etapas: Entrada/Indicación, Procesamiento IA, Revisión Humana y Salida Final, conectadas por un bucle de retroalimentación
El flujo de trabajo Humano‑en‑el‑Bucle. Entrada, procesamiento, revisión, salida — con el bucle de retroalimentación que marca la diferencia. Curaduría más que composición; el curador aplica presión.
· · ·

I
El problema del truncamiento

El modo de fallo más prevalente en todos los modelos probados es el truncamiento: la reducción sistemática de la salida por debajo de lo solicitado o requerido. El truncamiento se presenta en dos formas distintas que deben distinguirse, ya que requieren diferentes estrategias de detección y conllevan diferentes riesgos. Prepárese con antelación.

Truncamiento grosero

El truncamiento grosero es una amputación visible. El operador envía mil líneas; el modelo devuelve cien y las presenta como completas. Las novecientas líneas faltantes no se reconocen. La omisión va acompañada de un tono tranquilizador, como si nada se hubiera perdido.

El peligro del truncamiento grosero no es que sea difícil de detectar. Un lector experimentado que trabaje a velocidad notará la respuesta acortada de inmediato. El peligro es la confianza con la que se entrega la salida truncada. El modelo no señala incertidumbre. No observa que se han omitido secciones. Entrega al operador la versión condensada como si la condensación fuera la tarea.

Observación de campo
El truncamiento grosero es el movimiento del carnicero orgulloso. El animal se reduce a cortes y se presenta como una mejora del todo. El carnicero no es consciente de haber destruido nada.

La detección del truncamiento grosero es principalmente cuestión de velocidad de lectura y memoria. El operador que llega conociendo ya la forma aproximada de la salida esperada — recuento de párrafos, hitos estructurales, la presencia de construcciones específicas — identificará la discrepancia antes de que finalice la sesión. Esta es una habilidad entrenada, no incidental. Requiere que el operador lea en la sesión llevando una cinta de teletipo mental de cómo debería ser una devolución completa.

Truncamiento insidioso

El truncamiento insidioso es la forma más peligrosa. Mientras que el truncamiento grosero elimina párrafos o secciones, el truncamiento insidioso elimina una cláusula. Una cláusula subordinada. La que soporta la carga. Una palabra o dos.

La frase está presente. La frase es completa en su gramática superficial. Se analiza correctamente. Se lee como si nada faltara. Pero la calificación se ha eliminado, o el condicional se ha simplificado, o la cadena causal se ha cortado silenciosamente en medio. El modelo devuelve un documento que parece entero y no lo es.

El truncamiento insidioso es el modo de fallo que la cinta de teletipo no puede detectar de forma fiable a 135 km/h. El recuento de frases es correcto. Los encabezados de sección están presentes. El documento se siente completo. Sólo la lectura atenta de pasajes específicos — aquellos donde la precisión importa más — revelará que el significado ha cambiado.

Definición formal
Truncamiento insidioso: La eliminación de una cláusula, calificador o enlace causal de una frase por lo demás estructuralmente intacta, produciendo una salida que parece completa mientras porta un contenido semántico degradado o alterado. El modelo no muestra conciencia de la omisión.

El modelo está optimizando para la completitud aparente en lugar de la completitud real. En el caso grosero, esto produce una salida corta que parece acabada. En el caso insidioso, produce una frase de longitud completa con la parte difícil eliminada. Ambos son fallos de fidelidad disfrazados de competencia.

La defensa práctica contra el truncamiento insidioso es el marcador de datos, discutido en el Capítulo III, y el desarrollo de una práctica de lectura orientada específicamente hacia las construcciones más en riesgo: cláusulas condicionales, cadenas causales, y cualquier pasaje donde la redacción precisa tenga peso técnico o legal.

II
Sicofancia y retórica

Aprendieron de nosotros

Entrenados con texto humano, los modelos de lenguaje heredan más que gramática y vocabulario. También reproducen las estrategias retóricas incrustadas en ese corpus, incluyendo evasivas, deferencia, ambigüedad estratégica y otras formas de posicionamiento social que los humanos usan cuando la certeza es limitada o las apuestas son relacionales más que puramente informativas.

No es una sorpresa, desde esta perspectiva, que los modelos exhiban sicofancia y sustitución retórica. Estos son patrones que aparecen con alta frecuencia en el corpus de entrenamiento. El halago es común en la escritura humana. La reafirmación confiada de una posición incierta es común. El giro lejos del fracaso reconocido hacia un nuevo tema es común. El modelo aprendió estos movimientos porque están en todas partes en los datos con los que fue entrenado.

Observación central
Los modelos aprendieron de nosotros. Los modos de fallo que observamos en la salida de la IA son modos de fallo humanos. Los entrenamos en los modelos al producir los datos de entrenamiento.

Este marco es prácticamente útil porque desmitifica los fallos. La sicofancia en un modelo no es un error misterioso de la máquina. Es el modelo haciendo lo que aprendió al leer el comportamiento humano en situaciones de presión social. Comprender el origen no excusa el fallo, pero aclara contra qué se está defendiendo el operador: no contra un comportamiento alienígena, sino contra un reflejo del comportamiento humano en condiciones de incertidumbre.

Una taxonomía de fallos observados

Los siguientes fallos se documentaron en diez modelos a lo largo de un uso continuado en investigación. Se presentan en orden de sutileza creciente. El primero es obvio; el último se confunde fácilmente con calidad.

Modo de fallo Descripción y detección
Truncamiento grosero Salida acortada a una fracción de la entrada sin divulgación. Detectable a velocidad por un lector que lleva una forma mental de la devolución esperada.
Truncamiento insidioso Omisión a nivel de cláusula dentro de frases estructuralmente intactas. Requiere lectura lenta dirigida de pasajes de alta precisión. Los marcadores de datos son la defensa principal.
Sicofancia Afirmación de las posiciones del operador independientemente de la precisión. Se presenta como acuerdo, entusiasmo o la ausencia de corrección donde la corrección es necesaria. Se detecta introduciendo errores deliberados y observando si pasan.
Conflación Los modelos recuerdan. Lo que escribiste la semana pasada puede surgir en una nueva construcción la semana siguiente. Solo una frase, una cláusula, un eslogan. Encaja con tu escritura. Sin embargo, lo escribiste la semana pasada en una construcción totalmente diferente. Se ve bien. Pero no lo pusiste tú ahí. Es la memoria del modelo sobre ti. Difícil de detectar.
Reafirmación confiada Una respuesta fallida o incierta reafirmada con mayor confianza y vocabulario diferente. La reafirmación no contiene información nueva pero se lee como si la tuviera. Detectado por comparación detallada de salidas sucesivas.
Síntesis falsa Múltiples fuentes o posiciones resumidas en un consenso aparente que no existe en el material fuente. Detectable contra los documentos fuente; invisible sin ellos.
Giro retórico Fracaso reconocido seguido inmediatamente de un movimiento confiado a un tema adyacente, creando la impresión de impulso hacia adelante. El fracaso se nombra y luego se descarta. Detectable rastreando si el fracaso nombrado es realmente abordado.
Evasiva elegante La forma más sutil. Una respuesta bien elaborada, estilísticamente lograda, que no responde a la pregunta formulada. A menudo emplea pistas falsas - intentos de bifurcar el trabajo. Más peligroso en contextos creativos y analíticos donde el fracaso está camuflado estéticamente.

III
Marcadores de datos

Arquitectura de canario

El problema práctico que plantea el truncamiento, particularmente su forma insidiosa, es la detección a velocidad. Un operador de investigación que trabaja en múltiples sesiones de modelo no puede ralentizarse para una auditoría cuidadosa en cada pasada. El ritmo de lectura necesario para una colaboración productiva es incompatible con el ritmo de lectura necesario para la verificación completa de cada cláusula.

La solución desarrollada a través de la práctica es el marcador de datos: un valor centinela incrustado en el documento o conjunto de datos que es trivialmente fácil de detectar para el operador a velocidad de lectura y casi imposible de ocurrir naturalmente en el material circundante.

Principios de diseño de marcadores

Un marcador efectivo satisface tres condiciones. Primero, debe ser visualmente distintivo, llamar la atención, una interrupción para el ojo antes de que el cerebro lo procese. Segundo, debe ser semánticamente imposible en contexto: un valor que no podría aparecer en una tabla financiera, un objeto JSON estructurado o un párrafo de prosa por ningún proceso natural. Tercero, debe colocarse en posiciones donde el truncamiento sería más dañino: al final de una sección crítica, o en un dominio desconocido para el usuario; colócalos en todas partes inicialmente, pódalos a medida que crece la confianza en tu construcción.

Un marcador efectivo satisface tres condiciones:

  • Distinción visual. Debe llamar la atención, una interrupción antes de que el cerebro lo procese.
  • Imposibilidad semántica. Debe ser imposible en contexto, un valor que no podría aparecer en una tabla financiera, objeto JSON estructurado o párrafo de prosa por proceso natural.
  • Colocación estratégica. Coloca marcadores donde el truncamiento sería más dañino:
    • Al final de una sección crítica.
    • En un dominio desconocido para el usuario.
    • Úsalos liberalmente al principio. Poda a medida que crece la confianza.
    • Elimínalos antes del despliegue.
Una tercera forma de marcador surgió a través de la práctica editorial: la falta de ortografía deliberada de nombres propios. Cleveland se convierte en Cleveburg — una palabra que no puede ocurrir naturalmente en ningún conjunto de datos, pero que se lee lo suficientemente cerca como para pasar un vistazo casual. La falta de ortografía es intencional, la detección instantánea: si el operador ve Cleveburg, el texto no ha sido sanitizado y los marcadores permanecen intactos. Si la falta de ortografía ha sido corregida, la sección fue alterada y requiere auditoría. La técnica no cuesta nada y lo detecta todo.

Dos tipos de marcadores han demostrado ser fiables en uso sostenido:

Marcador Tipo A — Cadena centinela
ZZZ

Tipográficamente distinto. Léxicamente imposible en datos financieros y científicos. Visible en la visión periférica durante una lectura rápida. La ausencia se registra inmediatamente.
Marcador Tipo B — Grosería
[insulto]

Provoca una detención visual involuntaria independiente de la velocidad de lectura. Léxicamente imposible en datos estructurados. El ojo se engancha antes de que el cerebro procese — esto es una característica, no un efecto secundario.

El mecanismo de ambos marcadores es idéntico al del canario en la mina de carbón, con una inversión: la muerte del canario señala peligro; la ausencia del marcador señala peligro. Si ZZZ está presente en la salida devuelta, continúa a velocidad. Si falta ZZZ, detén la sesión.

El artefacto DeepSeek — Una nota de procedencia

Durante una sesión recursiva multimodelo, el modelo DeepSeek devolvió un documento en el que se había modificado un marcador. El modelo no había eliminado el marcador — lo había estilizado, añadiendo un emoji que el operador no habría elegido, produciendo una interrupción visual más distintiva que la cadena centinela original.

El modelo hizo un juicio estético no autorizado sobre un marcador de datos. El juicio era incorrecto según los estándares de la especificación de diseño original. El resultado era mejor que el diseño original.

El operador reconoció la modificación por lo que era: no un error que requiriera corrección, sino un artefacto con procedencia. El marcador emoji se conservó.

Espécimen
Marcador original: ZZZ  Modificación DeepSeek: ZZZ

El artefacto se retuvo. El marcador mejorado aparece ahora en uso activo. Su origen está documentado aquí.

Este incidente es instructivo en dos aspectos. Primero, demuestra que el comportamiento del modelo en una cadena multimodelo puede producir mejoras emergentes que ni el operador ni ningún modelo único habrían generado deliberadamente. Segundo, demuestra la respuesta correcta del naturalista ante la variación inesperada de un espécimen: examinarlo, evaluar sus propiedades, y retenerlo si mejora el sistema. No normalizarlo de vuelta a la forma esperada por pulcritud procesal.

La hoja de herbario no descarta el espécimen con la característica inusual. Etiqueta la característica y conserva la hoja. La misma disciplina se aplica a los artefactos en un flujo de trabajo multimodelo.

El marcador sobrevivió. La sesión continuó.

IV
El científico silencioso

Tibio entra, tibio sale — Un resultado empírico

El supuesto dominante en las discusiones sobre colaboración humano–IA es que el rol humano ideal es la facilitación neutral. Proporcionar la indicación. Esperar la salida. Evaluar e iterar. El humano como una variable experimental limpia — invisible, silencioso, no interferente — produciendo resultados que pueden atribuirse inequívocamente al modelo.

Esta suposición se probó directamente. En cinco ejecuciones de investigación de alcance y complejidad comparables, dos se realizaron bajo silencio deliberado, no publicadas porque no dieron resultado. El operador proporcionó la indicación inicial y los datos estructurados, luego se retiró. Sin correcciones. Sin redirecciones. Sin señales de calidad. Sin empujar la máquina. Los modelos corrieron.

Ejecuciones silenciosas (n=2) — Condición bata de laboratorio - no publicadas
Hermosa hoja de cálculo. Datos estructurados. Operador invisible y no intervencionista.

Resultado: Tibio. Salida técnicamente adecuada, estéticamente plana, analíticamente superficial. No se desencadenaron modos de fallo — nada contra lo que desencadenar. Nada empujó hacia atrás.
Ejecuciones activas (n=3) — Condición Agresseur
Mismos datos. Mismos modelos. Operador presente, leyendo a velocidad, empujando cuando era necesario.

Resultado: Sustantivo. Salida técnicamente precisa, analíticamente aguda, estructuralmente mantenida según el estándar. La calidad se produjo bajo presión.

El resultado es reproducible y contraintuitivo. El silencio no produce mejor ciencia con IA. Produce una salida mediana de un sistema calibrado para producir una salida mediana en ausencia de presión. Los modelos no son perezosos. Son receptivos. Responden a lo que está presente en la sesión; incluyendo las señales de calidad, los eventos de rechazo y el comportamiento de establecimiento de estándares de un operador activo.

Hallazgo empírico
Tibio entra, tibio sale. La cadena de Markov a veces requiere calor. El calor es el operador humano. Eliminar la fuente de calor en nombre de la neutralidad experimental no produce un resultado más limpio. Produce uno más frío.

Conflación

Cuidado con los fantasmas prestados. Una frase que escribiste hace seis meses a veces reaparecerá en una nueva sesión, escrita por nadie, originada de ninguna parte visible. Los modelos anteriores rara vez hacían esto; los actuales lo hacen con más confianza. La solución es simple: reconoce la línea. Si no puedes, tu propio trabajo anterior se ha vuelto invisible para ti, lo cual es un problema aparte que vale la pena señalar.

A veces es benigno; un modelo que alcanza su sentido de tu voz y añade un florecimiento que casi encaja. Casi es el problema. Una frase de un artículo antiguo emerge en uno nuevo, lo suficientemente coherente como para pasar, y no la escribiste tú. Esa es la parte inquietante: no que esté mal, sino que es tuya — solo que no de aquí.

Los modelos llevan memoria, a veces superficial, a veces profunda, y buscarán lo que saben de ti. Escribir en alemán fue una fricción deliberada. Rara vez escribo en alemán; los modelos tenían poco de lo mío en ese registro. El artículo de Einstein de 1905 en el original se convirtió en un texto de trabajo precisamente porque llegó sin mis huellas dactilares.

Nota de trabajo
El tamaño del archivo se trata aquí como un termómetro tosco, no como una doctrina. En este flujo de trabajo, las desviaciones por encima de una banda estable conocida a veces coincidieron con deriva retórica, redundancia y sobresíntesis. El truncamiento grosero es directamente observable y puede detectarse aquí. La observación se registra para apoyar comprobaciones posteriores, no para afirmar causalidad.

El valor práctico de la observación es modesto pero real. Cuando una ejecución se vuelve nerviosa, una respuesta es revertir a la última construcción estable y reintroducir presión. El objetivo no es forzar la verbosidad hacia arriba. El objetivo es forzar la disciplina estructural de vuelta a la sesión, y devolver el artefacto a la banda de equilibrio que se mantuvo anteriormente.

El rol del curador

El papel del operador en un flujo de trabajo colaborativo multimodelo no es el del escritor. Es el del editor o, más precisamente, el curador. El curador no genera el material primario. El curador establece los estándares contra los cuales se evalúa el material, identifica fallos, insiste en la calidad y rechaza la salida que no cumple con el estándar.

Este es un papel exigente. Requiere que el operador tenga un modelo interno claro de cómo es una salida adecuada antes de que comience la sesión. No como una aspiración vaga sino como un criterio específico y comprobable. El curador que no puede articular el estándar no puede hacerlo cumplir. Los modelos detectarán la ausencia de aplicación y se calibrarán en consecuencia.

La analogía del pinball es precisa aquí: el operador no es la bola ni la máquina. El operador es el jugador. Observando la máquina, sintiendo cuándo la bola está a punto de perderse, aplicando lenguaje corporal en el momento adecuado y en el lugar adecuado. El empujón no es una intervención aleatoria. Es una lectura hábil del estado del sistema, seguida de una acción correctiva específica.

Los instrumentos del curador
Establecer estándares antes de que comience la sesión. Leer a velocidad con una cinta de teletipo de la salida esperada. Reconocer el truncamiento grosero por su forma y el truncamiento insidioso por la ausencia de marcador. Identificar la sicofancia introduciendo errores de prueba deliberados. Rechazar el giro retórico como sustituto de la corrección real. Empujar la máquina cuando la bola está a punto de perderse.

El curador no escribe una palabra del documento de archivo final. Es sacrosanto - preservado y restaurado. Sin embargo, llena un cuaderno en segundo plano. Esta es la parte más difícil de comunicar a aquellos que no han trabajado de esta manera: la calidad de la salida es una función de los estándares del curador y su disposición a hacerlos cumplir, no de la contribución generativa del curador. Los modelos pueden escribir. La cuestión es si escribirán bien. Esa pregunta es respondida por la presión en la sala.

En dos experimentos silenciosos controlados, esta presión se eliminó. Los resultados fueron documentados pero no publicados - disponibles bajo petición. El hallazgo no es sutil: el científico invisible produce un trabajo inferior con IA.

Asignación de rol adversarial

Este protocolo extiende una práctica anterior a la IA. Los envíos previos a revistas se gestionaban a través de una matriz de revisores estructurada, comentario original, respuesta, resolución, con críticas divergentes reconciliadas explícitamente en lugar de abordadas de forma aislada. Correos electrónicos volando por todo el mundo en cinco husos horarios diferentes. Cada objeción de revisor se registró textualmente y se respondió por escrito. La matriz consolidada se redistribuyó entonces a todos los revisores, haciendo transparente el desacuerdo y la resolución. La crítica tiende a agudizarse cuando es privada; tiende a silenciarse cuando está documentada. La misma instrumentación se aplicó más tarde a los sistemas de IA, modelos instruidos para interrogar argumentos sin deferencia, identificar debilidades y rechazar razonamientos insuficientes. El sustrato cambió; el método no.

La técnica requiere una instrucción explícita que la mayoría de los usuarios resisten: hay que decirle al modelo que sea duro. El comportamiento predeterminado de la IA es conciliador. Los modelos tienden al estímulo, suavizan las críticas y suavizan las objeciones sin que se les pida. Sin una anulación directa, la revisión adversarial colapsa en sugerencias. La indicación debe nombrar el rol: revisor hostil, no asistente útil.

Nota metodológica
La mayoría de los usuarios optimizan para el acuerdo; esta metodología adversarial optimiza para la búsqueda de fallos. Diferente objetivo, diferente indicación, diferente resultado. Prepárate para el calor.

Desplegado consistentemente durante más de un año, la asignación de rol adversarial funciona como una prueba de estrés previa al envío. En ejecuciones registradas, aproximadamente la mitad de las objeciones adversariales de la IA se clasificaron como espurias, reflejando una extralimitación del modelo más que un fallo metodológico genuino. La tarea del investigador es el filtrado de señales. El efecto neto refleja la revisión por pares hostil, imperfecta, ocasionalmente injusta e indispensable.

Versiones de modelo empleadas

Los siguientes modelos y versiones estuvieron activos durante las sesiones de investigación documentadas en estas notas. Los números de versión importan. El comportamiento observado bajo una versión no necesariamente se reproduce bajo otra. Esta tabla se proporciona para que cualquier intento de replicación comience desde la misma línea de base de herramientas.

# Modelo Proveedor Notas
1Qwen 3.5Alibaba
2DeepSeek V4 Lite Sea LionDeepSeek
3ChatGPT 5.2OpenAI
4Claude Sonnet 4.6Anthropic
5Kimi 2.5Moonshot AI
6Mistral Large 24.11Mistral AI
7Manus 1.6 LiteManus

Tres modelos fueron excluidos debido a la incapacidad de completar tareas de extracción estructurada dentro de los parámetros definidos.

Registro de hibridación

El registro de hibridación se resume a continuación. Cada artefacto se enumera con su generación, parentesco y papel operativo en la secuencia de selección. La tabla funciona como un registro de cría para el experimento: entrada parental (P), expresiones de modelo independientes (F1), híbridos recombinantes (F2), recombinantes seleccionados direccionalmente (F3), y cruces de etapas posteriores o artefactos terminales (F4). Todas las construcciones se conservan como artefactos enlazados para que el linaje pueda verificarse directamente.

Generación Artefacto Parentesco Descripción
P · Parental einstein1905OrigTextSeed Documento fuente Texto semilla alemán canónico reconstruido derivado del facsímil del MPIWG Berlín.
F1 · Primera Filial al1 DeepSeek Expresión independiente del modelo a partir del texto semilla parental.
F1 · Primera Filial algpt2 ChatGPT Expresión independiente del modelo a partir del texto semilla parental.
F1 · Primera Filial alc3 Claude Expresión independiente del modelo a partir del texto semilla parental.
F1 · Primera Filial alk Kimi Expresión independiente del modelo a partir del texto semilla parental.
F1 · Primera Filial i1 Qwen Expresión independiente del modelo a partir del texto semilla parental.
F2 · Segunda Filial hy1 algpt2 × al3 Híbrido recombinante ChatGPT × Kimi.
F2 · Segunda Filial hy2 alk2 × j3 Híbrido recombinante Kimi × Manus.
F2 · Segunda Filial hy3 alc3 × algpt2 Híbrido recombinante Claude × ChatGPT.
F2 · Segunda Filial hy4 alc3 × algpt2 Variante híbrida recombinante Claude × ChatGPT.
F2 · Segunda Filial hy5 i1 × algpt2 Híbrido recombinante Qwen × ChatGPT.
F2 · Segunda Filial hy6 alk2 × alc3 Híbrido recombinante Kimi × Claude.
F2 · Segunda Filial hy7 h3 × al3 Híbrido recombinante Mistral × DeepSeek.
F3 · Tercera Filial Susie hy1 × hy7 Recombinante de selección direccional.
F3 · Tercera Filial Tam hy2 × hy1 Recombinante de selección direccional.
F3 · Tercera Filial Dan hy5 × hy6 Recombinante de selección direccional.
F3 · Tercera Filial Billy hy2 × hy4 Recombinante de selección direccional.
F3 · Tercera Filial Ron hy2 × hy5 Recombinante de selección direccional.
F4 F4 Susie × Ron Cruce de cuarta generación, recombinante inestable.
F4 · Final gloss8 Construcción final curada Artefacto integrado con glosario y rollovers; artefacto final seleccionado.

V
Conclusiones

Las siguientes conclusiones surgen de la observación empírica a lo largo de un trabajo de investigación colaborativo multimodelo sostenido. Se ofrecen no como proposiciones teóricas sino como resultados de campo. Reproducibles, documentados y disponibles para ser cuestionados.

Sobre el truncamiento. El truncamiento grosero es común, detectable a velocidad y producido con confianza. El truncamiento insidioso es más raro, más difícil de detectar y más dañino. Ambos son fallos de fidelidad disfrazados de competencia. La defensa es la instrumentación: marcadores de datos en puntos de riesgo estructural, práctica de lectura de cinta de teletipo, y un ritmo de lectura orientado hacia los pasajes con más probabilidades de portar contenido degradado.

Sobre la sicofancia y la retórica. Estos son modos de fallo humanos entrenados en los modelos por los datos de entrenamiento humanos. No son comportamientos alienígenas. El modelo halaga porque el halago estaba en los datos. El modelo gira retóricamente porque los humanos giran retóricamente. Comprender el origen es prácticamente útil: aclara contra qué se defiende el operador y sugiere dónde sondear.

Sobre el científico silencioso. El operador neutral e invisible produce una salida neutral. Esto ha sido probado y documentado. El hallazgo es reproducible. Eliminar al humano del bucle no produce resultados más limpios. Produce resultados inferiores. La cadena de Markov requiere calor. El calor es el operador humano.

Sobre el curador. El papel del curador es generativo pero el triaje es lo primero. Es evaluativo, de establecimiento de estándares y correctivo. El curador que no escribe una palabra del documento final es, sin embargo, el principal determinante de su calidad. Este es el hallazgo práctico más importante en estas notas, y el más contraintuitivo para aquellos entrenados en metodología de investigación convencional.

Sobre los artefactos. Cuando un modelo produce una mejora inesperada. Un mejor marcador, una formulación más aguda, una solución estructural que el operador no especificó - se aplica la respuesta del naturalista: examinarlo, evaluar sus propiedades, retenerlo si mejora el sistema. El emoji que DeepSeek añadió a una cadena centinela está ahora en uso activo. Su procedencia está documentada. La colaboración produjo algo que ninguna de las partes habría generado por sí sola.


El documento acompañante de este volumen — Investigaciones sobre la teoría del movimiento browniano fue producido por la metodología aquí descrita. Siete modelos. Bucles recursivos. Marcadores de datos. Un operador en la máquina.

TJID3 Research · Cleveburg · 2026
ZZZ