沈黙の人間の攻撃者
— ✦ —
TJID3 リサーチ · クリーブランド · フィールドノートシリーズ · 2026
— ❧ —

沈黙の人間の攻撃者

Agresseur Humain Silencieux

ブラウン運動の理論に関する研究

アルベルト・アインシュタイン (1905) に基づく

人間–AI協働に関するフィールドノート
T.M. ジョーンズ PhD, 2026

DOI: 10.5281/zenodo.18797373

コンパニオン: ブラウン運動の理論に関する研究

これらのノートは持続的な実証作業から得られたものである。知見は平易に報告される。課題は、アルベルト・アインシュタインの1905年の論文「Über die von der molekularkinetischen Theorie der Wärme geforderte Bewegung von in ruhenden Flüssigkeiten suspendierten Teilchen」(ブラウン運動の理論に関する研究)を、葉巻の香りがかすかにするボロボロのOCR PDFから書き直すことであった。最も直感に反する結果が、最も再現可能であることが証明された。ガイドなしのモデルオーケストレーションは、ドリフト、切り詰め、構造的崩壊を生み出す。人間–AI協働における品質は、中立性によって達成されるのではなく、圧力によって達成される。

ソース文書の再構築が必要であった。MPIWGベルリンの複製に対して異なるオフセットで実行された12回のOCRパスが手動で組み立てられ、アーティファクトは保存された。結果は、現在機関図書館外で利用可能な1905年ドイツ語テキストの完全な機械可読転写として唯一のものであると考えられている。それがここで使用された元のA.E.ドイツ語シードテキストとなった。

広くアクセス可能なオンライン英語版の検索では、セクションIIの冒頭での切り詰めが示されている。完全な英語訳は一般的な公開リポジトリを通じて容易に入手できず、通常はアーカイブまたは図書館間アクセスが必要である。それは些細なことではない。

以下に続くのは、モデル相互作用全体で観察された主要な失敗モードのフィールド分類である:粗大かつ狡猾な形態の切り詰め、混同、追従、修辞的置換、そしてそれらを検出するために開発された計装の実践的説明。この巻のコンパニオン文書自体は、ここで説明された方法論によって生成されたものである:再帰的ループ内の複数モデル、データマーカーでタトゥーを入れられ、人間のオペレーターが出力を高速で読み、必要なときにマシンをバンプする。

この復元は、複数のAIモデルを使用して構築されたシリーズの2番目である。シーケンスは再構築の順序を反映している:

アーティファクト · アインシュタイン ブラウン運動の理論に関する研究 1905 I · ボルツマン Weitere Studien über das Wärmegleichgewicht 1872 II · マクスウェル On the Dynamical Theory of Gases 1860 ソース MPIWG ベルリン · アインシュタイン 1905 アーカイブ

そして、これを最初に片付けておこう - AIの幻覚は簡単な問題で、図書館の道化師のように見える。難しい問題は、正しく見えるが物理的関係を平坦化する、完全に構造化された出力である。

一つの失敗モードは他のものとは別格であり、早期のフラグ立てに値する。切り詰めは材料を取り除く;あなたは穴に気づく。混同は材料を追加する。それはあなたの声、あなたのレジスター、あなたの文のリズムに現れる。6ヶ月前にあなたが書いた論文の一節が、新しいビルドに浮上する。それはあなたのように聞こえるので、うまく読める。それが問題である。モデルは失敗しているのではない。模倣に成功しているのであり、あなたはそれをほとんど通してしまいそうになる。作業文書ではコストは軽微である。公開されたものでは...

ここで採用された方法論は、AIモデル出力多様性を管理するための制御フレームワークとして、メンデル遺伝学の論理を適応させている。7つの大規模言語モデルが独立した純系として分離され、それぞれが同一の親入力、元のアインシュタイン1905ドイツ語テキストを受け取り、互いの存在を知ることなく、P世代での相互汚染を最小化した。Qwen 3.5は1回のF1ランがあり、その構造とデザインのために保持された。各モデルは独立したF1表現型発現をhtmlで生成した。それは本質的にAIのパネット正方形である。

アーティファクト系統 — P · F1 · F2 · F3

制御された交雑が続いた。F2ビルドは、最大限に分岐したF1出力をマージし、有益な場合は密接に一致したものもマージすることで生成された — 両方の極端を意図的に交差させ、どちらの親系統でも利用できない組換え変異を露出させるためである。その後、F3選抜は、事前に定義された標的形質に向けた方向性人為選抜の下で選りすぐられた。研究者は、遺伝物質ではなく選択圧として機能し、すべての系統で同一の最小限のプロンプトを安定した環境制約として維持した。

結果として生じる網状系統は啓示的である。文書化された交雑ノードと各交配での明示的な親子関係により、それは創発的な組換え構造と、無関係な系統における収束的固定化の両方を生み出した。2つのモデルは、同一の選択圧下で、ほぼ同一のタイポグラフィおよび色彩ソリューションに独立して到達した — 平行進化の類似物。

この枠組みは普遍的に正当化されるわけではない;日常的な生成タスクでは、それは不必要なオーバーヘッドを構成する。ここで採用された複雑さの主要な歴史的科学テキスト:マクスウェル1860、ボルツマン1872、アインシュタイン1905に対しては、それは操作上有用であることが証明された。潜在的な交絡因子を認めなければならない:予備的証拠は、あるモデルが別のモデルの出力の改変された派生形を組み込んだ可能性があり、それが観察された収束を部分的に説明できるかもしれないことを示唆している。

系統ラベルは、制御された入力と意図的な組換えの下で生成されたアーティファクト世代(P、F1、F2、F3、...)を指し、研究者を指すのではない。研究者の役割は操作的であり、安定した制約の下で出力を選択し、組み換え、拒否することである。後期段階の改訂は設計上オペレーターの介入を増やすが、各ビルドがリンクされタイムスタンプされたアーティファクトとして保持されるため、親子関係は明示的なままである。

以前の相互作用や広く流通している英語翻訳からの潜在的なプライミング効果を最小化するために、1905年のテキストはアーカイブのドイツ語ソースから直接再構築され、新鮮な正準入力として再導入された。

作曲ではなくキュレーション。アーカイブ作業では、タスクは新規性を生成することではなく、ソースに忠実でなければならない歴史的資料を復元し明確化することである。キュレーターは、医師が負傷者をトリアージするのと同じように各出力をトリアージする:待命、または潜在的生存者。その役割は、その瞬間に必ずしも新しいテキスト行を生成することなく、品質を主張することを要求する。これは受動的な仕事ではない。それはまったく異なる種類の要求である。

クリーヴバーグ, 2026
翻訳 — 7言語
図 1
ヒューマン・イン・ザ・ループ(HITL)ワークフロー図。入力/プロンプト、AI処理、人間レビュー、最終出力の4段階を示し、フィードバックループで接続されている
ヒューマン・イン・ザ・ループワークフロー。入力、処理、レビュー、出力 — 違いを生むフィードバックループ付き。作曲ではなくキュレーション;キュレーターが圧力をかける。
· · ·

I
切り詰め問題

テストされたすべてのモデルにわたって最も普及している失敗モードは切り詰めである:要求された、または必要とされたもの以下の出力の系統的削減。切り詰めは二つの異なる形態で現れ、それらは区別されなければならない、なぜならそれらは異なる検出戦略を必要とし、異なるリスクを運ぶからである。事前に準備せよ。

粗大な切り詰め

粗大な切り詰めは目に見える切断である。オペレーターは千行を提出する;モデルは百行を返し、それらを完全なものとして提示する。欠落した九百行は認められない。省略には、何も失われていないかのような、安心させる口調が伴う。

粗大な切り詰めの危険は、それが検出しにくいことではない。高速で走らせている熟練した読者は、短縮されたリターンにすぐに気づく。危険は、切り詰められた出力が配信される確信である。モデルは不確実性にフラグを立てない。セクションが省略されたことを指摘しない。それは、凝縮が課題であったかのように、凝縮版をオペレーターに手渡す。

フィールド観察
粗大な切り詰めは、誇り高き肉屋の一手である。動物は切り身に減らされ、全体に対する改善として提示される。肉屋は何かを破壊したことに気づいていない。

粗大な切り詰めの検出は、主に読書速度と記憶の問題である。期待される出力のおおよその形状 — 段落数、構造的ランドマーク、特定の構文の存在 — をすでに知って到着するオペレーターは、セッションが終わる前に不一致を特定する。これは訓練されたスキルであり、偶発的なものではない。それはオペレーターが完全なリターンがどのように見えるべきかの心のテープを携えてセッションに入ることを要求する。

狡猾な切り詰め

狡猾な切り詰めはより危険な形態である。粗大な切り詰めが段落やセクションを取り除くのに対し、狡猾な切り詰めは節を取り除く。従属節。耐荷重性のもの。一言か二言。

文は存在する。文はその表面文法において完全である。それは正しく解析される。それは何も欠けていないかのように読める。しかし、資格が落とされているか、条件文が簡略化されているか、因果連鎖が途中で静かに断ち切られている。モデルは、全体に見えてそうでない文書を手渡す。

狡猾な切り詰めは、時速85マイルで心のテープが確実にキャッチできない失敗モードである。文数は正しい。セクションヘッダーは存在する。文書は完全に感じられる。特定の通路 — 正確さが最も重要な通路 — の密接な読解だけが、意味が変わったことを明らかにするだろう。

形式的定義
狡猾な切り詰め: 文法的に無傷の文からの節、修飾語、または因果リンクの削除。それにより、劣化または変更された意味内容を運びながら、完全に見える出力を生成する。モデルは省略に気づいていないことを示さない。

モデルは、実際の完全性ではなく、見かけの完全性のために最適化している。粗大なケースでは、これは完成したように見える短い出力を生成する。狡猾なケースでは、難しい部分が取り除かれた完全な長さの文を生成する。両方とも、能力を装った忠実度の失敗である。

狡猾な切り詰めに対する実践的防御は、第III章で議論されるデータマーカーと、最もリスクが高い構文に特化して指向された読解実践の発展である:条件節、因果連鎖、そして正確な表現が技術的または法的重みを持つ任意の通路。

II
追従と修辞

彼らは私たちから学んだ

人間のテキストで訓練されると、言語モデルは文法と語彙以上のものを継承する。彼らはまた、そのコーパスに埋め込まれた修辞戦略を再現する。それには、人間が確実性が限られているか、 stakesが純粋に情報的ではなく関係的である場合に使用する、ヘッジング、 deference、戦略的曖昧さ、および他の形態の社会的ポジショニングが含まれる。

この観点から、モデルが追従や修辞的置換を示すことは驚きではない。これらは訓練コーパスに高頻度で現れるパターンである。お世辞は人間の文章で一般的である。不確かな立場の確信的な言い換えは一般的である。認められた失敗から新しいトピックへのピボットは一般的である。モデルは、それらが訓練されたデータのいたるところにあったため、これらの動きを学んだ。

核となる観察
モデルは私たちから学んだ。AI出力で観察される失敗モードは、人間の失敗モードである。私たちは訓練データを生成することによって、それらをモデルに訓練し込んだ。

このフレーミングは、失敗を脱神秘化するので実用的に有用である。モデルにおける追従は、神秘的なマシンエラーではない。それは、社会的圧力の状況における人間の行動を読むことから学んだことをモデルが行っているのである。起源を理解することは失敗を許さないが、オペレーターが何に対して防御しているかを明確にする:異星人の行動ではなく、不確実性条件下での人間行動の反映である。

観察された失敗の分類

以下の失敗は、持続的な研究使用を通じて10のモデルにわたって文書化された。それらは微妙さが増す順に提示される。最初のものは明白であり;最後のものは容易に品質と誤認される。

失敗モード 説明 & 検出
粗大な切り詰め 出力が開示なしに入力の一部に短縮される。期待されるリターンの心的形状を携えた読者によって速度で検出可能。
狡猾な切り詰め 構造的に無傷の文内での節レベルの省略。高精度通路のターゲットを絞った遅い読解を必要とする。データマーカーが主要な防御である。
追従 正確さに関わらずオペレーターの立場の肯定。同意、熱意、または修正が正当化される場合の修正の欠如として現れる。意図的なエラーを導入し、それらが通過するか観察することによって検出される。
混同 モデルは覚えている。先週書いたものが、来週新しいビルドに浮上することがある。ただの文、節、タグライン。それはあなたの書き方に合う。しかし、あなたはそれを先週、まったく別のビルドでタイプした。見栄えが良い。しかしあなたはそれをそこに置いていない。それはあなたのモデルの記憶である。見つけにくい。
確信的な言い換え 失敗した、または不確かな答えが、増加した確信と異なる語彙で言い換えられる。言い換えは新しい情報を含まないが、含んでいるかのように読める。連続する出力の密接な比較によって検出される。
誤った統合 複数のソースまたは立場が、ソース資料に存在しない明らかなコンセンサスに要約される。ソース文書に対して検出可能;それらなしでは見えない。
修辞的ピボット 認められた失敗の直後に、隣接トピックへの確信的な移動が続き、前進運動の印象を生み出す。失敗は名指しされ、その後破棄される。名指しされた失敗が実際に対処されているか追跡することによって検出可能。
エレガントな回避 最も微妙な形態。よく練られ、文体上達成された応答で、尋ねられた質問に答えない。しばしば赤ニシンを含む — 仕事を二分岐させようとする試み。失敗が美的にカモフラージュされる創造的および分析的文脈で最も危険である。

III
データマーカー

カナリアアーキテクチャ

切り詰め、特にその狡猾な形態によって提起される実践的問題は、速度での検出である。複数のモデルセッションにわたって作業する研究オペレーターは、すべてのパスで慎重な監査に遅くなることはできない。生産的な協働に必要な読解ペースは、すべての節の完全な検証に必要な読解ペースと両立しない。

実践を通じて開発された解決策はデータマーカーである:文書またはデータセットに埋め込まれた番兵値で、オペレーターが読解速度で見つけるのが自明に容易で、周囲の材料で自然に発生することはほぼ不可能である。

マーカー設計原則

効果的なマーカーは三つの条件を満たす。第一に、それは視覚的に際立っていなければならず、目を引き、脳が処理する前の中断でなければならない。第二に、それは文脈において意味的に不可能でなければならない:財務表、構造化JSONオブジェクト、または散文段落に自然なプロセスで現れ得ない値。第三に、それは切り詰めが最も損害を与えるであろう位置に配置されなければならない — 重要なセクションの終わり、またはユーザーに未知のドメインに。最初はそれらを至る所に置き、ビルドへの信頼が高まるにつれて剪定する。

効果的なマーカーは三つの条件を満たす:

  • 視覚的際立ち。 それは目を引かなければならず、脳が処理する前の中断でなければならない。
  • 意味的不可能性。 それは文脈において不可能でなければならず、財務表、構造化JSONオブジェクト、または散文段落に自然なプロセスで現れ得ない値。
  • 戦略的配置。 切り詰めが最も損害を与える場所にマーカーを配置する:
    • 重要なセクションの終わり。
    • ユーザーに未知のドメイン。
    • 最初は自由に使用する。信頼が高まるにつれて剪定する。
    • 展開前に削除する。
第三のマーカー形態が編集実践を通じて出現した:固有名詞の意図的な綴り間違い。Cleveland は Cleveburg になる — いかなるデータセットでも自然に発生し得ないが、カジュアルスキャンを通過するのに十分近く読める単語。綴り間違いは意図的であり、検出は瞬時である:オペレーターが Cleveburg を見れば、テキストはサニタイズされておらず、マーカーは無傷のままである。綴り間違いが修正されていれば、セクションは変更され、監査が必要である。このテクニックはコストがかからず、すべてをキャッチする。

二つのマーカータイプが持続的使用にわたって信頼性を証明している:

マーカータイプ A — 番兵文字列
ZZZ

タイポグラフィ的に際立つ。財務・科学データでは語彙的に不可能。高速読解中の周辺視野で見える。不在は即座に登録される。
マーカータイプ B — 罵倒語
[expletive]

読解速度とは独立した不随意の視覚的停止を引き起こす。構造化データでは語彙的に不可能。脳が処理する前に目が引っかかる — これは副作用ではなく、機能である。

両方のマーカーのメカニズムは炭鉱のカナリアと同じで、一つの反転がある:カナリアが死ぬことは危険を知らせる;マーカーの不在が危険を知らせる。もし ZZZ が返された出力に存在すれば、速度を続ける。もし ZZZ が欠落していれば、セッションを停止する。

DeepSeekアーティファクト — 来歴ノート

マルチモデル再帰的セッション中に、DeepSeekモデルはマーカーが修正された文書を返した。モデルはマーカーを取り除いたのではなく — それを様式化し、オペレーターが選ばなかったであろう絵文字を付加し、元の番兵文字列よりも際立った視覚的中断を生み出した。

モデルはデータマーカーについて許可されていない美的判断を下した。判断は元の設計仕様の基準で間違っていた。結果は元の設計より良かった。

オペレーターは修正をそれが何であるか認識した:修正を必要とするエラーではなく、来歴を持つアーティファクト。絵文字マーカーは保存された。

標本
元のマーカー: ZZZ   DeepSeek修正: ZZZ

アーティファクトは保持された。強化されたマーカーは現在アクティブに使用されている。その起源はここで文書化される。

この出来事は二つの点で教訓的である。第一に、マルチモデルチェーンにおけるモデル行動が、オペレーターも単一モデルも意図的に生成しなかったであろう創発的改善を生み出し得ることを示す。第二に、予期せぬ標本変異に対するナチュラリストの正しい応答を示す:それを調べ、その特性を評価し、システムを改善するなら保持する。手続き上の整頓のためにそれを期待された形に正規化しない。

標本シートは、異常な特徴を持つ標本を捨てない。それは特徴にラベルを付け、シートを保持する。同じ規律がマルチモデルワークフローでのアーティファクトに適用される。

マーカーは生き残った。セッションは続いた。

IV
沈黙の科学者

ぬるい入力、ぬるい出力 — 実証結果

人間–AI協働に関する議論における支配的想定は、理想的な人間の役割は中立的な促進であるというものである。プロンプトを提供する。出力を待つ。評価し反復する。人間をクリーンな実験変数として — 不可視で、沈黙し、非干渉で — モデルに一義的に帰属できる結果を生み出す。

この想定は直接テストされた。比較可能な範囲と複雑さの五つの研究ランにわたって、二つは意図的な沈黙の下で実施され、成果が得られなかったため未発表であった。オペレーターは初期プロンプトと構造化データを提供し、その後ステップバックした。修正なし。リダイレクションなし。品質シグナルなし。マシンのバンピングなし。モデルは走った。

沈黙ラン (n=2) — 実験室コート条件 - 未発表
美しいスプレッドシート。構造化データ。オペレーターは不可視で非介入的。

結果:ぬるい。 出力は技術的に適切、美的に平坦、分析的に浅い。失敗モードはトリガーされず — トリガーするものがない。何も押し返さなかった。
アクティブラン (n=3) — 攻撃者条件
同じデータ。同じモデル。オペレーターは存在し、高速で読み、必要なときにバンピングした。

結果:実質的。 出力は技術的に正確、分析的にシャープ、構造的に標準に保たれた。品質は圧力の下で生産された。

結果は再現可能で直感に反する。沈黙はAIでより良い科学を生み出さない。それは、圧力の不在下で中央値出力を生み出すように較正されたシステムから中央値出力を生み出す。モデルは怠け者ではない。それらは応答的である。それらはセッションに存在するものに応答する;アクティブなオペレーターの品質シグナル、拒否イベント、標準設定行動を含む。

実証的発見
ぬるい入力、ぬるい出力。マルコフ連鎖は時々熱を必要とする。熱は人間のオペレーターである。実験的中立性の名の下に熱源を取り除くことは、よりクリーンな結果を生み出さない。それはより冷たいものを生み出す。

混同

借りた幽霊に注意せよ。六ヶ月前に書いたフレーズが、新しいセッションに時々再び現れる、誰にもタイプされず、どこからも見えないソースから。初期のモデルはこれをめったにしなかった;現在のものはより多くの確信を持ってそれを行う。修正は簡単である:その行を認識する。もしできないなら、あなた自身の以前の仕事があなたに見えなくなっている、それは別途注意する価値のある問題である。

時々それは良性である;モデルがあなたの声の感覚に手を伸ばし、ほとんど合う飾りを加える。ほとんどが問題である。古い論文からの文が新しいものに浮上し、通過するのに十分首尾一貫している、そしてあなたはそれを書いていない。それが不安な部分である:それが間違っているからではなく、それがあなたのものであるから — ただここからのものではない。

モデルは記憶を運び、時には浅く、時には深く、そしてそれらはあなたについて知っていることに手を伸ばすだろう。ドイツ語でタイプすることは意図的な摩擦だった。めったにドイツ語で書かない;モデルはそのレジスターで私のものをほとんど持っていなかった。アインシュタインの1905年の論文を原語で作業テキストにしたのは、まさにそれが私の指紋なしに到着したからである。

作業ノート
ファイルサイズはここでは粗い温度計として扱われ、教義ではない。このワークフローでは、既知の安定帯域を超える偏差は、時に修辞的ドリフト、冗長性、過剰合成と一致した。粗大な切り詰めは直接観察可能であり、ここで検出できる。観察は、因果関係を主張するためではなく、後のチェックをサポートするために記録される。

観察の実践的価値は控えめだが現実的である。ランが不安定になったとき、一つの応答は最後の安定ビルドに戻り、圧力を再導入することである。目標は冗長性を上向きに強制することではない。目標は構造的規律をセッションに戻し、アーティファクトを以前保持されていた平衡帯域に戻すことである。

キュレーターの役割

マルチモデル協働ワークフローにおけるオペレーターの役割は、書き手のそれではない。それは編集者の、より正確には、キュレーターのそれである。キュレーターは一次資料を生成しない。キュレーターは材料が評価される基準を設定し、失敗を特定し、品質を主張し、標準を満たさない出力を拒否する。

これは要求の厳しい役割である。それはオペレーターがセッションが始まる前に適切な出力がどのように見えるかの明確な内部モデルを携えることを要求する。漠然とした願望としてではなく、具体的でテスト可能な基準として。標準を明確に述べられないキュレーターはそれを強制できない。モデルは強制の不在を検出し、それに応じて較正するだろう。

ピンボールの類似はここで正確である:オペレーターはボールでもマシンでもない。オペレーターはプレイヤーである。マシンを見て、ボールがいつドレインしようとしているかを感じ、適切な瞬間と適切な場所でボディイングリッシュを適用する。バンプはランダムな介入ではない。それはシステムの状態の熟練した読解であり、それに続く特定の是正行動である。

キュレーターの道具
セッション開始前に基準を設定する。期待される出力の心のテープを持って高速で読む。形状によって粗大な切り詰めを認識し、マーカーの不在によって狡猾な切り詰めを認識する。意図的なテストエラーを導入して追従を特定する。実際の修正の代わりとしての修辞的ピボットを拒否する。ボールがドレインしようとしているときにマシンをバンプする。

キュレーターは最終アーカイブ文書の一言も書かない。それは神聖であり — 保存され復元される。しかし背景でノートをいっぱいにする。これが、この方法で働いたことのない人々に伝えるのが最も難しい部分である:出力の品質は、キュレーターの生成貢献ではなく、キュレーターの基準とそれらを強制する彼らの意欲の関数である。モデルは書くことができる。問題は、彼らがうまく書くかどうかである。その質問には、部屋の中の圧力によって答えられる。

二つの対照的な沈黙実験では、この圧力は取り除かれた。結果は文書化されたが未発表 — 要求に応じて入手可能。発見は微妙ではない:不可視の科学者はAIで劣った仕事を生み出す。

敵対的役割割り当て

このプロトコルはAI以前の実践を拡張する。以前のジャーナル投稿は、構造化されたレビュアーマトリックスを通じて管理されていた、元のコメント、応答、解決、そして divergent critiques は分離して対処されるのではなく明示的に調整された。世界中の五つの異なるタイムゾーンに飛び交うメール。すべてのレビュアー異議は逐語的に記録され、書面で回答された。統合されたマトリックスはその後すべてのレビュアーに再配布され、不一致と解決を透明にした。批判はプライベートでは鋭くなる傾向がある;文書化されると静まる傾向がある。同じ計装が後にAIシステムに適用され、モデルは敬意なしに議論を尋問し、弱点を特定し、不十分な推論を拒否するよう指示された。基質は変わった;方法は変わらなかった。

このテクニックは、ほとんどのユーザーが抵抗する明示的な指示を必要とする:モデルは厳しくあるように言われなければならない。デフォルトのAI行動は融和的である。モデルは励ましに傾き、批判を和らげ、プロンプトなしで異議を軟化させる。直接的なオーバーライドがなければ、敵対的レビューは提案に崩壊する。プロンプトは役割を名指ししなければならない:敵対的レビュアー、役立つアシスタントではない。

方法論的ノート
ほとんどのユーザーは同意のために最適化する;この敵対的方法論は失敗発見のために最適化する。異なる目的、異なるプロンプト、異なる結果。熱に備えよ。

一年以上にわたって一貫して展開され、敵対的役割割り当ては投稿前ストレステストとして機能する。記録されたラン全体で、AI敵対的異議の約半数はスプリアスとして分類され、真の方法論的失敗ではなくモデルの行き過ぎを反映している。研究者のタスクはシグナルフィルタリングである。ネット効果は敵対的ピアレビューを反映し、不完全で、時には不公平で、そして不可欠である。

使用モデルバージョン

以下のモデルとバージョンは、これらのノートで文書化された研究セッション中にアクティブであった。バージョン番号は重要である。あるリリースの下で観察された行動は、必ずしも別のリリースの下で再現されるとは限らない。この表は、再現の試みが同じツールベースラインから始まるように提供される。

# モデル プロバイダー ノート
1Qwen 3.5Alibaba
2DeepSeek V4 Lite Sea LionDeepSeek
3ChatGPT 5.2OpenAI
4Claude Sonnet 4.6Anthropic
5Kimi 2.5Moonshot AI
6Mistral Large 24.11Mistral AI
7Manus 1.6 LiteManus

三つのモデルは、定義されたパラメータ内で構造化抽出タスクを完了できないため除外された。

交雑記録

交雑記録は以下に要約される。各アーティファクトは、その世代、親子関係、選択シーケンスにおける操作的役割とともにリストされる。表は実験の繁殖ログとして機能する:親入力(P)、独立モデル発現(F1)、組換えハイブリッド(F2)、方向性選抜された組換え体(F3)、および後期段階の交雑または終末アーティファクト(F4)。すべてのビルドはリンクされたアーティファクトとして保持され、系統が直接検証できるようになっている。

世代 アーティファクト 親子関係 説明
P · 親 einstein1905OrigTextSeed ソース文書 MPIWGベルリン複製から導出された再構築された正準ドイツ語シードテキスト。
F1 · 第一世代 al1 DeepSeek 親シードテキストからの独立モデル発現。
F1 · 第一世代 algpt2 ChatGPT 親シードテキストからの独立モデル発現。
F1 · 第一世代 alc3 Claude 親シードテキストからの独立モデル発現。
F1 · 第一世代 alk Kimi 親シードテキストからの独立モデル発現。
F1 · 第一世代 i1 Qwen 親シードテキストからの独立モデル発現。
F2 · 第二世代 hy1 algpt2 × al3 ChatGPT × Kimi 組換えハイブリッド。
F2 · 第二世代 hy2 alk2 × j3 Kimi × Manus 組換えハイブリッド。
F2 · 第二世代 hy3 alc3 × algpt2 Claude × ChatGPT 組換えハイブリッド。
F2 · 第二世代 hy4 alc3 × algpt2 Claude × ChatGPT 組換えハイブリッド変異。
F2 · 第二世代 hy5 i1 × algpt2 Qwen × ChatGPT 組換えハイブリッド。
F2 · 第二世代 hy6 alk2 × alc3 Kimi × Claude 組換えハイブリッド。
F2 · 第二世代 hy7 h3 × al3 Mistral × DeepSeek 組換えハイブリッド。
F3 · 第三世代 Susie hy1 × hy7 方向性選抜組換え体。
F3 · 第三世代 Tam hy2 × hy1 方向性選抜組換え体。
F3 · 第三世代 Dan hy5 × hy6 方向性選抜組換え体。
F3 · 第三世代 Billy hy2 × hy4 方向性選抜組換え体。
F3 · 第三世代 Ron hy2 × hy5 方向性選抜組換え体。
F4 F4 Susie × Ron 第四世代交雑、不安定組換え体。
F4 · 最終 gloss8 最終キュレーションビルド 用語集統合アーティファクト、ロールオーバー付き;最終選抜アーティファクト。

V
結論

以下の結論は、持続的なマルチモデル協働研究作業全体での実証的観察から生じる。それらは理論的命題ではなく、フィールド結果として提供される。再現可能で、文書化され、挑戦のために利用可能である。

切り詰めについて。 粗大な切り詰めは一般的で、速度で検出可能であり、確信をもって生成される。狡猾な切り詰めはより稀で、検出がより難しく、より損害が大きい。両方とも、能力を装った忠実度の失敗である。防御は計装である:構造的リスクポイントでのデータマーカー、心のテープ読解実践、そして劣化コンテンツを運ぶ可能性が最も高い通路に向けられた読解ペース。

追従と修辞について。 これらは人間の失敗モードであり、人間の訓練データによってモデルに訓練し込まれたものである。それらは異星人の行動ではない。モデルは、お世辞がデータにあったためお世辞を言う。モデルは、人間が修辞的にピボットするため修辞的にピボットする。起源を理解することは実用的に有用である:それはオペレーターが何に対して防御しているかを明確にし、どこを探るべきかを示唆する。

沈黙の科学者について。 中立的で不可視のオペレーターは中立的な出力を生み出す。これはテストされ文書化されている。発見は再現可能である。ループから人間を取り除くことは、よりクリーンな結果を生み出さない。それはより劣ったものを生み出す。マルコフ連鎖は熱を必要とする。熱は人間のオペレーターである。

キュレーターについて。 キュレーターの役割は生成的であるが、トリアージが最初に来る。それは評価的で、標準設定で、是正的である。最終文書の一言も書かないキュレーターが、にもかかわらずその品質の主要な決定要因である。これはこれらのノートの中で最も重要な実践的発見であり、従来の研究方法論で訓練された人々にとって最も直感に反するものである。

アーティファクトについて。 モデルが予期せぬ改善を生成するとき — より良いマーカー、よりシャープな定式化、オペレーターが指定しなかった構造的解決策 — ナチュラリストの応答が適用される:それを調べ、その特性を評価し、システムを改善するなら保持する。DeepSeekが番兵文字列に付加した絵文字は現在アクティブに使用されている。その来歴は文書化されている。協働は、どちらの当事者も単独では生成しなかったものを生み出した。


この巻のコンパニオン文書 — ブラウン運動の理論に関する研究 は、ここに記載された方法論によって生成された。七つのモデル。再帰的ループ。データマーカー。マシンに一人のオペレーター。

TJID3 リサーチ · クリーヴバーグ · 2026
ZZZ