書簡 · 方法論の実演

人間が統率するマルチモデル収束：Чысты

人間の編集的方向性のもと、協調的なAIモデル群によって制作された、ボルツマン（1872年）のための読者用コンパニオン

ティモシー・M・ジョーンズ · TJID3リサーチ · 2026

ルートヴィッヒ・ボルツマンがH定理の証明を発表したのは1872年のことである。記法は場当たり的であり、証明戦略は前例がなく、物理学的な含意はあまりに急進的だったため、同時代の人々はその後何十年もそれに異議を唱え続けた。添付の文書は、その論文の299ページから306ページまでを完全に注釈付きで読めるようにしたもので、ウェブブラウザさえあれば誰でもその6ページを読み解けるようにするために制作された。

主要概念

認知的孤雌生殖

人間が作曲者ではなくキュレーターとして機能し、再帰的なAIコラボレーションを通じて複雑な知的成果物を生成すること。

キュレーター的著者性

コンテンツ制作は、戦略的方向付け、評価、洗練、そして成果物の完全性の維持から構成された。キュレーターは注釈を付け、構造化し、翻訳し、または作品を安定化させることはあっても、一次文書を書き換えることはない。

再帰的合成

AIモデルが互いの出力に基づいて、指示された改善の連鎖の中で構築していく反復的プロセス。

沈黙の人間アグレッサー

成果物の完全性を損なうことなく、トーン、厳密な調査、編集管理を通じてモデルに圧力をかけるキュレーターの役割。

• • •

最終成果物

尋問可能な読者用コンパニオン

Ollama · Qwen3 · 生まれながらに離乳済み

方法

この書簡は、ボルツマンの1872年の証明の第II節への注釈付き読者ガイドである、併置作品を紹介するものである。これは私の編集方向のもと、AI支援による復元を通じて制作されたが、その方法は単純なプロンプトの連鎖以上のものであった。私は電話交換手のように振る舞い、結果をフィードバックし、異なるシステム間（Claude、DeepSeek、Kimi、Manus、ChatGPT、そしてローカルのOllamaモデル）のやり取りを促進した。

明確にしておくが、モデルたちがボルツマンを書いたわけではない。書いたのは彼である。1872年の証明の原文は彼のものであり、それを無傷で保つことは絶え間ない規律を要した。人間のフィードバックで訓練されたモデルは、自分たちが触れる権利のない散文を滑らかにしようとする。そのテキストの周りに構築された注釈装置は協調的であり、キュレーターとモデルの間のタッグチームであった。この書簡はどちらでもない。

この種の作業には確立された方法が存在せず、それが実際には重要だった。作業が行われている最中にプロセスを構築しなければならず、その状況はしばしば不安定で、即興的で、事後的にきれいに説明するのが難しかった。マルチモデルコラボレーションは、実際に重要なレベル、つまり、どのモデルがどの他のモデルと、どのような条件下で、どのような順序で、どのようなキャリーオーバーを持って、そしてパスの間にどのような人間の介入があったのか、という点について、ほとんど文書化されていないままだ。その手続き上の現実が成果物を形成した。ワークフローは当初、認知的孤雌生殖と名付けられた。直接的な作曲を伴わない再生産であり、人間の役割はタイポグラフィ的というよりキュレーター的である。しかし、より完全な真実は、そのラベルが示唆するよりも無菌的ではない。単一のモデルが結果を生み出したわけではない。それは、協調的なやり取り、繰り返される故障、回復、経路変更、そして判断を通じて出現し、人間は編集者、調停者、そして最終的な権威として機能した。時には、そのプロセスは制御されたパイプラインというよりは、故障したトラックの周りで行われるシルク・ドゥ・ソレイユのように感じられた。それでも動いており、依然として不安定で、成功させるのは容易ではなかった。AIは基盤であって、権威ではなかった。

方法は単純明快である。あるモデルによって草稿が生成される。その出力は、改訂のために第二のモデルに渡される。改訂された出力は第三のモデルに渡されるか、新しい指示とともに以前のモデルに戻される。各段階で、キュレーターは結果を評価し、受け入れ、拒否し、または方向を変える。モデルたちは互いに直接的で、時折競争的であったが、大部分は協調的だった。人間はトーンと方向性を通じて温度を設定した。失敗、切り詰め、誤解、拒否は、隠蔽されず文書化される。

図1. 時系列で示したマイルストーンビルド。X軸は2月11日（正午）から2月16日（夕方）までの時間の進行を示す。小さな点は反復的なビルドを表し、暖色系の縁取りのある大きな円は71–77 KBに収束した成熟ビルドを示す。

実用的な制約が最初から範囲を形作った。完全な論文を一度にモデルに与えると、一貫して出力が停滞するか、品質が低下した。大規模なオントロジーJSONを処理している間に開発された解決策は、チャンク化であった。つまり、入力を扱いやすい単位に分割し、各境界で作業中のスキーマ（コンテクスト、以前の出力、構造マーカーを含む）を再注入するというものである。第II節は編集上の選択ではなく、これらの条件下で安定していた最大の単位であった。このチャンク化と再注入の手法は、明示的に記述されることはほとんどないが、大規模で構造化されたペイロードを含む複雑なマルチモデルワークフローには、運用上不可欠である。したがって、このプロセスは自律的な生成というよりも、反復的な編集レビューに似ている。

欺瞞的なほど単純な介入がある。モデルに対して、自分は読み書きができ、モデルが生成するものを読むつもりであると、直接的かつ早期に伝えることである。人間のフィードバックで訓練されたモデルは、ほとんどの出力が低い精査環境に置かれることを学習している。その前提を変えることで、出力が変わる。信頼できる読者が存在するという状況下では、従順本能が和らぐ。

これはパワーバンド（初期の指示が依然として有効なコンテクストウィンドウの実行可能範囲）内でのみ機能する。この範囲は現実のものであり、学習可能である。説明するより習得する方が簡単で、自転車のバランスのようなものだ。セッションが鈍くなり、応答が長くなり、間違った意味で同意見になったときに、その範囲を離れていることに気づく。その時点では、繰り返してはいけない。逃げろ。すべて保存しろ。セッションを閉じろ。新しいセッションを開け。

ベストプラクティスは依然として、一度に一つの変数だけを動かすことだった。地形がわかり、ビルドがクリーンになって初めて、二つの変数を一緒に動かすことができ、時には三つを動かすこともあった。それは綱渡りのような作業だった。可能ではあったが、安全ではなかった。

コンテクストウィンドウ内のモデル挙動に関する上記の観察は、文書化されたセッション、ラベル付けされたトランスクリプト、そしてリアルタイムで記入されたノートブックに基づいている。
ログは存在する。この作業は実際に再現可能であり、著者はそれを共有する用意がある。
観察結果には以下が含まれる：パワーバンド、初期指示の減衰、セッションが長引くにつれての従順性への移行。
アーカイブ作業には、最小限のコンテクストウィンドウで、一度に一つの変数を扱う。
ボルツマンの作業は、本能、ドメイン知識、そして反復によって行われた。そのためのテンプレートは存在しなかった。
これを2年間続けたことは、長いキャリアではない。しかし、何かがうまくいったときにそれを認識するには十分な期間である。
ルールブックはほとんど存在しない。

収束と結果

異なるアーキテクチャアプローチと出発点にもかかわらず、参加した10システムのうち7つが独立して収束し、著しく狭いサイズ範囲の文書を生成した。この収束は、ボルツマンの証明に内在する注釈の複雑さ、すなわちコンテンツが要求する自然な密度を示唆している。

JiangらによるArtificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond)で調査されているようなベンチマーク的なオープンエンドプロンプトとは異なり、本ワークフローはモデルに対して、密度の高いアーティファクト規模のコンテクストと再帰的なクロスモデルリビジョンを提供した。これらの条件下でも、出力はしばしば類似した構造的解決策に向かって収束する傾向があり、モデル間の均質性は、短いオープンエンドな応答だけでなく、長編のキュレーター的ビルドワークフローにおいても持続する可能性を示唆している。

収束ゾーン：7モデルで71–77 KB

2つの外れ値：Geminiは19 KBで途切れ、Manusは53 KBで完了。後期のモデル1つ（GPT-OSS-120B）は60 KB。

図2. 全ビルドのファイルサイズ分布。X軸はキロバイト単位のファイルサイズを示す。各水平ストリップは1つのモデルファミリーを表し、小さな薄い点は初期のイテレーションを、暖色系の縁取りのある大きな円は成熟ビルドを示す。7つのモデルは、異なるアーキテクチャと開発経路にもかかわらず、独立して6キロバイトのウィンドウ（71–77 KB）に収束した。2つの外れ値：Geminiは19 KBで途切れ、Manusは53 KBで完了。この収束ゾーンは、ボルツマンの1872年の証明に内在する注釈の複雑さを示唆している。サイズ収束グラフにはマイルストーンモデルのみが示されており、途切れた実行は表に文書化され、スケールを明確にするために視覚化から除外されている。このパターンは、ソーステキストだけでなく、チャンク化と再注入を部分的に反映している可能性がある。

以下の表は、コンパニオン文書の制作に関与したモデルと、観察されたそれらの貢献を記録したものである。

コンパニオン文書へのモデルの貢献
モデル	成熟ビルド	イテレーション	最終サイズ	ステータス
DeepSeek v3	2月12日午前11:17	2日間で6ビルド (b1→b6)	72 KB	✓ 収束
Gemini 3	2月11日午後0:42	同日に2ビルド	19 KB	✗ 途切れ
Claude 4.6	2月12日午前10:46	2日間で4ビルド (a1→a4)	71 KB	✓ 収束
Kimi 2.5	2月12日午後0:49	一晩で2ビルド (d1→d2)	77 KB	✓ 収束
ChatGPT-5.2	2月13日午前10:36	2日間で2ビルド (e1→e2)	73 KB	✓ 収束
Ollama (DeepSeek V3)	2月14日午前9:23	3ビルド (f1→f2→f4)	71–73 KB	✓ 収束
Ollama (Qwen3)	2月16日午後6:06	単一ビルド	71 KB	✓ 収束
Manus 1.6	2月16日午後3:57	単一ビルド (設定修正)	53 KB	~ 外れ値
GPT-OSS-120B	2月15日午後11:08	単一ビルド	60 KB	~ 外れ値
NotebookLM	2月11日–2月17日	> 20ビルド	~10 KB	✗ 途切れ