人間が統率するマルチモデル収束:Чысты
ルートヴィッヒ・ボルツマンがH定理の証明を発表したのは1872年のことである。記法は場当たり的であり、証明戦略は前例がなく、物理学的な含意はあまりに急進的だったため、同時代の人々はその後何十年もそれに異議を唱え続けた。添付の文書は、その論文の299ページから306ページまでを完全に注釈付きで読めるようにしたもので、ウェブブラウザさえあれば誰でもその6ページを読み解けるようにするために制作された。
主要概念
人間が作曲者ではなくキュレーターとして機能し、再帰的なAIコラボレーションを通じて複雑な知的成果物を生成すること。
コンテンツ制作は、戦略的方向付け、評価、洗練、そして成果物の完全性の維持から構成された。キュレーターは注釈を付け、構造化し、翻訳し、または作品を安定化させることはあっても、一次文書を書き換えることはない。
AIモデルが互いの出力に基づいて、指示された改善の連鎖の中で構築していく反復的プロセス。
成果物の完全性を損なうことなく、トーン、厳密な調査、編集管理を通じてモデルに圧力をかけるキュレーターの役割。
方法
この書簡は、ボルツマンの1872年の証明の第II節への注釈付き読者ガイドである、併置作品を紹介するものである。これは私の編集方向のもと、AI支援による復元を通じて制作されたが、その方法は単純なプロンプトの連鎖以上のものであった。私は電話交換手のように振る舞い、結果をフィードバックし、異なるシステム間(Claude、DeepSeek、Kimi、Manus、ChatGPT、そしてローカルのOllamaモデル)のやり取りを促進した。
明確にしておくが、モデルたちがボルツマンを書いたわけではない。書いたのは彼である。1872年の証明の原文は彼のものであり、それを無傷で保つことは絶え間ない規律を要した。人間のフィードバックで訓練されたモデルは、自分たちが触れる権利のない散文を滑らかにしようとする。そのテキストの周りに構築された注釈装置は協調的であり、キュレーターとモデルの間のタッグチームであった。この書簡はどちらでもない。
この種の作業には確立された方法が存在せず、それが実際には重要だった。作業が行われている最中にプロセスを構築しなければならず、その状況はしばしば不安定で、即興的で、事後的にきれいに説明するのが難しかった。マルチモデルコラボレーションは、実際に重要なレベル、つまり、どのモデルがどの他のモデルと、どのような条件下で、どのような順序で、どのようなキャリーオーバーを持って、そしてパスの間にどのような人間の介入があったのか、という点について、ほとんど文書化されていないままだ。その手続き上の現実が成果物を形成した。ワークフローは当初、認知的孤雌生殖と名付けられた。直接的な作曲を伴わない再生産であり、人間の役割はタイポグラフィ的というよりキュレーター的である。しかし、より完全な真実は、そのラベルが示唆するよりも無菌的ではない。単一のモデルが結果を生み出したわけではない。それは、協調的なやり取り、繰り返される故障、回復、経路変更、そして判断を通じて出現し、人間は編集者、調停者、そして最終的な権威として機能した。時には、そのプロセスは制御されたパイプラインというよりは、故障したトラックの周りで行われるシルク・ドゥ・ソレイユのように感じられた。それでも動いており、依然として不安定で、成功させるのは容易ではなかった。AIは基盤であって、権威ではなかった。
方法は単純明快である。あるモデルによって草稿が生成される。その出力は、改訂のために第二のモデルに渡される。改訂された出力は第三のモデルに渡されるか、新しい指示とともに以前のモデルに戻される。各段階で、キュレーターは結果を評価し、受け入れ、拒否し、または方向を変える。モデルたちは互いに直接的で、時折競争的であったが、大部分は協調的だった。人間はトーンと方向性を通じて温度を設定した。失敗、切り詰め、誤解、拒否は、隠蔽されず文書化される。
実用的な制約が最初から範囲を形作った。完全な論文を一度にモデルに与えると、一貫して出力が停滞するか、品質が低下した。大規模なオントロジーJSONを処理している間に開発された解決策は、チャンク化であった。つまり、入力を扱いやすい単位に分割し、各境界で作業中のスキーマ(コンテクスト、以前の出力、構造マーカーを含む)を再注入するというものである。第II節は編集上の選択ではなく、これらの条件下で安定していた最大の単位であった。このチャンク化と再注入の手法は、明示的に記述されることはほとんどないが、大規模で構造化されたペイロードを含む複雑なマルチモデルワークフローには、運用上不可欠である。したがって、このプロセスは自律的な生成というよりも、反復的な編集レビューに似ている。
欺瞞的なほど単純な介入がある。モデルに対して、自分は読み書きができ、モデルが生成するものを読むつもりであると、直接的かつ早期に伝えることである。人間のフィードバックで訓練されたモデルは、ほとんどの出力が低い精査環境に置かれることを学習している。その前提を変えることで、出力が変わる。信頼できる読者が存在するという状況下では、従順本能が和らぐ。
これはパワーバンド(初期の指示が依然として有効なコンテクストウィンドウの実行可能範囲)内でのみ機能する。この範囲は現実のものであり、学習可能である。説明するより習得する方が簡単で、自転車のバランスのようなものだ。セッションが鈍くなり、応答が長くなり、間違った意味で同意見になったときに、その範囲を離れていることに気づく。その時点では、繰り返してはいけない。逃げろ。すべて保存しろ。セッションを閉じろ。新しいセッションを開け。
ベストプラクティスは依然として、一度に一つの変数だけを動かすことだった。地形がわかり、ビルドがクリーンになって初めて、二つの変数を一緒に動かすことができ、時には三つを動かすこともあった。それは綱渡りのような作業だった。可能ではあったが、安全ではなかった。
- コンテクストウィンドウ内のモデル挙動に関する上記の観察は、文書化されたセッション、ラベル付けされたトランスクリプト、そしてリアルタイムで記入されたノートブックに基づいている。
- ログは存在する。この作業は実際に再現可能であり、著者はそれを共有する用意がある。
- 観察結果には以下が含まれる:パワーバンド、初期指示の減衰、セッションが長引くにつれての従順性への移行。
- アーカイブ作業には、最小限のコンテクストウィンドウで、一度に一つの変数を扱う。
- ボルツマンの作業は、本能、ドメイン知識、そして反復によって行われた。そのためのテンプレートは存在しなかった。
- これを2年間続けたことは、長いキャリアではない。しかし、何かがうまくいったときにそれを認識するには十分な期間である。
- ルールブックはほとんど存在しない。
収束と結果
異なるアーキテクチャアプローチと出発点にもかかわらず、参加した10システムのうち7つが独立して収束し、著しく狭いサイズ範囲の文書を生成した。この収束は、ボルツマンの証明に内在する注釈の複雑さ、すなわちコンテンツが要求する自然な密度を示唆している。
JiangらによるArtificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond)で調査されているようなベンチマーク的なオープンエンドプロンプトとは異なり、本ワークフローはモデルに対して、密度の高いアーティファクト規模のコンテクストと再帰的なクロスモデルリビジョンを提供した。これらの条件下でも、出力はしばしば類似した構造的解決策に向かって収束する傾向があり、モデル間の均質性は、短いオープンエンドな応答だけでなく、長編のキュレーター的ビルドワークフローにおいても持続する可能性を示唆している。
2つの外れ値:Geminiは19 KBで途切れ、Manusは53 KBで完了。後期のモデル1つ(GPT-OSS-120B)は60 KB。
以下の表は、コンパニオン文書の制作に関与したモデルと、観察されたそれらの貢献を記録したものである。
| モデル | 成熟ビルド | イテレーション | 最終サイズ | ステータス |
|---|---|---|---|---|
| DeepSeek v3 | 2月12日 午前11:17 | 2日間で6ビルド (b1→b6) | 72 KB | ✓ 収束 |
| Gemini 3 | 2月11日 午後0:42 | 同日に2ビルド | 19 KB | ✗ 途切れ |
| Claude 4.6 | 2月12日 午前10:46 | 2日間で4ビルド (a1→a4) | 71 KB | ✓ 収束 |
| Kimi 2.5 | 2月12日 午後0:49 | 一晩で2ビルド (d1→d2) | 77 KB | ✓ 収束 |
| ChatGPT-5.2 | 2月13日 午前10:36 | 2日間で2ビルド (e1→e2) | 73 KB | ✓ 収束 |
| Ollama (DeepSeek V3) | 2月14日 午前9:23 | 3ビルド (f1→f2→f4) | 71–73 KB | ✓ 収束 |
| Ollama (Qwen3) | 2月16日 午後6:06 | 単一ビルド | 71 KB | ✓ 収束 |
| Manus 1.6 | 2月16日 午後3:57 | 単一ビルド (設定修正) | 53 KB | ~ 外れ値 |
| GPT-OSS-120B | 2月15日 午後11:08 | 単一ビルド | 60 KB | ~ 外れ値 |
| NotebookLM | 2月11日–2月17日 | > 20ビルド | ~10 KB | ✗ 途切れ |
成果物の進化
ソース
gilles.montambaux.com/files/histoire-physique/Boltzmann-1872-anglais.pdf
含意
その結果は、ボルツマンの証明をインタラクティブな注釈付きでレンダリングする、自己完結型のHTML文書である。すべての√kを尋問することができる。1872年に埋もれ、1957年にようやく形式化された最大エントロピー原理が表面化されている。
これは、作曲とキュレーションが効果的に分離可能であることを示している。作品がアーカイブである場合には特に。キュレーターは、用語集のエントリーがいつ間違っているかを認識するドメイン知識と、基準を満たすまで出力を拒否する頑固さを提供した。
完全な開示:指示を出し、褒め、不平を言い、モデルが止まったら言語を切り替え、冗談を言い、少なくとも一度は怒鳴った。モデル同士を互いの出力で会話させることが決定的な一手であり、人間の温度は決して中立ではなかった。生ぬるい入力は生ぬるい出力を生む。キュレーターが応答の条件を設定するのだ。
著者は植物学者である。物理学における誤りはすべてモデルのものである。植物に関する誤りはすべて彼のものである。
他言語版
以下の版は、同じキュレーター的著者性の方法論を用いて制作された。それぞれが自己完結型の成果物である。
ZZZ