synthesis-llm.ja.md
docs/i18n/synthesis-llm.ja.md
LLM による合成 prose
<!-- translations:start -->
English · 한국어 · 中文 · 日本語 · Русский · Español · Français · Deutsch
<!-- translations:end --> Tesserae には 2 つの合成経路があります。デフォルトはネットワークを一切呼び出さない決定的なヒューリスティックです。研究グラフから、予測可能で冪等な Markdown テンプレートを生成します。任意の LLM アップグレード経路 は、他のすべての不変条件(冪等性、citation tracking、hash-stable な本文)を保ったまま、compile のたびにそれらのテンプレートを Claude が書いた prose に置き換えます。
このページでは、いつ有効にするべきか、どれくらいコストがかかるか、どのデータがマシンの外へ出るか、そして出力をどう検査するかを説明します。
何をするか
両方の経路は同じ _PagePlan 入力(node id、名前、type、description、source path)を消費します。違いは本文です。
ヒューリスティック (generator: heuristic-v1)
# Project Pulse
## Counts
- Paper: 14
- Repository: 4
...
## Recently added
- Geometry-Grounded Gaussian Splatting (Paper)
- Volumetric Rendering Revisited (Paper)
...
## Tagline
Tesserae — a self-evolving research notebook.
データベースのダンプのように読めます。有用で、決定的で、現在提供されています。
LLM (generator: llm-claude-sonnet-4-6)
## Recent activity
The wiki tightened around 3D reconstruction this week. Two papers landed
under the Splatting Family [ApproachFamily:splatting:a86ed11b9524], both
foregrounding photometric and depth supervision for stable splat geometry
[Paper:geometry-grounded-gaussian-splatting:f188522141a2]. The dominant
through-line is volumetric rendering refinements
[Concept:volumetric-rendering:b05846130d24].
編集ダイジェストのように読めます。モデルは入力に存在する事実を*言い換える*ことに制約されます。node を名指しするすべての段落は [node_id] citation で終わり、citation を省略した本文(または 80 文字未満の本文)は拒否され、ヒューリスティックへ fallback します。
Prompt の形
2 つのブロックです。cache_control: ephemeral で包まれた長く安定した system block と、kind ごとに変わるページ単位の user message です。
System block(cached、全ページで同一)
You are an Tesserae synthesis writer. Your job is to summarize a controlled
knowledge graph into a single Markdown page. Rules you follow ABSOLUTELY:
RULE 1 — DO NOT INVENT FACTS. Restate or summarize ONLY material you find
in the inputs. ...
RULE 2 — CITE EVERY CLAIM. Every paragraph that names a node MUST end
with one or more citation markers in square brackets, where the bracket
body is the node's id (e.g. ``[Paper:arxiv-2604.20329:abcd1234]``).
...
RULE 3 — STAY ON TOPIC. The synthesis kind decides the shape:
* pulse : project-wide weekly snapshot. 5-9 sentences max.
* daily_digest : one paragraph per noteworthy paper that day.
* weekly : 3 themes from the week, 1 paragraph each.
* topic : narrative about a research topic / approach family.
* comparison : one paragraph per family with shared task/benchmark.
* field_overview: 1-2 paragraphs per linked sub-topic.
RULE 4 — TONE. Direct, terse, technical. ...
RULE 5 — FORMAT. Output is pure Markdown. No frontmatter. ...
RULE 6 — LANGUAGE. Match the dominant language of the input materials.
If 80%+ of input titles/descriptions are in Korean, write in Korean.
Otherwise English.
The current ontology is:
Paper, Repository, Concept, Algorithm, Model, Dataset, Benchmark, Metric,
Person, Organization, ResearchTopic, ApproachFamily, Synthesis, ...
A node id has the shape ``Type:slug:hash``.