synthesis-llm.ru.md
docs/i18n/synthesis-llm.ru.md
Синтез prose с опорой на LLM
<!-- translations:start -->
English · 한국어 · 中文 · 日本語 · Русский · Español · Français · Deutsch
<!-- translations:end --> Tesserae поставляется с двумя путями синтеза. По умолчанию используется детерминированная эвристика, которая никогда не обращается к сети: она создает предсказуемые, идемпотентные Markdown-шаблоны из исследовательского графа. Опциональный путь LLM-апгрейда заменяет эти шаблоны prose, написанной Claude при каждом compile, сохраняя все остальные инварианты (идемпотентность, отслеживание citation, hash-stable тела) неизменными.
Эта страница объясняет, когда это включать, сколько это стоит, какие данные покидают вашу машину и как проверять вывод.
Что он делает
Оба пути используют одни и те же входы _PagePlan (node ids, names, types, descriptions, source paths). Отличается body.
Эвристика (generator: heuristic-v1)
# Project Pulse
## Counts
- Paper: 14
- Repository: 4
...
## Recently added
- Geometry-Grounded Gaussian Splatting (Paper)
- Volumetric Rendering Revisited (Paper)
...
## Tagline
Tesserae — a self-evolving research notebook.
Читается как дамп базы данных. Полезно, детерминированно и доступно уже сейчас.
LLM (generator: llm-claude-sonnet-4-6)
## Recent activity
The wiki tightened around 3D reconstruction this week. Two papers landed
under the Splatting Family [ApproachFamily:splatting:a86ed11b9524], both
foregrounding photometric and depth supervision for stable splat geometry
[Paper:geometry-grounded-gaussian-splatting:f188522141a2]. The dominant
through-line is volumetric rendering refinements
[Concept:volumetric-rendering:b05846130d24].
Читается как редакторский дайджест. Модель ограничена задачей пересказывать факты, присутствующие во входах: каждый абзац, называющий node, заканчивается citation вида [node_id], а body без citation (или короче 80 символов) отклоняется и fallback-ится к эвристике.
Форма prompt
Два блока: длинный стабильный system block, обернутый в cache_control: ephemeral, и page-specific user message, который меняется по kind.
System block (cached, одинаковый для всех страниц)
You are an Tesserae synthesis writer. Your job is to summarize a controlled
knowledge graph into a single Markdown page. Rules you follow ABSOLUTELY:
RULE 1 — DO NOT INVENT FACTS. Restate or summarize ONLY material you find
in the inputs. ...
RULE 2 — CITE EVERY CLAIM. Every paragraph that names a node MUST end
with one or more citation markers in square brackets, where the bracket
body is the node's id (e.g. ``[Paper:arxiv-2604.20329:abcd1234]``).
...
RULE 3 — STAY ON TOPIC. The synthesis kind decides the shape:
* pulse : project-wide weekly snapshot. 5-9 sentences max.
* daily_digest : one paragraph per noteworthy paper that day.
* weekly : 3 themes from the week, 1 paragraph each.
* topic : narrative about a research topic / approach family.
* comparison : one paragraph per family with shared task/benchmark.
* field_overview: 1-2 paragraphs per linked sub-topic.
RULE 4 — TONE. Direct, terse, technical. ...
RULE 5 — FORMAT. Output is pure Markdown. No frontmatter. ...
RULE 6 — LANGUAGE. Match the dominant language of the input materials.
If 80%+ of input titles/descriptions are in Korean, write in Korean.
Otherwise English.
The current ontology is:
Paper, Repository, Concept, Algorithm, Model, Dataset, Benchmark, Metric,
Person, Organization, ResearchTopic, ApproachFamily, Synthesis, ...
A node id has the shape ``Type:slug:hash``.
Полный блок занимает около 500 tokens. Канонический текст см. в