技术架构

从算法到工程的完整闭环,每一项技术都服务于一个真实场景

读兜兜 Readoow 技术架构

Story Compiler 多阶段生成管线 · 模型阶梯 · 多头Reranker

Story Compiler 多阶段生成管线

Recipe卡
Outline×6-8
Draft×12-16
Hard Gates
Trait Judge
多头Reranker
Repair

模型阶梯

Gemini 2.5 Flash合成
Llama3.1/Qwen2.5蒸馏
8B-32B + LoRA/QLoRA
DPO偏好优化
trait窄reward RL

多头Reranker

P(read_to_end)

读完概率

P(click_next)

点击下一章概率

P(comprehension)

理解度概率

P(vocab_natural)

词汇自然融入概率

P(level_fit)

难度匹配概率

评测体系 · 8维度rubric

开头钩子

情节推进

情绪强度

语言难度

单词融入

学习价值

语感/网感

完整性

学习者画像 · 数据飞轮

per-word mastery

逐词掌握度

SRS间隔复习

间隔重复系统

taste画像

口味偏好画像

三库一池:Raw Lake / Golden Benchmark / Eval Pool / Failure Replay

MinuteX 技术架构

ASR管线 · Memory Ledger · 长期记忆Agent

ASR管线

faster-whisper
WhisperX
词级时戳/分轨
Speech-Act分类
实体链接+时间标准化
claim抽取+冲突检测

长录音结构化

切段
running state
滚动状态
两遍抽取
实体注册表

Memory Ledger · 五表结构

Episode

事件表

Minit

纪要表

Claim

断言表

Mutation

变更表

Snapshot

快照表

bi-temporal双时序 · Graphiti+pgvector检索底座

minit Schema

speech_act · epistemic_status · claims[] · entities[] · temporal_expressions[]
source_span{ms} · confidence · privacy_class(L1-L5) · memory_policy

记忆评测 · 6个可测能力

Memory Extraction

Update

Retrieval

Temporal Reasoning

Proactive Help

Privacy Sensitivity

7类记忆

事实 偏好 项目 任务 关系 情绪 长期目标

各自定义存储 · 更新 · 过期 · 调用 · 隐私规则