ControlMind科学评测工作台
检查服务中...|
ControlMind 公开演示工作台

面向公开评审的科学文档智能评测工作台

延续完整系统的三赛道设计,云端只开放适合公开展示的解析、出题、评分、任务规划和医学 RAG 来源回放;私有语料和长任务保留在受控环境中。

赛道一
公开 PDF 解析 → 出题 → 评分
赛道二
公开任务规划 → 产物回放
赛道三
RAG trace → 来源回放 → 边界
实时云端依赖
MinerU 官方 API未配置
DeepSeek API未配置
Next 工作台已部署
FastAPI 后端未连接
今日实时调用额度
-/-

总览

集中展示三赛道核心成果、公开展示边界、云端服务状态和可核验输出。

公开云端模式密钥服务端托管公开/脱敏输入
公开演示
运行模式
回放模式
MinerU
回放模式
DeepSeek
-/-
今日额度

赛道一:Sci-Align

控制科学 PDF 资产进入可评测、可训练、可追溯的数据基座。

362
PDF 文档
253,012
LaTeX 公式
28,514
语义 chunk
500
核心评测题

赛道二:Data Agent

把语料生产从脚本流水线升级为可规划、可恢复、可审计的执行协议。

14
Intent 能力
4
推理轨道
9,207
视觉审计判决
391s
飞轮闭环

赛道三:医学 RAG

医学文献问答保留检索来源、结论状态、安全拒答和中文机制解释。

3,348
医学文段
FAISS + BM25
混合检索
混合 RRF
融合策略
100%
样例引用覆盖

公开展示边界

三赛道能力按公开评审场景重新呈现:可实时体验的保留为云端操作,重资产能力以来源和产物回放方式核验。

赛道完整系统能力云端保留能力云端砍掉能力
赛道一PDF 解析、ABCD 出题、模型答题、Judge 评分、全量榜单公开 PDF 解析、摘要出题、单题评分私有语料、全量批跑
赛道二Data Agent 飞轮、DAG、日志、恢复、跨模态审计公开任务规划、产物回放、来源矩阵长任务、私有语料重跑
赛道三医学 RAG、混合检索、结论校验、安全拒答稳定来源回放、公开样例检索、中文机制解释患者材料、院内资产
可部署
Ubuntu 双服务部署,公网入口只暴露工作台。
可演示
公开 URL、PDF 上传、任务规划、医学来源回放都可操作。
可核验
health/runtime/tracks/quiz/grade/rag 都有独立 API 可测。
边界清楚
无私有资产入口,密钥不进浏览器。

成果矩阵

把成果拆成输入、云端能力、可见输出,方便评审逐项检查。

能力输入云端服务输出/来源
赛道一论文解析公开 PDF URL / 上传 PDFMinerU 官方 API任务响应、Markdown 预览、解析字符数
赛道一出题评分解析文本 / 摘要 / 作答DeepSeek题型、题干、参考答案、评分规则、反馈
赛道二任务规划公开任务目标云端确定性规划器intent、DAG、资源策略、核验摘要
赛道三 医学 RAG中文医学文献问题公开来源回放命中来源、中文回答、结论状态、安全声明
部署核验health/runtime/tracks服务端代理状态、额度、依赖状态、纯云端策略