赛道二:ControlMind Data Agent
把科学文档语料生产从脚本流水线升级为可规划、可恢复、可审计的 Agent 执行协议。
前台以来源核验和 trace 回放为主,不把评审页变成长任务控制台;主按钮只回放 Agent 协议闭环。
策略
公开云端 Demo
云端 API
DeepSeek
模型入口
服务端代理/回放
解析
MinerU 官方 API
赛道三合成
DeepSeek
公开演示工作台只处理公开或脱敏材料;私有原文、chunk、向量索引和批量实验不进入云端。
人工语料产线成本高
文献检索、解析调参、视觉质检、出题、评测和排行榜更新累计约 558 工时。
脚本流水线不可恢复
固定 pipeline 只能按顺序跑,缺少失败降级、checkpoint 和质量验收协议。
云端边界难执行
公开材料、私有原文、chunk、索引和微调产物需要由系统自动路由,而不是人工记规则。
跨模态质检难规模化
图片、公式、表格和正文需要统一审计,不能依赖人工逐篇抽查。
Agent 执行协议
不是固定 pipeline,而是目标解析、资源调度、验收回放和日志审计的组合协议。
意图路由
自然语言目标转成可组合 intent 序列
资源调度
按 data_policy 选择公开 API、回放产物或离线脚本
执行与校验
执行、检查、重试、降级和写入日志
日志与来源
输出摘要、来源产物和可复现命令
14
Intent 能力
4
推理轨道
9,207
视觉审计判决
391s
数据飞轮闭环
62ms
故障降级案例
17
跨领域零改动模块
能力验收维度
概括系统在复杂文档处理、Agent 编排、可靠执行和开放复用方面的主要验证依据。
D1复杂文档理解
28,514 chunk、4,996 共现 chunk、多格式解析
D2难点攻克
视觉审计、公式识别对比、QLoRA 反直觉发现
D3任务规划
自然语言目标转 Intent、DAG、Verifier 闭环
D4稳定复现
三层容错、失败恢复、LogStep、复现命令
D5生态价值
双赛道联动、开源资产、跨领域迁移
评审验收路径
默认先看 Agent 协议、能力矩阵和关键验证依据;模板按钮只核验既有产物,主按钮用于核验 intent、DAG、资源选择、输出摘要和来源产物。
A
任务模板
待执行选择一个已验证任务,或输入目标查看规划回放。
B
能力注册表
待执行来自 agent_capabilities.json。
14
Intent
local + api
Resource
公开/脱敏规划任务只回放已验证 trace;原文、医疗、chunk、微调产物不进入云端演示。
1
意图路由
待执行把任务目标转成可核验的 intent 序列。
规划只展示计划回放,不执行真实长任务。
已加载任务模板和能力注册表。模板按钮只核验既有产物;长任务只保留可复现命令。
2
DAG 与资源调度
待执行展示来源核验、协议核验或必要降级的步骤状态。
读取回放后会在这里展示 DAG;未选择模板前先展示左侧 intent 与资源类型。
3
核验摘要与来源
待执行显示来源核验摘要、输出文件和可复现命令。
核验一次模板或 Agent 协议后会显示摘要与来源路径。