赛道二：ControlMind Data Agent

把科学文档语料生产从脚本流水线升级为可规划、可恢复、可审计的 Agent 执行协议。

前台以来源核验和 trace 回放为主，不把评审页变成长任务控制台；主按钮只回放 Agent 协议闭环。

策略

公开云端 Demo

云端 API

DeepSeek

模型入口

服务端代理/回放

解析

MinerU 官方 API

赛道三合成

DeepSeek

公开演示工作台只处理公开或脱敏材料；私有原文、chunk、向量索引和批量实验不进入云端。

人工语料产线成本高

文献检索、解析调参、视觉质检、出题、评测和排行榜更新累计约 558 工时。

脚本流水线不可恢复

固定 pipeline 只能按顺序跑，缺少失败降级、checkpoint 和质量验收协议。

云端边界难执行

公开材料、私有原文、chunk、索引和微调产物需要由系统自动路由，而不是人工记规则。

跨模态质检难规模化

图片、公式、表格和正文需要统一审计，不能依赖人工逐篇抽查。

Agent 执行协议

不是固定 pipeline，而是目标解析、资源调度、验收回放和日志审计的组合协议。

调度与验收层

意图路由

自然语言目标转成可组合 intent 序列

资源调度

按 data_policy 选择公开 API、回放产物或离线脚本

执行与校验

执行、检查、重试、降级和写入日志

日志与来源

输出摘要、来源产物和可复现命令

Intent 能力

推理轨道

9,207

视觉审计判决

391s

数据飞轮闭环

62ms

故障降级案例

跨领域零改动模块

能力验收维度

概括系统在复杂文档处理、Agent 编排、可靠执行和开放复用方面的主要验证依据。

D1复杂文档理解

28,514 chunk、4,996 共现 chunk、多格式解析

D2难点攻克

视觉审计、公式识别对比、QLoRA 反直觉发现

D3任务规划

自然语言目标转 Intent、DAG、Verifier 闭环

D4稳定复现

三层容错、失败恢复、LogStep、复现命令

D5生态价值

双赛道联动、开源资产、跨领域迁移

评审验收路径

默认先看 Agent 协议、能力矩阵和关键验证依据；模板按钮只核验既有产物，主按钮用于核验 intent、DAG、资源选择、输出摘要和来源产物。

任务模板

待执行

选择一个已验证任务，或输入目标查看规划回放。

能力注册表

待执行

来自 agent_capabilities.json。

Intent

local + api

Resource

公开/脱敏规划任务只回放已验证 trace；原文、医疗、chunk、微调产物不进入云端演示。

意图路由

待执行

把任务目标转成可核验的 intent 序列。

规划只展示计划回放，不执行真实长任务。

已加载任务模板和能力注册表。模板按钮只核验既有产物；长任务只保留可复现命令。

DAG 与资源调度

待执行

展示来源核验、协议核验或必要降级的步骤状态。

读取回放后会在这里展示 DAG；未选择模板前先展示左侧 intent 与资源类型。

核验摘要与来源

待执行

显示来源核验摘要、输出文件和可复现命令。

核验一次模板或 Agent 协议后会显示摘要与来源路径。