T1科学对齐评测基座
ControlMind Sci-Align 评测基座
5
份来源条目
已验证内容
362 PDF 文档253,012 LaTeX 公式11,554 嵌入图片28,514 语义 chunk500 核心评测题A/B/C/D 四维平衡
评分依据
评分依据不是单次 API 成功,而是控制科学语料被结构化后,能够进入四维 Benchmark、自动出题、模型答题与 Judge 评分,并保留题目、参考答案、评分理由和来源路径。
来源文件 / API
点击查看验证方式
交付物
赛道一公开演示:MinerU 官方 API 解析公开 PDF,DeepSeek 基于解析文本出题并评分。
公开报告路径
docs/submissions/track1_sci_align_report.md · docs/submissions/shared/DATA-TRACE.md