ControlMind科学评测工作台
检查服务中...|
赛道三RAG 回放来源可追溯

赛道三:医学 RAG 来源回放

将医学 RAG 的已验证 trace 压缩为公开演示:中文问题、英文文献来源、片段回溯、结论引用校验和安全拒答边界保持一致。

策略
公开云端 Demo
RAG 展示
trace 回放
合成方式
已验证回答
检索索引
BGE M3
安全边界
诊疗拒答
云端医学页只展示已验证 trace 与安全边界,不暴露私有原文、chunk、索引或模型入口。
临床研究者

终点、安全性、ITT 和纳排标准快速追溯

药企医学事务

剂量调整、不良事件和治疗延迟来源核验

受控医学资产

原文、文段和问答上下文不进入公开云端演示

3348
医学文段
6/6
中文 Ask Hit@3
3/3
结论支撑
100%
引用覆盖
1

选择问题

复现

预置问题来自已保存 trace,可立即回放;手动输入只匹配公开回放或安全边界,不现场访问受控链路。

用户自然问题
面向正常医学文献用户,点击即载入已验证回放。
研究者验证
覆盖临床试验统计口径和方法学来源。
安全边界
展示个人诊疗或急症问题不会进入 RAG 检索。
2

检索来源

完成

展示命中文段、章节标签、融合分数与公开边界。

3

中文回答与结论校验

复现

每条事实结论必须有来源;个人诊疗和急症问题进入安全边界。

复现可复现回放 · BGE M3 · 已验证回放

根据已保存的文献来源摘要,化疗剂量减少和治疗延迟通常按毒性严重程度处理:血液学和非血液学毒性可触发剂量减少;并发毒性时以最严重的既往毒性为依据;不良事件导致的周期延迟存在上限,超过阈值可能取消周期或停止治疗。

PMC8600696_chunk_015PMC9502603_chunk_003PMC5490215_chunk_019
3 个文段 · 3 个来源 · 已验证回放 · 引用覆盖 100%
结论校验
引用覆盖 100%
可支持
血液学和非血液学毒性可触发化疗剂量减少。
PMC8600696_chunk_015
可支持
治疗延迟和剂量减少可作为不良事件相关的次要终点记录。
PMC5490215_chunk_019
可支持
不良事件也可能受到药理学和心理因素共同影响。
PMC9502603_chunk_003
该结果来自已保存的可复现实验 trace,用于公开展示;云端页面不现场访问受控资产。