用 ChatDOC 读 PDF 有什么不一样?
“在 AI 文档问答场景中,知道答案从何而来,与得到答案应该同样重要。”
在优化升级 ChatDOC 过程中,我们内部一直在思考,也在和用户沟通什么是真正能够满足专业场景阅读需求的 AI 工具。
“希望 AI 它聪明又可靠,不仅可以帮我们快速找答案,并且能够支持快速核验答案的每一处来源,让AI生成的内容实现可信、可用、可溯源。”
因此,我们用了很大的精力在ChatDOC的溯源能力上,推出了「划词溯源」功能。当用户对任意一个答案有任何疑问,只需轻轻一划,即可立即定位到原文出处,验证答案的真实来源。让每一个结论都有据可依,每一个答案都经得起推敲。
这个功能的核心是:
用户可以通过划动 AI 生成的内容,立即能够看到这部分内容来源于原文的哪一部分;
这种对应关系帮助用户验证 AI 的分析、总结是否准确,是否存在“幻觉”导致的胡乱回答。
💡ChatDOC的三种溯源方式详解
用户在使用 ChatDOC 过程中,能够体验到「页码溯源」「引用溯源」和「划词溯源」这三种溯源方式。
其中「页码溯源」和「引用溯源」是 ChatDOC 刚上线就具备的功能,为了最大限度的实现AI文档问答溯源功能的效果,我们又进一步推出了「划词溯源」功能,帮助用户细粒度地追溯到每一个AI生成答案对应的原文具体内容。
所以,从溯源的效果上看,划词溯源 > 引用溯源 > 页码溯源。
点击大图,查看ChatDOC 中的三种溯源方式优劣势对比
以在 ChatDOC 中阅读《SpaceX独立投资指南》为例[1]直观感受三种溯源方式带来的差异。
🧙页码溯源:粗粒度的答案对应粗粒度的原文溯源
当我们想要了解AI给出的答案都是来自原文的哪些地方,最常规的查询方式是点击答案下方的对应页码。
页码溯源的溯源效果
「页码溯源」的方式能够高亮与原文相关的内容,提供一些与答案相关的内容作为参考,但高亮区域和答案内容的相关性较难判断,并且是粗颗粒度对应粗颗粒度的模糊对应关系。
这种溯源方式虽然能快速定位到相关页面,但由于缺乏精确定位能力,用户往往需要在相关页面中手动寻找对应的关键信息,既无法直观展示答案与原文的具体对应关系,也难以快速验证AI回答的准确性,在专业场景下的应用价值因此受到限制。
🧙引用溯源:细粒度的答案对应粗粒度的原文溯源
相较于「页码溯源」,「引用溯源」是在AI生成答案的每一段中,提供一个原文引用页码,用户可以通过点击答案段落中对应的引用脚注去查看这一答案的出处。通过将答案按段落或是句子标注引用来源,用户能够更清晰地了解每个观点或论述的来源出处,提升了溯源的精确度和使用体验。
然而,这种方式仍然存在着"细粒度答案对应粗粒度原文"的不对称性:虽然答案被精细化分别标注,但溯源结果依然停留在段落或表格级别,用户仍需在指定参考内容中寻找相关内容,而无法直接定位到具体的句子或表格单元格,这种"粗细不匹配"的特点在处理复杂文档时尤其明显。
此外,在实际应用中,还经常出现溯源内容缺失的问题,例如在下面这个回答中,就只存在「页码溯源」,而没有「引用溯源」,导致用户无法追踪到答案中每一段内容的具体出处,从而降低了溯源的透明度和答案的可信度。这些限制使得「引用溯源」在应对复杂文档时仍显不足。
只出现「页码溯源」,但没有「引用溯源」的情形
🧙划词溯源:实现细粒度的答案对应细粒度的原文溯源
为了解决「页码溯源」和「引用溯源」存在的问题,让溯源真正能够发挥它应有的作用和价值,ChatDOC 推出「划词溯源」功能,可以实现用户划动 AI 生成回答中的任意一部分内容,都可以快速溯源到原文中对应的那部分内容。
ChatDOC 划词溯源功能,对哪里有问题就划动哪里
不同于「页码溯源」和「引用溯源」都只能提供给用户一大段参考内容,ChatDOC 的「划词溯源」功能真正实现了细粒度的溯源方式,划动AI生成答案中的任意一句话,即可溯源到原文对应关键句子或表格中某个单元格内容,真正实现了方便用户验证信息。
考虑到很多用户在阅读含有大量数据的研究报告时,会对一些 AI 生成回答中的数据更感兴趣,所以 ChatDOC 还会专门提供「关键数值高亮功能」。当鼠标划动到相关文本时,这些数值都会高亮,用户点击任意一个数值,都可以直接精准溯源到原文当中。
ChatDOC 关键数值高亮溯源功能
可以在PC端点击链接:https://chatdoc.site/chatdoc/#/share/OzgHF95qytBdq6fqsdnQ066nfLasL9u2e3m4vMAYAYQ,立即体验 ChatDOC 划词溯源功能,直观感受在阅读《SpaceX独立投资指南》时的细粒度溯源效果。
💡ChatDOC 划词溯源功能
给专业阅读场景提供更多安全感
在各种专业人士的阅读场景中,ChatDOC 细粒度的溯源功能能给用户带来更多的安全感。
例如,当我们阅读各类金融报告时,也能对AI引用的各类数据也会更放心。
在 ChatDOC 中打开一份英伟达2024财年的年报,向这份报告提问:“英伟达2024的增长情况如何?”
当我们看到AI给出的回答,“2024财年的增长情况非常显著,整体收入达到了609亿美元,同比增长了126%“居然有这么多吗?🤯
于是选择滑动这句话“整体收入达到了609亿美元”这句话
ChatDOC 会自动溯源到:
“Revenue increased 126% year on year to $60.9 billion on the strength of Data Center revenue, driven by higher shipments of the NVIDIA Hopper GPU computing platform for the training and inference of LLMs, recommendation engines and generative AI applications, as well as higher shipments of InfiniBand”
在 ChatDOC 「划词溯源」功能的帮助下,快速找到了对应的原文内容进行核对。
因为这份回答中出现的数据点较多,我们也可以通过点击关键数值的方式,直接回溯到原文对应的段落。
可以在PC端点击链接:https://chatdoc.site/chatdoc/#/share/-EZzPSHN6xGXMsGc02osy08LkOsCARgtKt1sNhR7bgg,立即体验 ChatDOC 划词溯源功能,在阅读《2024 NVIDIA Corporation Annual Review》上的细粒度溯源效果。
不仅仅是金融读财报、研报的场景,律师看合同、看证据材料、工程师读技术文档,都可以在ChatDOC划词溯源功能的帮助下更快速便捷的了解每一个答案的来源。
例如,打开一份增资协议,向这份报告提问:“合同约定的打款期限是多长?”
👇
AI 回答:“根据合同的约定,投资者应在第五条所述的先决条件全部得到满足后的十(10)个工作日内,按本协议的约定缴付增资款。”
👇
只需要点击答案中高亮的“10”,会自动溯源到原文中第“2.1.1 投资者应在第五条所述的先决条件全部得到满足后的十(10)个工作日内,按本协议第 1.1.1 条的约定缴付增资款(“交割”),将增资款人民币【*】元一次性划入公司指定的如下银行账户。”
可以在PC端点击链接:https://chatdoc.site/chatdoc/#/share/DMgM7R9a_YHUHTlE_nPXtfGUhsu_D7ea5RYPt5f3YaE,立即体验 ChatDOC 划词溯源功能,在阅读增资协议上的细粒度溯源效果。
这样的实时对应关系让用户能够:
快速验证 AI 对文档的解读是否准确;
确认 AI 不是在“幻想”不存在的内容;
了解 AI 的分析依据来自哪些具体文本。
💡 立即在PC端体验 ChatDOC 的「划词溯源」功能
[1] 在ChatDOC 中阅读《 SpaceX 独立投资指南》:
[2] 在ChatDOC 中阅读《2024 NVIDIA Corporation Annual Review》:
[3] 在ChatDOC 中阅读《增资协议》:
在PC端中点击以上图片即可自动跳转
💡写在最后
在 Reddit上有一个引发热议的讨论:为什么很多专业用户对 AI 工具往往只是短暂感兴趣,却难以持续使用?
其中一个高赞回答指出:专业用户真正需要的不是单纯的效率提升,而是确保输出质量的可靠性。
AI工具最大的问题在于你永远无法完全信任它的输出结果。大多数工具都明确声明"必须人工审核结果,因为AI可能会产生错误"。到头来,资深律师和合伙人们只能把AI的产出当作一个永远学不会进步的实习生的工作成果来对待——当然,这正合他们的意🙄。
AI 时不时会“犯错”,让人难以完全信赖其输出的内容。而 ChatDOC 的「划词溯源」功能,就像是给用户配备了一个“AI 时代的信息指南针”——当你对 AI 的回答产生疑虑时,只需轻轻一划,就能立即追溯到原文出处,验证答案的真实性。
这正是庖丁科技在打磨 ChatDOC 过程中始终坚持的理念:「知道答案从何而来,和得到答案同样重要。」通过让每一个 AI 生成的答案都能快速定位到原文依据,我们为用户在海量信息中提供了一个清晰的信息溯源路径,帮助用户在 AI 生成的内容海洋中始终保持清醒。
希望 ChatDOC 能成为你可信赖的 AI 文档问答助手,欢迎体验ChatDOC,也欢迎你了解我们的企业版方案:)
往期推荐
如果你想要了解 ChatDOC 更多信息,欢迎阅读: