IT之家 11 月 5 日消息,昆仑万维天工 AI 今日发布最新版本的 AI 高级搜索功能,迎来四个方面的升级:
全面升级多层次分析推理能力
升级的金融投资专业 AI 搜索
升级的科研学术专业 AI 搜索
针对文档 AI 阅读分析的智能优化
全面升级多层次分析推理能力
在处理复杂任务时,天工 AI 推理能力支持难题拆解 + 自动规划 + 主动扩展 + 深度回答 + 图文交织。
智能搜索 Agent 把复杂的难题拆解为多个简单的问题,自动规划路径,一边思考一边执行。
自研大模型搜索 Agent,面对用户输入的问题,能够模拟人的思考和推理过程,自动生成任务规划并逐步完成预设任务路径,并在每一步检查任务的执行情况,确保最终结果的准确性。
例如让大模型分析“过去三年诺贝尔奖得主及贡献”,天工 AI 高级搜索拿到问题之后,不会笼统的给答案,而是理解、拆解、推理、引导。
AI 先自己查询了过去三年诺贝尔奖得主,然后再查询每位获奖者的详细贡献,并且给出了可追溯的信源,在右侧参考链接栏,可以直接点击追溯原论文或信息源。
接着通过大模型对结果进行精准的理解和总结,天工 AI 能够提供更全面、深入的回答。
在经过问题拆解后,天工 AI 按照物理学奖、化学奖、生理学或医学奖,开始逐年分析,以回答了他们的名字、贡献,并附上了他们的入选代表作,用户可以直接跳转查看原论文 PDF。
此外,天工 AI 高级搜索的主动扩展能力也得到升级。
通常情况下,用户只是在粗略地表达自己的需求,不会把问题描述得很全很精确。之前的 AI 大模型在逐步提示问题方面做得不够细致,因此不能给出更全面的回答。
但是在新版本中,用户输入一句搜索关键词“详细解读天工大模型”,天工 AI 则会自动扩展它的定义、背景、技术架构、案例等,一次性为用户展示出来,并在每个问题拆解中都涵盖 arXiv 等信源。
升级的金融投资专业 AI 搜索
天工 AI 在金融方向的高级搜索功能包含金融政策查询、指标查询、财务数据对比、财报分析、公司分析、研报解读、投资理财等。
天工 AI 能从几十页的财报报表中提取关键数据、整理成关键指标表格,还支持一键复制,可以对比每条数据间的关系,并进一步分析原因。
例如用户希望快速读取“茅台股份 2024 年第一季度财报”中的关键信息,天工 AI 可以快速用表格的形式分析营业收入,并提炼出业务情况、现金流、关键数据出现波动的原因等核心要点。
针对上市公司股票,天工 AI 可以给出投资者比较关心的公司基本面分析(含公司介绍、财务历年分析)、技术面分析(股价走势分析及指标解读)、消息面及资金面分析。
升级的科研学术专业 AI 搜索
科研学术专业 AI 搜索方面,昆仑万维号称建立了“国内科研学术 AI 搜索方向最全的学术元数据库”。
昆仑万维从来自 arXiv 等权威论文网站的数据重点发力英文论文的爬取,收录英文论文量两亿多篇。基于天工全自研的网页调度系统,监控全球学术网站,分钟级发现并抓取最新论文的 PDF 版本,也收录了 X、substack 等活跃学术讨论观点。
天工 AI 不仅帮用户直接分析了这些论文,还将 PDF 原文一一对应到相应的论点中去,用户能直接溯源点击查看原论文。
让天工 AI“评价 Transformer 模型的未来发展趋势”,它不仅分析了几十篇中英文论文,还将图片和技术术语进行详解,从技术细节、最新进展、应用现状分析了专业 AI 领域的问题。
定位论文之后,天工 AI 高级搜索还有以下升级亮点:
按照研究背景、研究方法、实验分析、结果分析、总体结论拆解论文,详略得当的总结论文关键信息
解读论文中晦涩难懂的公式,并辅以文字解释;支持 LaTex 语法导出,一键提取杂公式
更强的表格理解能力,图文并茂的重点解读分析研究方法、实验结果等论文核心内容
针对文档 AI 阅读分析的智能优化
天工 AI 高级搜索在文档 AI 阅读分析领域得到升级,不仅能够在文字理解上归纳和分析复杂的财报、研报、论文等各类文档,还支持处理超过 500K 字的超长文本。
昆仑万维表示,天工搭建专业团队花了一年多的时间自研了 PDF 文档解析引擎、开发文档解析大模型,在标题、作者、摘要、引用、图片、表格、公式、子标题等全部指标上达到 SOTA,特别是在多列文档、分页换行上精调了识别大模型。
首先,在高级模式下,增加了新的交互和功能:PDF 引用信源、PDF 浮窗、引用原文展示、深度解析、专业信源展示。
例如 PDF 浮窗功能:将鼠标放置在 PDF 引用信源处,即可展示学术论文的基础信息,包括学术论文的标题、作者、期刊、引用次数、发布时间等信息,可以看到 AI 解答的内容具体来自于哪一篇学术论文或财报。
其次,新增了针对学术论文、公司财报、券商研报等场景的深度解析模式,点击文档深度解析后可直达文档 AI 解读和 AI 对话功能,可以对完整的文档进行精读,并且产生图文并茂的 AI 解读。
如上图所示,针对一个长篇论文,「天工 AI 阅读」通过研究背景、研究方法、实验设计、结果分析等对论文的核心内容进行解读。
同时,天工 AI 阅读还可以提供论文点评、论文十问、脑图功能(如下图所示),来帮助阅读者更好的解析论文。
天工 AI 在文字解读的基础上,将原始材料中的关键信息(如数据、表格、公式、图、图片等)以多模态方式输出,帮助用户全方位地理解和解读文档中的重要内容和数据。
解读“财通证券财报”时,天工 AI 能快速提取公司的股权结构、业务情况、战略布局、历年财务数据、企业优势等精华内容,以简洁的图表形式向用户呈现。
如何使用?两种方法:
1)点击搜索结果中 PDF 悬浮窗的深度解析入口;
2)在 AI 文档-音视频分析 Agent 中直接上传 PDF。
与其他长文本搜索分析不同,「天工 AI 阅读」还升级多模态长序列摘要能力,支持长序列理解摘要、基于 RAG 的超长本文问答、跨文档的摘要问答、文档分析脑图生成。
其中,超长文档问答功能支持多个跨页复杂表格,联合文本分析和表格数据提取、推理。
例如,用户上传一份 132 页的超长财务报告,要求「天工 AI 阅读」分析:“应交税费的期末余额中,增值税和企业所得税分别占总税费比例是多少?”天工 AI 能够找到对应原文位置后,提取第 80 页表格内的数据,经过推理和计算后最终回答给出指标。
跨文档的摘要问答功能支持跨文档总结、问答,用户可同时上传多个文档,支持对比不同文档共同点和差异,联合多个文档的内容回答用户问题。例如用户希望分析两家公司的财务数据(营收数据、盈利情况等),那么用户可以上传两家公司的财报,「天工 AI 阅读」可以利用多篇文档中的内容进行问答。
IT之家测试,天工 AI 高级搜索功能目前处于免费使用状态。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。