IT之家 3 月 11 日消息,据腾讯云今日消息,清华大学、腾讯云、英特尔于 3 月 7 日在北京宣布启动“数据库 AI 联合创新计划”,围绕数据库与大模型的交叉技术展开深度研究,推动数据库智能化升级,同时为 AI 应用构建高效数据基础设施。这也是国内首个数据库 AI 领域的产学研联动项目。
随着大语言模型技术爆发,数据库系统面临从“被动存储”向“主动服务”转型的挑战。传统数据库依赖人工编写复杂查询语句,而大模型的自然语言交互能力可大幅降低使用门槛;另一方面,AI 训练与推理所需的海量数据处理,也亟需数据库在分布式架构、缓存管理等环节实现性能跃升。
IT之家从公告获悉,针对这一趋势,本次合作规划了两大技术攻坚路径:
一方面研发基于大模型的智能查询生成与优化系统(Text2SQL),让用户通过自然语言直接操作数据库,实现艰深的数据库技术也能听懂“人话”;
另一方面打造面向大模型推理的分布式缓存产品,解决 AI 任务调度、存储资源分配等核心难题。
在 Text2SQL 方向,项目组提出端到端技术框架,重点突破语义理解、模式匹配、SQL 验证等关键环节。通过大模型微调、强化学习(DPO)与检索增强(RAG)技术,系统可将用户提问拆解为多级子任务,并动态匹配数据库表结构,最终生成高准确率 SQL 语句。
面向大模型推理加速,项目组设计了分布式缓存系统,通过两阶段任务调度、KVCache 优化及 GPU 直连存储技术,显著降低计算资源浪费。
清华大学数据库科研组表示:“未来的数据库不仅是存储工具,更是 AI 产业链的数据大脑。我们期待通过这次合作,为全球数据库技术发展提供中国方案。”
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。