设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

2023 开放原子开发者大会:蚂蚁 AI 开源引关注,5 大开源项目获认可

2023/12/18 16:23:22 来源:之家网站 作者:- 责编:-

12 月 16 日,在开放原子开源基金会主办的“2023 开放原子开发者大会”上,蚂蚁集团主导开源的图数据库 TuGraph、时序数据库 CeresDB、隐私计算框架隐语 SecretFlow、前端框架 OpenSumi、数据域大模型开源框架 DB-GPT 入选“2023 快速成长开源项目”。

图片 1

▲ 图:TuGraph、CeresDB、隐语 SecretFlow、OpenSumi、DB-GPT 入选“2023 快速成长开源项目”

据了解,蚂蚁以开源关键基础软件为核心战略。本次入选的五个项目,表明了蚂蚁在关键基础软件领域开源的投入获认可,大模型跨界开源项目被关注,也为行业探索大模型应用带来了启发。

以 CeresDB 为例,这是一种存储和管理时间序列数据的分布式数据库,为时间序列数据提供高性能读写、高压缩比低成本存储、可视化查询等功能,适用于物联网 IoT、运维监控、金融分析等场景。CeresDB 开源项目负责人任春韶表示,“希望通过开源帮助开发者解决时间序列数据存储的水平扩展与高可用的痛点,助力海量数据场景的开发效率。”目前该项目内核 HoraeDB 已捐献到 Apache 开源基金会。

AI 及大模型浪潮,为科技创新带来了机遇与挑战。对于开源来说,也蕴藏了新的生机。比如在基础软件开发领域,大模型与数据库的结合产生了新的火花。

今年 6 月,蚂蚁集团发起了数据库领域大模型框架 DB-GPT。结合大模型与数据库,DB-GPT 可以系统构建企业知识库、生成式报表分析系统 (GBI)、日常数据处理与报表等多种应用。DB-GPT 开源项目负责人陈发强表示,“基于大模型和数据库,企业及开发者可以用更少的代码搭建自己的专属应用。我们希望 DB-GPT 构建大模型领域的基础设施,让围绕数据库构建大模型应用更简单、更方便”。据了解,DB-GPT 从个人项目出发,半年时间成长为近万星的开源社区,受到了行业和开发者认可。

本次大会还探讨了一些硬核技术痛点难点。AI 和大模型的爆发带来了算力焦虑,对系统的效率提出了更苛刻的要求。围绕大模型的应用开发,蚂蚁集团 AI 基础设施负责人张科分享了蚂蚁的 AI 工程实践。他表示,蚂蚁通过系统的智能化,解决了系统的效率优化问题,全面覆盖了训练推理引擎框架,在线服务,GPU 集群调度与虚拟化,工程智能等多个领域的效率提升。目前这套体系中的分布式训练系统服务 DLRover、显存和传输优化库 GLake 已开源。

张科还介绍,蚂蚁建设了万卡以上异构集群,千卡以上训练算力效率 (HFU) 超过 60%,有效训练时长占比 95% 以上,RLHF 训练在同等模型效果下训练吞吐性能相较于业界方案提升 3.59 倍,推理性能相较于业界方案提升约 2 倍,处于业界先进水平。“目前这套技术能力已经应用于蚂蚁百灵大模型,将带来更加绿色高效的算力”,张科强调。

图片 2

▲ 图:蚂蚁集团张科分享 AI 工程化实践

本次会上,蚂蚁集团还主办了“信息和数据安全前沿论道”分论坛,国内外专家围绕大模型隐私保护、数据安全、量子密码等展开了讨论。由蚂蚁集团主导开源的“铜锁”项目,成立了项目管理委员会,将致力于密码学研究,以及商业密码的行业应用推广及生态共建。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

相关文章

关键词:业界动态

软媒旗下网站: IT之家 最会买 - 返利返现优惠券 iPhone之家 Win7之家 Win10之家 Win11之家

软媒旗下软件: 软媒手机APP应用 魔方 最会买 要知