集微网报道 4 月 16 日,寒武纪发布年度报告称,2021 年,公司实现营业收入为 7.21 亿元,同比增长 57.12%,综合毛利率为 62.39%,较上年同期基本持平。其中,智能芯片及加速卡业务贡献收入 2.15 亿元,同比上年增长 101.01%。
2021 年,寒武纪的云端产品线与互联网行业、金融领域及多个行业客户展开了合作,入围了国内头部通信运营商人工智能服务器集采名单,向上百家客户销售了产品。
在互联网行业,寒武纪与阿里巴巴等头部互联网企业的多个业务部门进行了深入合作。公司的云端产品思元 370 芯片及加速卡(MLU370-S4 / X4 / X8)在视觉、语音、图文识别等场景的适配性能表现超出客户预期,部分场景已经进入小批量销售环节。在金融领域,公司与多家头部银行进行了导入和适配。其中,MLU370-X4 在招商银行多个业务场景的实测性能超过竞品,能够大幅提升客户的效率。
此外,公司联合服务器厂商入围头部通信运营商 2021 年至 2022 年人工智能通用计算设备集中采购项目,迈出了向通信运营商行业拓展的第一步。在其他行业客户方面,公司持续发力拓展,加速场景落地,实现传统行业的 AI 赋能。截至目前,已经与智慧轨交行业、智慧畜牧行业、科研教育行业的头部企业开展紧密的合作,向上百家客户销售了产品。
而寒武纪的思元 220 智能芯片及加速卡实现出货量快速增长,实现收入 1.75 亿元,较上年同期显著增长 741.10%,公司的思元 220 智能芯片及加速卡广泛运用于多家头部企业,成为了公司第一款年度出货量近百万片的产品。
另外,寒武纪积极参与并成功中标昆山智能计算中心等项目,实现收入 4.56 亿元,较上年同期增长 39.91%。近年来,公司已经陆续在西安沣东、珠海横琴、江苏南京、江苏昆山拓展了智能计算集群系统业务,国内的市场占有率处在第一梯队,过往项目经验对公司今后拓展其他区域的智能计算集群系统业务起到了良好的标杆作用。
寒武纪表示,2021 年,公司持续加大产品研发力度。硬件方面,公司发布了基于第四代智能处理器微架构(MLUarch03)的推训一体思元 370 智能芯片及加速卡。软件方面,公司投入了大量的资源优化基础系统软件平台,统一的软件平台日臻完善。同时,新一代产品及智能驾驶芯片的研发也在有序进行,公司“云边端车”协同发展的战略得到了全面推进。
具体来看,思元 370 是寒武纪第三代云端产品,采用台积电 7nm 先进制程工艺,是寒武纪首款采用 Chiplet(芯粒)技术的人工智能芯片。思元 370 智能芯片最大算力高达 256TOPS (INT8),是寒武纪第二代云端推理产品思元 270 算力的 2 倍。同时,思元 370 芯片支持 LPDDR5 内存,内存带宽是思元 270 的 3 倍,可在板卡有限的功耗范围内给人工智能芯片分配更多的能源,输出更高的算力。
思元 370 智能芯片采用了先进的 Chiplet 芯粒技术,支持芯粒间的灵活组合,仅用单次流片就达成了多款智能加速卡产品的商用。公司目前已推出 3 款加速卡:MLU370-S4、MLU370-X4、MLU370-X8,已与国内主流互联网厂商开展深入的应用适配。
MLU370-S4 智能加速卡的功耗为 75W,体积小巧、能效出色,可在服务器中实现高密度部署。具体而言,实测性能方面,MLU370-S4 加速卡的性能平均接近市场主流 70W GPU 的 2 倍;能效方面,相较于同尺寸市场主流 GPU,MLU370-S4 处理相同人工智能任务的用电量可减少 50% 以上,将有力地帮助用户实现“双碳”目标。此外,MLU370-S4 加速卡在视频编解码方面具有较强竞争力,相较于同尺寸 GPU,可提供 3 倍的视频解码能力和 1.5 倍的视频编码能力。MLU370-X4 智能加速卡为单槽位 150W 全尺寸加速卡。
该加速卡的优势表现为高性能,可提供 256TOPS (INT8) 推理算力和 24TFLOPS (FP32) 训练算力,同时提供 FP16、BF16 等多种训练精度,配合全新的寒武纪基础系统软件平台,可充分满足推训一体人工智能任务需求。MLU370-X8 则定位为训练加速卡,支持卡内和卡间的 MLU-Link 互联,大幅提升多卡训练时的性能。与市场主流同尺寸 GPU 相比,思元 370 系列加速卡在实测性能和能效方面均有一定优势,尤其在视觉、语音等场景的性能表现较为出色。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。