寒武纪推出第二代云端AI芯片:理论峰值性能提升4倍

澎湃新闻记者 王心馨
2019-06-20 21:06
来源:澎湃新闻

6月20日,澎湃新闻(www.thepaper.cn)从人工智能芯片公司寒武纪科技(下称“寒武纪”)获悉,公司正式推出云端AI芯片中文品牌“思元”、第二代云端AI芯片思元270(MLU270)及板卡产品。思元270的发布,也意味着寒武纪端云一体产品体系得到了进一步完善。

思元270芯片

寒武纪曾于去年正式推出云端AI芯片品牌“MLU”(Machine Learning Unit),此次推出中文品牌“思元”是对MLU品牌的有机补充,其含义为“思考的基本单元”。据寒武纪透露,思元商标的字体来自于中国元代书法家赵孟頫,他诸体兼擅,这与寒武纪追求人工智能芯片的通用性不谋而合。

思元270商标

据悉,最新发布的思元270芯片集成了寒武纪在处理器架构领域的一系列创新性技术。首先是理论峰值性能提升4倍:处理非稀疏深度学习模型的理论峰值性能提升至上一代MLU100的4倍,达到128TOPS(INT8)。其次,定点训练领域取得关键性突破:思元270训练版板卡将可通过8位或16位定点运算提供卓越的人工智能训练性能,该技术有望成为AI芯片发展的重要里程碑。第三,思元270兼容INT4和INT16、理论峰值分别达到256TOPS和64TOPS,支持浮点运算和混合精度运算。第四,思元270采用寒武纪公司自主研发的MLUv02指令集,可支持视觉、语音、自然语言处理以及传统机器学习等高度多样化的人工智能应用,更为视觉应用集成了充裕的视频和图像编解码硬件单元。第五,便于开发,在系统软件和工具链方面,思元270继续支持寒武纪Neuware软件工具链,支持业内各主流编程框架。此外,为方便开发者更好地挖掘思元270超强的运算能力、开拓更多的应用领域,寒武纪将在近期向社区和开发者开放专用编程语言。

思元270板卡

思元270芯片采用TSMC 16nm工艺制造,其板卡产品可以通过PCIe接口快速部署在服务器和工作站内。寒武纪本次公开的思元270板卡产品面向人工智能推断任务,在ResNet50上推理性能超过10000fps。面向人工智能训练任务的思元270训练版板卡产品将于本年度第四季度推出。

MLU270系列产品规格

寒武纪CEO陈天石表示:“寒武纪始终致力于为合作伙伴提供性能卓越、高度灵活的人工智能芯片。最新推出的思元270芯片和板卡产品将为客户带来速度更快、功耗更低、性价比更高的AI加速解决方案。作为人工智能芯片的先行者和引领者之一,寒武纪将持续推动该领域的技术和产品创新,为全球人工智能产业注入新鲜的血液,带来全新的动力。”

寒武纪科技由陈天石和其兄陈云霁联合创立于2016年,前身是中科院计算所2008年组建的“探索处理器架构与人工智能的交叉领域”10人学术团队。取名“寒武纪”,是希望用地质学上生命大爆发的时代来比喻人工智能的未来。

两兄弟都毕业于中科大少年班。陈天石的研究方向是人工智能算法,陈云霁则主攻计算机芯片。

2013年,寒武纪团队研发全球首个深度学习处理器架构DianNao,成为智能芯片领域全球被引用次数最多的学术论文。

而该领域全球被应用次数第二多的论文,是寒武纪团队在2014年发布的首个多核深度学习处理器架构DaDianNao。

2017年8月,寒武纪完成一亿美元A轮融资,由国投创业,阿里巴巴创投、联想创投、国科投资、中科图灵、元禾原点、涌铧投资联合投资,成为领域内第一个独角兽初创公司。2018年6月,寒武纪完成数亿美元B轮融资,估值达到30亿美元。

    责任编辑:李跃群