国内首发大算力存算一体AI芯片亮相深度解析其多层次架构与创新技术
国内首款大算力存算一体AI芯片鸿途H30:深度解析其多层次架构与创新技术
在美国硅谷的车库里诞生了惠普、苹果和亚马逊等改变世界的科技巨头,而中国的沙县小吃则是后摩智能创始人兼CEO 吴强和他的团队灵感来源的地方。就在那顿热气腾腾的馄饨中,吴强和他的小伙伴们讨论着如何实现万物智能,打造更好的AI芯片。
两年的努力后,后摩智能正式发布了国内首款大算力存算一体智驾芯片鸿途H30,这颗芯片拥有最高物理算力256TOPS,典型功耗仅35W。基于鸿途H30打造的智能驾驶解决方案已经在合作伙伴的无人小车上完成部署,并将于6月份开始给Alpha客户送测。
所谓存算一体,从字面理解就是将存储和计算融为一体。这是一种比传统架构更接近人脑计算方式,有着远高于传统方式的计算效率。鸿途H30采用数字存算一体架构,以SRAM作为存储介质,在Int8数据精度条件下,其AI核心IPU能效比高达15Tops/W,是传统架构芯片的7倍以上。
此外,鸿途H30基于12nm工艺制程,在Int8数据精度下实现高达256TOPS物理算力,但所需功耗不超过35W,全SoC能效比达到7.3Tops/W,它具有高计算效率、低延时、高灵活性等特点。在实际性能测试中,该芯片基于Resnet 50模型可达到8700帧/秒(Batch Size=1)至10300帧/秒(Batch Size=8)的性能。
为什么先攻汽车市场?吴强认为,因为别的大赛道卷得太厉害,不如选择一个相对较新的赛道来挑战。而且,无人驾驶确实是一个空间很大的领域,是未来自动化发展的一个关键方向。张永伟副理事长兼秘书长也认为,无人驾驶市场规模庞大,为新技术和新企业提供了巨大的机遇。
为了应对这些需求,后摩智能推出了专用IPU——天枢架构,它采用多核、多硬件线程扩展算力,同时保证通用性。此外,还有易用性的工具链——后摩大道支持PyTorch、TensorFlow以及ONNX等主流开源框架,以及SIMD/SIMT编程模型,以保障开发效率与运行效率平衡。
虽然目前只有一代产品,但未来的计划已然铺陈开来。第二代天璇架构正在研发中,将采用Mesh互联结构,可根据应用场景配置不同数量单元;第三代天玑架 架构已经开始规划,将为万物智能时代服务。此外,还有即将推出的鸿途H50支持2025年量产车型使用,即将到来的还有更多革新产品。
总之,无论业界是否认同存算一体是颠覆式创新,一切都要通过市场检验。而对于吴强及其团队来说,他们会坚持底层技术创新,不断追求极致效率,与生态链合作共同进步,为实现万物智能而奋斗。