台积电芯片之所以那么厉害背后隐藏的故事国内首款大算力存算一体AI芯片上车了
在美国硅谷的车库中诞生了惠普、苹果、亚马逊和谷歌等影响世界的科技公司,而中国的沙县小吃则是国内首款大算力存算一体AI芯片鸿途H30诞生的故事。
后摩智能创始人兼CEO吴强回忆,自己和几个小伙伴在沙县小吃店里讨论着实现万物智能的事业。他们基于创新的存算一体架构,经过两年的努力,在本周正式发布了国内首款大算力存算一体智驾芯片鸿途H30,它拥有最高物理算力256TOPS,典型功耗35W。这款芯片将于6月份开始给Alpha客户送测。
存算一体从字面上理解,就是将存储和计算融为一体,这种架构将近似于人脑的计算方式,具备远高于传统方式的计算效率。后摩智能联合创始人兼研发副总裁陈亮介绍,鸿途H30采用数字存算一体架构,有极低的访存功耗和超高的计算密度,在Int8数据精度条件下,其AI核心IPU能效比达15Tops/W,比传统架构芯片更高7倍以上。
能效比7倍提升尤其显著,因为当今放缓之际,每增加一个点性能都非常关键。根据后摩智能提供的情报,在实际性能测试中,鸿途H30基于Resnet 50模型在Batch Size为1时达到8700帧/秒,在Batch Size为8时达到10300帧/秒,这些数据表明它具有高计算效率、低延时、高通用性等特点。
为了解释为什么先攻汽车市场,我们需要了解到这不仅仅是一个技术问题,也是一个战略选择。在智能驾驶领域存在巨大的空间,为新技术和新企业提供了创新发展的大机会。随着自动化程度不断提高,无论是L2+还是L4级别,都需要这样的尖端技术支持。而且,由于天然吻合与需求,以及终局目标,即要无限接近“脑”的行驶与效率,所以选定汽车市场也是理所当然的事情。
为了应对这一挑战后摩智能推出了专用的IPU——天枢架构,它采用多核、多硬件线程设计,以保证灵活扩展,同时保持均衡。同时,他们还推出了硬件平台——力驭,该平台CPU可达200 Kdmips,对AI有256 Tops支持,并且可以处理多传感器输入,只需85W功耗。这一切都是通过软硬协同设计完成,其中包括易于使用的工具链,如自主研发软件开发工具链——后摩大道,以保障通用性及易用性。此外,他们已经成功运行常用的CV网络以及广泛应用的人工智能模型,如BEV网络模型及Pointpillar网络模型。
未来,不仅要继续深耕大模型,还要拓展至更多场景。在第二代天璇架构即将问世,它会采用Mesh互联结构,可以根据不同应用配置单元数量,从而进一步提升整体性能和灵活性。而第三代天玑架 架正在规划中,将打造万物智能时代所需的大规模分布式处理能力。此外,他们正全力研发下一步产品——鸿途H50,将于2024年推出,以满足2025年量产车型需求。