近期,MLCommons公布了MLPerf v3.1基准测试的最新结果,这是一项针对AI模型训练的行业标准,可衡量不同AI加速器的实际表现。
内置AMX高级矩阵扩展的Intel第四代至强可扩展处理器(代号Sapphire Rapids),仍然是唯一提交MLPerf测试结果的CPU,表现依旧可圈可点。
本次,Intel提交了四代至强在ResNet50、RetinaNet、BERT、DLRM dcnv2四个模型项目中的测试结果。
其中在DLRM dcnv2这个新提交的测试模型中,Intel四代至强只使用四个节点,就在227分钟内完成了训练。
ResNet50、RetinaNet、BERT模型中,Intel四代至强也表现出了不俗的开箱即用性能。
在今年6月、9月、11月公布的三次MLPerf测试中,Intel都提交了基于四代至强的多个推理基准测试。
结果显示,Intel四代至强在面对通用AI工作负载时拥有出色的性能,涵盖视觉、语言处理、语音和音频翻译模型,大型DLRM v2深度学习推荐模型,60亿参数大语言模型,计算机视觉与自然语言处理模型ChatGPT-J,等等。
此外,Intel也与OEM厂商合作,提交了更多测试结果,进一步展示了四代至强AI性能的可扩展性。
截止目前,Intel四代至强处理器已经出货了超过100万片,为不少AI场景提供加速,比如百度云新一代云服务器BCC实例、腾讯BERT模型、阿里云地址标准化业务、淘宝搜索定制化推荐业务,等等。
12月14日,Intel将正式发布代号Emerald Rapids的第五代至强可扩展处理器,最多64核心128线程,可在同样的功耗水平下提供更高的性能和存储速度。