据悉,Numenta采用了一种新颖的方法来提高CPU性能,毫无疑问的,对整个科技行业来说,这意味着AI硬件军备竞赛的最新转折。
Numenta已经证明,通过应用一种最新方法,英特尔CPU在人工智能工作负载上的性能可以远远超过目前最好的CPU和GPU。据Serve the Home报道,这家初创公司使用了一系列基于这一理念的技术,并以Numenta智能计算平台(NuPIC)为品牌,在人工智能推理方面解锁了传统CPU的新性能水平。
真正令人惊讶的是,它的性能明显优于专门为处理人工智能推理而设计的GPU和CPU。例如,Numenta采用了Nvidia报告的A100 GPU性能数据的工作负载,并在增强型48核第四代Sapphire Rapids CPU上运行。在所有场景中,根据总吞吐量,它都比Nvidia的芯片更快。事实上,它比第三代Intel Xeon处理器快64倍,比A100 GPU快10倍。
利用神经科学提升人工智能性能
Numenta作为一家成立于2005年的公司,专门致力于复制人类大脑的功能,并将其用于人工智能领域,其创始人创始人杰夫·哈金斯是美国著名发明家、计算机科学家和神经科学家,美国工程院院士。2004年,他出版了一本科普著作《On Intelligence》,把人工智能这个陌生概念播撒到无数人的心里。
事实上本次突破也是其经过长达17年的深入大脑研究,NuPIC标志着其终于迈出了这一人工智能领域重要的里程碑,将AI的处理效率提高100倍,并为开发人员和企业提供了更高的灵活性和控制权,同时确保了数据的安全性和隐私性。
此前的十几年间,Numenta以其受神经科学启发的人工智能工作负载方法而闻名,它严重依赖稀疏计算的理念——这就是大脑在神经元之间形成连接的方式。
如今,大多数CPU和GPU都是为密集计算而设计的,尤其是人工智能,这比大脑神经元工作的模式更加“暴力”。尽管众多事实证明这是提高性能的必由之路,但CPU却无法以这种方式良好工作。这就是Numenta发挥作用的地方。
这家初创公司希望通过将其“秘密武器”应用于通用CPU,而不是专门为处理以人工智能为中心的工作负载而构建的芯片,从而释放人工智能模型中稀疏计算的效率增益。
虽然它可以在CPU和GPU上工作,但Numenta采用了Intel Xeon CPU,并应用了其高级矢量扩展(AVX)-512和高级矩阵扩展(AMX),因为英特尔的芯片是目前最可用的。这些是x86架构的扩展——作为额外的指令集,可以让CPU执行更苛刻的功能。
Numenta使用Docker容器提供NuPIC服务,并且可以在公司自己的服务器上运行。如果它在实践中发挥作用,这将是重新利用数据中心中已部署的CPU来处理AI工作负载的最佳解决方案,特别是考虑到Nvidia业界领先的A100和H100 GPU的等待时间较长。