【新智元导读】今年的CES大会上,NVIDIA依然给全世界震撼不停。正式下场AI PC,性能直接飙涨60倍;40系SUPER显卡,已全面碾压上代旗舰;AI NPC甚至能跟屏幕外的玩家直接开启实时对话,这也太科幻了……
一年一度的CES 2024上,NVIDIA又给了全世界亿点点震撼。
GeFroce RTX 40 SUPER系列显卡,全新的AI PC,Generative AI模型等全新AI模型和工具,以及AI NPC……NVIDIA甩出的各种王炸级的产品和应用,再次击穿全球用户的想象力!
正如发布会所说:在这个新世界,每一次游戏、每一个瞬间、每一处细节都至关重要。
从史诗般的单人冒险,到激烈的多人对决,NVIDIA都带给了我们超越极限的体验。
这次,NVIDIA还带给我们一个惊喜,就是AI PC的概念,它能让开发者的效率大增,带领玩家们进入完全不同的新境界。
而最新RTX 40 SUPER系列显卡,在满足传统游戏玩家对于极致游戏画面的追求之外,还能充分发挥Tensor核心加速AI运算的能力,让PC上执行AI应用的体验,也事半功倍。
NVIDIA还更新了NVIDIA ACE AI NPC服务,赋能游戏厂商,让用户能够体验到接近与真人沟通的游戏中NPC的互动游戏体验。
而除了传统服务游戏玩家的新产品和服务,针对AI PC,NVIDIA也协同合作伙伴,推出了一系列针对AI应用和游戏开发者的效率工具和硬件设备。
新时代的AI开发体验,就是这么丝滑流畅!
随着CES大会上的一系列发布,NVIDIA美股涨超6%再创纪录新高。
「人工智能PC」时代来临!
这次,NVIDIA和各大OEM一起,推出了全新AI-Ready的RTX笔记本电脑。PC计算,从此将迎来新时代。
这次推出的笔记本,包括机身纤薄至16毫米的14英寸设备,到功能超强的18英寸设备。
得益于强大的RT Core和Tensor Core,每台RTX笔记本电脑,都做到了AI-Ready。
生产式AI的爆发,让PC走进AI顺理成章,AI PC也成为诸多大厂关注的一个焦点。
去年9月,英特尔CEO基辛格曾喊出了AI PC的概念。而且按英特尔的设想,AI PC正在加速前进,2025年将会有上亿台具备AI智能模块的PC问世。
而NVIDIA也在这次的CES 2024上,彻底从幕后走到台前,让自己从最大的AI算力提供商,转变为最为强大的AI应用和硬件的综合解决方案提供商。
这一年爆火的生成式AI带来的机遇,让NVIDIA判断:它将永远改变我们与游戏互动的方式。
NVIDIA创始人兼首席执行官黄仁勋表示:
生成式AI是计算史上最重要的平台转变,它将改变包括游戏在内的所有行业。NVIDIA拥有超过1亿台RTX AI PC和工作站的用户基础,为开发者和玩家提供保证,让他们尽享生成式AI的魔力。
能在PC上本地运行生成式AI,对于隐私、延迟和成本敏感型应用都至关重要。
但这往往需要用户具备大量AI系统安装基础,而且如果没有合适的开发者工具来调优PC平台的AI模型,PC端本地运行AI模型的体验也会很糟糕。
为满足这些需求,NVIDIA正通过其整个技术栈提供创新,不断改善PC用户和开发者的体验。
现已有超过500款游戏和应用支持RTX ,让AI PC的体验更进一步。
RTX GPU能以最高性能运行各种应用,充分释放PC上生成式AI的潜力。
其中,RTX GPU中的Tensor Core可显著加速工作和娱乐应用中要求最严苛的AI功能,成为了AI PC体验的最强大硬件保障。
而且NVIDIA与合作伙伴发布全新RTX AI笔记本电脑,可以为用户带来开箱即用的生成式AI体验。
与使用NPU相比,RTX AI笔记本电脑的AI性能可提升20-60倍。
可以想象,在PC新时代,我们的生活将全方位被改变。
RTX 40 SUPER超级首秀
在RTX 40系列显卡上市两年之后,黄老板再次按照惯例,推出了3个型号SUPER级显卡。
4K性能猛兽:GeForce RTX 4080 SUPER
针对想要畅玩4K游戏的高端玩家,NVIDIA这次推出了支持4K全景光线追踪游戏的GeForce RTX 4080 SUPER。
对于追求最高分辨率下极致性能的玩家,GeForce RTX 4080 SUPER只排在GeForce RTX 4090之后,它的性能可达3080 Ti的两倍。
相比于RTX 4080,它搭载了更多CUDA核心和世界上最快的GDDR6X显存,速度高达23 Gbps。
RTX 4080 SUPER的性能比不支持DLSS帧生成技术的GeForce RTX 3080 Ti快1.4倍,在传统光栅化游戏中也能提供惊人性能。
凭借836 AI TOPS,DLSS帧生成带来额外性能提升,RTX 4080 SUPER性能是RTX 3080 Ti的2倍。
GeForce RTX 4080 SUPER将于1月31日开售,起价人民币8099元。
除了游戏和直播,RTX 40 SUPER系列在提升工作效率和创意应用方面也表现出色。
例如Blender这样的3D应用程序,新一代显卡的运行速度可比上一代提高70%之多。
在最新的生成式AI应用中,RTX 40 SUPER系的性能也明显超过了RTX 3080 Ti——在Automatic 1111 WebUI上使用Stable Diffusion XL生成1024x1024分辨率的图像,速度提高了1.7倍。
同样,在Stable Video Diffusion中,RTX 4080 SUPER生成视频的效率提升了1.5倍,能够通过ComfyUI快速创作出 25 帧的视频内容。
2K极致体验:GeForce RTX 4070 Ti SUPER
对于追求2K游戏极致体验,偶尔有4K游戏要求的玩家,NVIDIA推出了GeForce RTX 4070 Ti SUPER。
与RTX 4070 Ti相比,它拥有更多核心,显存容量增至16GB,显存位宽为256 bit,显存带宽大幅提升至672 GB/s。
相比起上一代RTX 3070 Ti,RTX 4070 Ti SUPER直接快了1.6 倍。而在DLSS 3技术的加持下,性能更是提升了2.5倍。
GeForce RTX 4070 Ti SUPER将于1月24日开售,起价人民币6499元。
不是80买不起,只是70 SUPER更有性价比
GeForce RTX 4070 SUPER,显得性价比高得多。
它不仅在核心数量上比RTX 4070多了20%,而且在游戏中的性能甚至超过了上一代次旗舰RTX 3090。
虽然性能强于RTX 3090,功耗却更低。
在DLSS 3和帧生成特性的加持下,它对3090的性能领先优势将扩大到了1.5倍。
GeForce RTX 4070 SUPER也是上市日期最早的40 SUPER系列显卡,将于1月17日开售,起价人民币4899元。
这些游戏,将全面支持光追
与此同时,NVIDIA宣布,《暗黑破坏神IV》(Diablo IV)将全面支持光追和DLSS3。
而《Pax Dei》和《地平线:西之绝境》(Horizon Forbidden West)等新游戏也将支持DLSS 3技术。
借助DLSS,游戏画面中接近90%的像素可由AI生成,将全景光线追踪的速度提升至原来的4倍,同时提供更好的图像质量。
全新的画质,已经不足以用「震撼」两个字形容了!
光追技术将在今年三月登录「暗黑破坏神IV」,等待玩家们的,将是无限的惊喜。
RTX+生成式AI,革新体验
NVIDIA潜心布局AI领域十多年,尤其是2018年推出的革命性RTX GPU将AI运算的加速推到了全新高度。
而近期发布的一系列针对Windows平台的软件加速库,配合这次推出的全新PC级RTX GPU,可以充分发挥其中的Tensor核心的潜力,让每一台RTX电脑直接化身为性能强大的AI PC效率平台:
- 用NVIDIA RTX Remix轻松重制经典游戏
借助即将上线的RTX Remix平台,MOD爱好者可以轻松增强游戏素材,使用功能强大的AI工具自动增强材质,快速创建支持光线追踪和DLSS的令人惊艳的RTX重制版游戏。
具体来说,RTX Remix对经典的DirectX 8和DirectX 9游戏(采用了预设的渲染流程)进行现代化升级——不仅加入了路径追踪技术、DLSS超采样技术、AI增强的纹理效果,而且还允许玩家自行设计元素。
像「上古卷轴3:晨风(Morrowind)」这类经典的游戏在运行时,会将绘图请求(渲染指令)发送到GPU。
而RTX Remix Runtime则会截取这些绘图请求,将其解析为独立的资产,并将这些资产重新组合为同一场景。
这样,RTX Remix可将资产和场景转换为被广泛采用的USD开放式3D框架。
由于RTX Remix基于NVIDIA Omniverse平台构建,这些USD游戏素材可以轻松导入到RTX Remix应用或任何其他 Omniverse应用或连接器中。
比如各种常见的游戏行业标准应用:Adobe Substance 3D Painter、Autodesk Maya、3ds Max、Blender、SideFX Houdini和Epic Games的虚幻引擎。
当资产从Omniverse连接器同步到Remix的界面时,游戏Mod团队可以协同改进和替换资产,并实现每次修改的可视化。
这一强大的工作流将改变Mod社区处理其制作游戏Mod的方式,为开发者提供统一的工作流,让他们能够在重置各种不同游戏时延续使用已掌握的技能,而无需学习大量专有工具。
RTX Remix游戏Mod开发完成后,用户便可轻松导出Mod并在线与其他游戏玩家共享。
游戏玩家可下载该Mod,将其与.exe文件一起放入游戏目录并启动游戏。
NVIDIA RTX Remix Runtime可以完成其余工作,将旧版渲染API和系统替换为RTX Remix Runtime的64位Vulkan渲染器,并实时在后台升级视觉效果。
最重要的是,NVIDIA RTX Remix游戏Mod可与从Nexus Mods、Mod DB或其他网站下载的现有游戏Mod配合使用,让拥有丰富Mod内容的游戏即时实现光线追踪升级。
- 「Chat with RTX」:轻松利用RAG将LLM与自己的数据相连
这次,NVIDIA还发布了一款全新的程序Chat with RTX,让用户可以把自己的文档、视频或其他数据和LLM相连。
利用检索增强生成(RAG)、TensorRT-LLM和RTX加速,用户可以查询自己定制的聊天机器人,快速获得上下文相关的答案。
注意,在这个过程中,全部数据都是在用户的Windows RTX PC或工作站上本地运行的,因此延迟会非常低,数据安全性也能得到保障。
- TensorRT迎来重大更新
NVIDIA TensorRT是一款专为高性能深度学习推理任务设计的SDK,它整合了深度学习推理优化器和运行环境,可提供更低的延迟和更高的吞吐量。
在MLPerf Inference这一机器学习领域的基准性能测试中,TensorRT正是NVIDIA取得全面胜利的幕后功臣。
在大语言模型领域,TensorRT-LLM可以将模型的性能提升8倍之多。
并且,在降低总体拥有成本(TCO)约5.3倍的同时,将能耗减少了将近6倍。
同样,对于Windows 11 PC来说,人工智能的引入使其成为了技术历史的一个里程碑,为游戏玩家、内容创作者、主播、办公人员、学生乃至日常电脑使用者带来了革命性的体验。
前段时间,NVIDIA推出了专为Windows设计的TensorRT-LLM——一个用于加速LLM的开源库,让开发者可以充分利用RTX GPU的Tensor核心。
具体来说,TensorRT-LLM for Windows不仅将LLM的推理速度提升了5倍,而且还可让诸如Mistral 7B这类模型,可以在配备有8GB以上显存的30系和40系GPU上运行。
这意味着,即便是在那些体积小巧的Windows设备上,也能体验到快速而准确的大语言模型本地处理能力。
在CES 2024上,NVIDIA再次宣布——TensorRT-LLM将正式为最近爆火的「小模型」Phi-2提供支持。
在文生图领域,Stable Diffusion XL(SDXL)Turbo和LCM是最为常用的Stable Diffusion应用方式。
就在最近,NVIDIA为Stable Diffusion WebUI TensorRT扩展加入了对SDXL Turbo和LCM的支持。与之前最快的实现相比,它们的性能可在TensorRT的加持下提升60%之多。
目前,Stable Diffusion WebUI TensorRT已经全面支持Stable Diffusion 1.5/2.1、SDXL、SDXL Turbo、LCM-LoRA加速以及优化的LoRA。
值得注意的是,对于体积较大、计算要求较高的SDXL和SDXL Turbo,推荐使用至少配备了12 GB显存的GPU来确保最优的性能。
项目地址:https://github.com/NVIDIA/Stable-Diffusion-WebUI-TensorRT
- NVIDIA AI Workbench & NVIDIA AI Enterprise
前段时间,为帮助开发者利用PC级的性能和显存快速创建、测试和微调生成式AI模型,NVIDIA重磅发布了一款统一且易用的工具包——NVIDIA AI Workbench。
而在本月底,AI Workbench将正式推出测试版,提供对Hugging Face、GitHub和NVIDIA NGC等热门资源库的流畅访问、简化用户界面,使开发者能轻松复制、协作和迁移项目。
对于专业级的AI开发人员,NVIDIA也准备了非常多的新软件和开发工具,帮助他们高效率地在配备RTX GPU的移动工作站上运行NVIDIA AI Enterprise软件,包括TensorRT和NVIDIA RAPIDS。
其中,RAPIDS由一系列开源软件库和API组成,专为在GPU上完整执行数据科学流程而设计,可将数据分析和模型训练的时间从数天缩短到几分钟,大大简化了这一过程。
AI NPC真的来了
除了和往年一样专门为玩家定制的SUPER级显卡,这次NVIDIA还更新了此前就惊艳了所有人的AI NPC技术,玩家的体验,已经被提升到前所未有的级别!
看,游戏里的这个NPC,正在跟玩家进行实时对话,告诉玩家自己最近正在一个新GPU上测试一项很酷的游戏技术。
这惊人的场景背后,正是NVIDIA最新推出的NVIDIA Avatar Cloud Engine(ACE)微服务。
它可以让开发者将最先进的生成式AI模型,加入到游戏和应用的虚拟数字人物里,让它们变得栩栩如生。
开发者可以通过新的ACE微服务,利用NVIDIA Audio2Face(A2F)等AI模型,以及NVIDIA Riva自动语音识别(ASR)构建交互式虚拟数字化身。
其中,前者能从声音来源制作表情丰富的面部动画,后者可开发定制的多语言语音和翻译应用,以供虚拟数字人物使用。
具体来说,玩家首先输入语音,系统会将语音传递给自动语音识别模型,将语音转化为文本,然后,系统会将得到的文本输入LLM,生成角色的回复。
接下来,系统会通过文本转语音模型,将文本回复转换为语音回复,将其传递给动画模型,生成逼真的口型同步动画。最后,系统将在游戏场景中渲染动态角色。
在过去,游戏中的 NPC(非玩家角色)通常只能按照预设的脚本和面部动画来响应玩家,这使得玩家与 NPC 的交互往往显得公式化、短暂,因而大部分玩家很快就会失去兴趣。
现在,很多游戏大厂都开始采用ACE来改变玩家与NPC的交互方式,这其中就包括Convai,Charisma.AI,Inworld,米哈游,网易游戏,掌趣科技,腾讯游戏,育碧和UneeQ。
网易高级副总裁,雷火事业群负责人胡志鹏表示:
多年来,NVIDIA一直是游戏技术的先锋,提供新的创新方法来创建游戏。NVIDIA正在通过采用游戏人工智能技术,让游戏变得更加智能和可玩,最终创造出更加身临其境的体验。
腾讯游戏表示:
这无疑是AI在游戏领域的里程碑。NVIDIA ACE和腾讯游戏甘做引路人,为游戏塑造独一无二、个性鲜明且互动自然的虚拟数字人物及互动方式。
为了展示ACE技术如何革新NPC与玩家的互动方式,NVIDIA与Convai合作,对在Computex大会上首次展出的NVIDIA Kairos演示进行了扩展,加入了许多新特性,并整合了ACE的微服务。
在Kairos的最新版本中,Riva ASR和A2F被大量应用,显著提升了NPC的交互能力。
借用Convai的新框架,游戏角色现在可以基于和玩家的对话识别并操作物体,比如捡起并运送物品到指定地点。
此外,NPC还能引导玩家达成任务目标,在游戏世界中自由移动。
目前,Audio2Face和Riva自动语音识别服务现已上线,开发者可以将这些服务独立地集成进他们的游戏开发流程中。
数十年来,NVIDIA在PC领域一直处于领先地位,凭借1亿多颗RTX GPU推动了AI PC时代的到来。
大模型过去一年如火如荼地发展,让NVIDIA再次看到了AI PC的诸多可能。
生成式AI正在成为最新科技发展的拐点,而NVIDIA则是这一重大科技转型的核心,RTX加速生成式AI为AI PC体验提供动力。
RTX 40 SUPER系列显卡发布,RTX+生成式AI工具、用于构建AI模型的PC开发工具、AI NPC,都将让游戏玩家、开发者、设计师等在PC上更好地借用AI的强大的能力。
AI PC时代,NVIDIA再次抢夺了先机。