查看原文
其他

英伟达发布RTX 4090挤爆牙膏,新一代自动驾驶芯片THOR高算力卷死友商

来源:大数据文摘
编辑:硕博生活圈

“慧眼观世界,关注就要发声。大家好,这里是硕博生活圈。”

9月18日,英伟达在官方频道上传了“GeForce Beyond”视频,主讲人不出意外还是我们熟悉的“黄教主”,视频预定于20日23点首发。


由于是录制视频,显然所以产品型号、规格和价格看来已经最终敲定,只待浮出水面。


早在官方预热中,英伟达几乎已经明示了要发基于Ada Lovelace架构的首款RTX 40系显卡,所以今天的整个发布会相对来说,悬念不大。



当然,除了RTX 40系列显卡,黄教主还带来了新一代自动驾驶芯片THOR,算力之高直接卷死友商。


我们一起来看看吧~


全球最快的游戏GPU,售价12999起,10月份上市


首先最亮眼的还是RTX 4090,号称全球最快的游戏GPU,具760亿个晶体管、16384个CUDA核心和24GB GDDR6X显存,在4K分辨率的游戏中持续以超过100 FPS运行。


英伟达称在完整的光线追踪游戏中,与上一代采用DLSS 2的RTX 3090 Ti相比,采用DLSS 3的RTX 4090的性能提升可达4倍



在现代游戏中,在保持了相同450W功耗的情况下,RTX 4090的性能提升高达2倍


黄教主表示,40系显示芯片将采用全新的Ada Lovelace架构,该架构以女数学家Ada Lovelace命名,以致敬19世纪英国数学家Ada,她也被认为是地球上最早的计算机程序员。


全新的Ada架构有三大进步。第一便是其SM多单元流处理器包含了新技术Shader Execution Reordering(着色器执行重排序),该技术可实时重新调度任务,将光线追踪性能提升2-3倍。


其次,全新的RT Core有着两倍的光线与三角形求交性能,以及两个全新的重要硬件单元,即将光线追踪的Alpha-Test几何性能提升2倍的全新Opacity Micromap引擎,和可提升几何图形丰富度且不会带来更多BVH构建和存储资源消耗的全新Micro-Mesh引擎。


最后,全新的Tensor Core还新增了Hopper FP8 Transformer Engine,其可提供1.4 petaFLOPS的张量处理性能。



RTX 4090还搭载一个用于DLSS 3像素处理的300TOPS光流加速器,总体处理吞吐量提升达4倍,相较于目前的旗舰GPU 3090Ti,RTX4090使游戏“微软模拟飞行”速度提升达2倍,使游戏“传送门”RTX版的速度提升达3倍,使“RacerX”的速度提升达4倍。


黄教主表示,这款基于深度学习的超分辨率技术,由全新第四代Tensor Core和GeForce RTX 40系列GPU的全新光流加速器驱动,是英伟达广受好评的深度学习超级采样技术的最新版本,并拥有开创性的光学多帧生成功能。


该显卡将于10月12日上市,建议零售价人民币12999元起。


同时,英伟达还宣布推出采用两种配置版本的RTX 4080


RTX 4080 16GB版本拥有9728个CUDA核心和16GB GDDR6X显存,性能可达GeForce RTX 3080 Ti的2倍,在较低功率下,性能比RTX 3090 Ti更强大。


RTX 4080 12GB则拥有7680个CUDA核心和12GB GDDR6X显存,性能也远超RTX 3080 Ti。


两种配置版本的RTX 4080将于11月上市,建议零售价分别为人民币9499元起和人民币7199元起。


由此来看,黄老邪这次算是把牙膏给挤爆了



英伟达推出新一代自动驾驶芯片,要卷爆友商?

除了RTX 40系的亮相外,英伟达还推出了NVIDIA DRIVETM Thor,英伟达的下一代安全可靠的自动驾驶芯片。


DRIVE Thor性能可达到2000万亿次浮点运算,这要得益于它将智能功能,包括自动驾驶和辅助驾驶、停车、司机和乘客监控、数字仪器集群、车载信息娱乐(IVI)和后座娱乐等,统一成一个单一架构,以提高效率,降低成本。

下一代超级芯片配备了最先在NVIDIA HopperTM多实例图形处理器体系结构中引入的尖端人工智能功能,以及NVIDIA GraceTM CPU和NVIDIA Ada Lovelace图形处理器。DRIVE Thor 与 MIG 对图形和计算的独特支持使IVI和高级驱动程序辅助系统能够运行域隔离,从而允许并发的时间关键进程在没有中断的情况下运行。

DRIVE Thor可用于汽车制造商的2025年车型,同时英伟达也将通过在同一时间内向市场提供更高的性能和先进的功能来加速生产路线图。

黄教主表示,“加速计算和人工智能正在以光速进步”。而DRIVE Thor不仅具有闪电般的性能,还能为汽车提供连续升级、安全和可靠的软件定义的超级计算机。

可以说,DRIVE Thor是集中式计算机的超级英雄

DRIVE Thor支持多域计算,自动驾驶和IVI的隔离功能。通常情况下,几十个电气控制单元分布在整个车辆,以供电的个别功能。通过DRIVE Thor,制造商可以有效地将多种功能整合到一个系统单晶片(SoC)上,从而减轻了供应限制,简化了车辆设计开发,大大降低了成本,减少了电缆,也减轻了重量。

DRIVE Thor作为英伟达首个采用推理变压器引擎的AV平台,将成为英伟达图形处理器中张量核心的一个新组件。通过该引擎,DRIVE Thor可以将变压器深层神经网络的推理性能提高高达9倍,这对于支持与自驱动相关的大规模和复杂的人工智能工作负载是至关重要的。

除此之外,DRIVE Thor拥有8位浮点(FP8)能力。通常,开发人员在将32位 FP 数据转换为8位整数格式时会丧失神经网络的准确性,而DRIVE Thor具有2000万亿次浮点运算的FP8精度,允许在不牺牲精度的情况下过渡到8位。

新的超级芯片还采用了最新的NVLink-C2C芯片互连技术,同时运行多个操作系统。NVLink-C2C的优势在于它能够以最小的开销在整个链路上共享、调度和分配工作。这为汽车制造商提供了计算空间和灵活性,以建立软件定义的车辆,可通过安全的无线软件更新不断升级。

吉利旗下的汽车制造商ZEEKR就抢先宣布,他们即将把DRIVE Thor率先集成到集中式车载计算机上,用于下一代智能电动汽车,并将于2025年初开始生产。这标志着交通运输行业对这种新型超级计算机架构的支持。

ZEEKR首席执行官An Conghui说: “ZEEKR用户需要一种包括最新技术和安全特性的豪华体验。NVIDIA DRIVE Thor不仅拥有提供满足客户需求的尖端技术,还能确保ZEEKR始终处于未来创新的前沿。”

Omniverse或成为打开全模拟仿真世界的钥匙

等等,还没结束。

除了GPU新品外,英伟达还宣布对用于构建和操作工业元宇宙的应用程序Omniverse进行更新。

对此黄教主说到,Ada不仅对游戏玩家而言是一次巨大飞跃,也是在为Omniverse等全模拟仿真世界铺平道路。


Omniverse是一个实时的大型3D数据库、可以共享的3D世界,主要基于USD构建的网络,实现与3D世界的连接。同时,作为一个计算平台,Omniverse也鼓励开发者们在其上进行创作,这些应用就如同进入Omniverse虚拟世界的门户。

现在,Omniverse也将支持Ada Lovelace GPU,在光线追踪和大型场景性能方面实现巨大飞跃,基于GAN和扩散模型的新型神经渲染工具OmniGraph是一个图形执行引擎,可通过程序化的方式控制行为、动作和行动。

另外,全新的Cloud XR支持在VR中实现Ada强大的光线追踪功能。

“Omniverse是一个企业平台,该平台适用于从产品设计和造型到工程策划、制造、营销和运营的整个生命周期,”黄教主说到,“无论是制作电影或游戏,生产汽车或任何消费品,还是建立和运营工厂和仓库,其核心都是超级复杂的3D制作流程。正如互联网连接了各个网站,Omniverse连接了3D世界,它能让创作者更加高效的协作和管理工作”。

对于未来,黄教主也是大胆预测道,所有的产品都将具有数字孪生,制造商利用数字孪生模拟产品在物理世界中的作用和性能,如果不对软件的数字孪生版本进行测试,则无法大规模部署该软件所运营的物理产品。

我是硕博菌,慧眼观世界,分享知与否,为你的关注发声。


往期精彩推荐:

科研工具合集:文献网站、翻译软件、润色客户端,查重软件,全套打包下载


【硕博生活网—考研、学术、就业、软件、交友】:

www.shuobolife.com

【硕博部落—强大的学术搜索引擎】:

www.shuobolife.cn

版权声明

本文来源:除特别注明原创授权转载文章外,其他文章均为转载,版权归原作者或平台所有,仅用于学术分享。如有侵权请联系小编删除,谢谢。编辑:公众号硕博生活圈

1.本硕博交流群&学术群&考研群,回复“”加入;

2. 高质量SCI期刊推介,免费下载99.9%学术论文;

3.考研&考证&考级&SCI&软件回复“资源”获取。

哎呦,不错哦~

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存