NVIDIA全系列GPU技术路线演进分析

 

22fdd8fc3d0e93403191e783fa68a032.jpeg

NVIDIA GPU 架构梳理

 

近期深入研究并行计算,需探究底层硬件精髓。高性能计算界,英伟达显卡稳居霸主地位。本文旨在梳理NVIDIA GPU架构之演进历程,助您洞悉其技术脉络,把握未来计算趋势。


目录

NVIDIA GPU架构历经数次革新:从Tesla架构奠定基石,到Fermi架构提升性能,再到Kepler架构优化能效,Maxwell架构深化节能设计。Pascal架构强化深度学习,Volta架构推动高性能计算,Turing架构引领光线追踪,直至Ampere架构重塑游戏与创作体验。每一代都是技术革新的里程碑。

一、NVIDIA GPU的架构演变历史和基本概念[1]

截止2021年,发布时间离我们最近的8种NVIDIA GPU微架构是:

  • Tesla
  • Fermi
  • Kepler
  • Maxwell
  • Pascal
  • Volta
  • Turing
  • Ampere

NVIDIA以其独特的命名方式,将GPU微架构与历史上的杰出科学家相结合,其八大微架构分别致敬了特斯拉、费米、开普勒、麦克斯韦、帕斯卡、伏打、图灵和安培等科学巨匠。

其中最新的是2020年宣布的Ampere架构。

二、Tesla 架构

698ceb7773d9f1882f15445b08afe296.jpeg

经典型号是G80,在Fermi架构白皮书的开篇部分有对G80的简要介绍:

  • G80 GPU创新支持C语言,程序员无需另学新语言,即可畅享GPU强大性能。作为首款支持C语言的GPU,G80引领行业新潮流。
  • G80作为首款采用单一统一处理器的GPU,颠覆了传统独立的顶点和像素管道设计,强效执行顶点、几何、像素及计算程序,开创图形处理新纪元。
  • G80 是第一款使用标量线程处理器的 GPU,无需程序员手动管理向量寄存器
  • G80革命性引入单指令多线程(SIMT)执行模型,实现一条指令驱动多个独立线程并发执行,效能飞跃,引领计算新纪元。
  • G80革命性引入共享内存与屏障同步机制,为线程间通信开辟新天地。这一创新设计,不仅提升了通信效率,更确保了数据同步的精准性,为多线程应用带来了前所未有的性能提升。

9898d1de4b97480dcbbd5d868e86d8eb.jpeg

G80 显卡

三、Fermi架构[2]

Fermi 架构是NVIDIA GPU 架构自初代 G80 以来最重大的飞跃。

NVIDIA GPU研发团队汲取G80与GT200精华,创新设计,缔造全球首款计算GPU。研发过程聚焦关键领域:性能提升、能效优化与技术创新,为计算领域树立新标杆,引领行业未来。

  • GPU在单精度浮点性能上已超越桌面CPU十倍,但针对部分计算密集型应用,双精度性能的提升同样至关重要,我们致力于不断突破,满足您的更高需求。
  • ECC支持功能强大,助力GPU计算在数据中心安全部署。通过ECC,用户可以放心安装大量GPU,保障医疗

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/548080.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【JAVA基础篇教学】第十五篇:Java中Spring详解说明

博主打算从0-1讲解下java基础教学,今天教学第十五篇:Java中Spring详解说明。 Spring 框架是一个广泛应用于 Java 开发的轻量级、全栈式的企业应用开发框架,它提供了众多功能强大的模块,用于简化企业级应用程序的开发。下面详细说…

MySQL慢查询日志配置指南:发现性能瓶颈,提升数据库效率

欢迎来到我的博客,代码的世界里,每一行都是一个故事 MySQL慢查询日志配置指南:发现性能瓶颈,提升数据库效率 前言慢查询日志介绍配置慢查询日志配置慢查询日志失效日志格式与记录内容高级配置与注意事项配置过程中的注意事项&…

【python】flask操作数据库工具SQLAlchemy,详细用法和应用实战

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,…

EasyRecovery激活秘钥2024最好用的电脑数据恢复软件下载

EasyRecovery数据恢复软件是一款专业且功能强大的数据恢复工具,它旨在帮助用户从各种存储设备中恢复由于各种原因(如误删除、格式化、病毒攻击、系统崩溃等)导致丢失的数据。这款软件支持多种存储介质,包括但不限于硬盘驱动器、U盘…

白盒测试之路径覆盖与基本路径覆盖

白盒测试之路径覆盖与基本路径覆盖(蓝桥课学习笔记) 1、路径覆盖 实验介绍 程序中的路径是执行程序时经过的分支的集合。路径覆盖法是指设计一定数量的测试用例运行被测程序,使程序中的所有路径都至少被执行一次。路径覆盖率的计算方法为&a…

web前端js笔记

1,对象 let{ 属性 方法 } 2,闭包 只有函数内部的子函数才能读取局部变量,所以闭包可以理解成定义在一个函数内部的函数,在本质上,闭包是将函数内部和函数外部连接起来的桥梁。 3,math console.log(Math.flo…

✌粤嵌—2024/4/15—汇总区间

代码实现&#xff1a; /*** Note: The returned array must be malloced, assume caller calls free().*/ char** summaryRanges(int* nums, int numsSize, int *returnSize) {char **res malloc(sizeof(char*) * numsSize);*returnSize 0;int i, j;for (i 0; i < numsSi…

npm run serve报错:error:0308010C:digital envelope routines::unsupported

这是因为Node.js17中的OpenSSL加密库不支持当前的加密设置。 因为新版本默认使用OpenSSL 3&#xff0c;它可能不再支持旧版的加密算法或配置。 > demo0.1.0 serve > vue-cli-service serveINFO Starting development server... 10% building 2/5 modules 3 active ...…

2024蓝桥A组D题

团建 问题描述格式输入格式输出样例输入样例输出评测用例规模与约定解析参考程序难度等级 问题描述 格式输入 输入的第一行包含两个正整数n,m&#xff0c;用一个空格分隔。 第二行包含n个正整数c1,c2, ,cn&#xff0c;相邻整数之间使用一个空格分隔&#xff0c; 其中ci表示第一…

Python教程:备份你的文件夹里面的数据

1.完全备份是最基本的备份类型&#xff0c;它涉及复制所有选定的数据到备份位置。无论文件是否自上次备份以来发生了变化&#xff0c;所有文件都会被复制。这种备份方式简单直接&#xff0c;确保了备份存储的数据总是最新的。 完全备份是通过递归复制源文件夹中的所有文件和子…

简单了解C++常见编程问题解决方案

这篇文章主要介绍了C常见编程问题解决方案,文中通过示例代码介绍的非常详细&#xff0c;对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 电脑配置&#xff1a;window10, 64位操作系统&#xff0c;基于x64的处理器&#xff0c;Microsoft Visual Studio Comm…

Fluent网格划分小结

Fluent网格划分小结 1. 确定划分什么网格类型&#xff1f;2. Fluent mesh (FM)网格划分3. 网格划分demo参考资料 1. 确定划分什么网格类型&#xff1f; &#xff08;1&#xff09;结构网格&#xff08;出图好看&#xff0c;论文中说服力强&#xff09;和非结构网格&#xff08…

基于Springboot的校园闲置物品交易网站

基于SpringbootVue的校园闲置物品交易网站的设计与实现 开发语言&#xff1a;Java数据库&#xff1a;MySQL技术&#xff1a;SpringbootMybatis工具&#xff1a;IDEA、Maven、Navicat 系统展示 用户登录 首页 商品信息展示 商品资讯 后台管理 后台首页 用户管理 商品类型管…

适当睡眠有助于缓解抑郁

适当睡眠&#x1f634;&#x1f62a;&#x1f971;&#x1f4a4;&#x1f6cc;&#x1f3fc;有助于缓解抑郁&#x1f917; 睡眠与抑郁之间存在密切的关系。一方面&#xff0c;良好的睡眠可以促进身体和大脑的恢复与修复&#xff0c;有助于缓解抑郁症状并提高生活质量。另一方面…

如何助力数字化校园建设领先一步

数字化校园建设是一个系统工程&#xff0c;涉及教学方法、智慧校园平台、教学资源、硬件设置、后勤服务等多个方面。要想在数字化校园建设中领先一步&#xff0c;需要综合考虑教育理念、技术应用、资源整合、人才培养等多个层面。 数字化校园的建设不是一蹴而就的&#xff0c;而…

​面试经典150题——LRU 缓存

​ 1. 题目描述 2. 题目分析与解析 首先讲解一下LRU LRU 是“Least Recently Used”的缩写&#xff0c;LRU 算法的基本思想是跟踪最近最少使用的数据&#xff0c;并在缓存已满且需要存储新数据时优先驱逐该数据。 LRU 算法通常的工作原理的简化解释&#xff1a; 当访问或使…

农业环境监测设备:促进农业可持续发展

TH-NQ14农业环境监测设备在现代化农业发展中扮演着至关重要的角色。这些设备能够实时监测农田环境参数&#xff0c;为农业生产提供科学依据&#xff0c;促进农业可持续发展。 随着技术的不断进步&#xff0c;农业环境监测设备的功能和性能得到了极大的提升。现代的农业环境监测…

Docker篇(三)— Docker的基本操作

目录 镜像操作镜像名称镜像命令案例1-拉取、查看镜像案例2-保存、导入镜像 镜像操作 镜像名称 首先来看下镜像的名称组成&#xff1a; 镜名称一般分两部分组成&#xff1a;[repository]:[tag]。在没有指定tag时&#xff0c;默认是latest&#xff0c;代表最新版本的镜像 如图…

35. UE5 RPG制作火球术技能

接下来&#xff0c;我们将制作技能了&#xff0c;总算迈进了一大步。首先回顾一下之前是如何实现技能触发的&#xff0c;然后再进入正题。 如果想实现我之前的触发方式的&#xff0c;请看此栏目的31-33篇文章&#xff0c;讲解了实现逻辑&#xff0c;这里总结一下&#xff1a; …

一个实例了解JVM运行原理

下面以一个具体的代码示例&#xff0c;来说明Java代码对象是如何分配的&#xff0c;Java代码又是如何在JVM中运行的。 public class JVMCase {// 常量public final static String MAN_SEX_TYPE "man";// 静态变量public static String WOMAN_SEX_TYPE "woman…