admin 管理员组

文章数量: 1184232

云服务器Tesla T4
世界领先的推理加速器
Tesla V100
通用数据中心 GPU
Tesla P4
适用于推理吞吐量服务器的
 Tesla P40
单精度性能 (FP32)8.1 TFLOPS14 TFLOPS (PCIe) 15.7 teraflops (SXM2)5.5 TFLOPS12 TFLOPS
半精度性能 (FP16)65 TFLOPS112 TFLOPS (PCIe)125 TFLOPS (SXM2)
整数运算能力 (INT8)130 TOPS22 TOPS*47 TOPS*
整数运算能力 (INT4)260 TOPS
GPU 显存16GB2023年07月24日GB HBM28GB24GB
显存带宽320GB/秒900GB/秒192GB/秒346GB/秒
系统接口/外形规格PCI Express 半高外形PCI Express 双插槽全高外形 SXM2/NVLinkPCI Express 半高外形PCI Express 双插槽全高外形
功率70 W250 W (PCIe) 300 W (SXM2)50 W/75 W250 W
硬件加速视频引擎1 个解码引擎,2 个编码引擎1 个解码引擎,2 个编码引擎1 个解码引擎,2 个编码引擎


K80:24G

CUDA核心数:4992
单精度(FP32)性能:4.37 TFLOPS
双精度(FP64)性能:1.46 TFLOPS
计算能力:3.7
P40:24G

CUDA核心数:3840
单精度(FP32)性能:12.0 TFLOPS
双精度(FP64)性能:2.98 TFLOPS
计算能力:6.1
2080 Ti:11G可魔改24G

CUDA核心数:4352
单精度(FP32)性能:13.4 TFLOPS
双精度(FP64)性能:0.42 TFLOPS
计算能力:7.5


项目A100H100L40SH200
架构AmpereHopperAda LovelaceHopper
发布时间2020202220232024
FP649.7 TFLOPS34 TFLOPS暂无34 TFLOPS
FP3219.5 TFLOPS67 TFLOPS91.6 TFLOPS67 TFLOPS
FP64 向量核心19.5 TFLOPS67 TFLOPS暂无67 TFLOPS
TF32 向量核心312 TFLOPS989 TFLOPS183 TFLOPS366* TFLOPS
BFLOAT16 向量核心624 TFLOPS1,979 TFLOPS362.05 TFLOPS733* TFLOPS
FP16 向量核心624 TFLOPS1,979 TFLOPS362.05 TFLOPS733* TFLOPS
FP8 向量核心不适用3,958 TFLOPS733 TFLOPS1,466* TFLOPS
INT8 向量核心1248 TOPS3,958 TOPS733 TFLOPS1,466* TFLOPS
INT4 向量核心暂无暂无733 TFLOPS1,466* TFLOPS
GPU 内存80 GB HBM2e80 GB48GB GDDR6,带有 ECC141GB HBM3e
GPU 内存带宽2,039 Gbps3.35 Tbps864 Gbps4.8 Tbps
解码器Not applicable7 NVDEC, 7 JPEGNot applicable7 NVDEC,
 7 JPEG
属性RTX 4090RTX 3090A100 (SMX4-80G)A10RTX A6000
GPU架构AD102 (Ada Lovelace)GA102 (Ampere)GA100(Ampere)GA102GA102 (Ampere)
GPCs (Graphics Processing Clusters)1177-7
TPCs (Texture Processing Clusters)641454-42
SMs (Streaming Multiprocessors)12882108-84
FP32 CUDA Cores16384104966912921610752
INT32 CUDA Cores819252486912
Tensor Cores512328432288336
RT Cores12882N/A7284
Geometry Units6441N/A
TMUs (Texture Units)512328432-336
ROPs (Raster Operation Units)176112160-112
INT4 (TOPS)1321.2/2642.4568/11361248/2496500/1000598.7/1197.4
INT8 (TOPS)660.6/1321.2284/568624/1248250299.3/598.6
INT32 (TIPS)41.317.819.5-18.7
BF16 (TFLOPS)82.635.63912537.4
FP16 (TFLOPS)82.635.67812537.4
FP32 (TFLOPS)82.635.619.531.237.4
FP64 (TFLOPS)1.30.569.7
Tensor Core FP8 (TFLOPS)660.6/1321.2N/AN/A
Tensor Core FP16 (TFLOPS)330/660142/284312/624125/250149.7/299.4
Tensor Core TF32 (TFLOPS)82.6/165.235.6/71156/31262.5/12574.8/149.6


本文标签: 显卡 算力表