找回密码
 立即注册
搜索
查看: 9332|回复: 41

[硬件] 炼丹来说,11g和10g显存差的远吗?2080ti vs 3080

[复制链接]
头像被屏蔽
     
发表于 2020-9-19 17:05 | 显示全部楼层 |阅读模式
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2020-9-19 17:20 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2020-9-19 18:38 来自手机 | 显示全部楼层
10g跑不了的东西,换11g照样跑不了

—— 来自 Xiaomi MI 5s, Android 8.0.0上的 S1Next-鹅版 v2.4.1
回复

使用道具 举报

头像被屏蔽
     
发表于 2020-9-19 18:47 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2020-9-19 18:50 来自手机 | 显示全部楼层
3080除fe版没有双槽卡,安培有bfloat16,不过框架这个点适配不知道怎么样。
既有业务最好别换,容易翻车。
puget system测的3080半精度训练性能不对头,最好等等别人先踩坑,或者就买一张跑跑看。

—— 来自 Sony H8296, Android 10上的 S1Next-鹅版 v2.2.0.1
回复

使用道具 举报

头像被屏蔽
     
 楼主| 发表于 2020-9-19 18:59 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2020-9-19 19:01 来自手机 | 显示全部楼层
你们说的炼丹是啥
回复

使用道具 举报

     
发表于 2020-9-19 19:12 | 显示全部楼层
3080有翻倍的计算核心......据说......然而目前的DLSS看不出来
回复

使用道具 举报

     
发表于 2020-9-19 19:15 来自手机 | 显示全部楼层
lvcha 发表于 2020-9-19 18:59
https://www.pugetsystems.com/labs/hpc/RTX3080-TensorFlow-and-NAMD-Performance-on-Linux-Preliminary-1 ...

fp32翻倍,tensor单元也说翻倍,但是性能特别是fp16都打不过rtx titan

—— 来自 Sony H8296, Android 10上的 S1Next-鹅版 v2.2.0.1
回复

使用道具 举报

头像被屏蔽
     
发表于 2020-9-19 19:57 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2020-9-19 20:02 | 显示全部楼层
自己做实验,10g足够了。

要商用才会计算这些效费比,因为训练时间可以换成钱。直接买最大的。
回复

使用道具 举报

     
发表于 2020-9-19 20:14 来自手机 | 显示全部楼层
DeepFishing 发表于 2020-9-19 19:15
fp32翻倍,tensor单元也说翻倍,但是性能特别是fp16都打不过rtx titan

—— 来自 Sony H8296, Android 1 ...

白 皮 书上GA102的tensor core性能相对GA100砍半了。而且CUDA的FP16性能是FP32的1x而不是2x。
回复

使用道具 举报

头像被屏蔽
     
发表于 2020-9-20 10:22 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2020-9-20 12:08 来自手机 | 显示全部楼层
你10g放不下的模型,11g照样放不下。3080够了。
回复

使用道具 举报

头像被屏蔽
     
发表于 2020-9-20 15:54 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2020-9-20 16:18 来自手机 | 显示全部楼层
BT有理 发表于 2020-9-19 19:01
你们说的炼丹是啥

深度学习训练模型,因为训练出来的模型没法解释,开始训练之后又什么都不用管放任机器跑就行了,故称炼丹
回复

使用道具 举报

     
发表于 2020-9-20 17:19 | 显示全部楼层
iceprince10 发表于 2020-9-20 15:54
看了3090的对比评测我觉得3080的10g绝对够了,甚至不用担心20g版本的背刺。基本上测下来两款显卡3a游戏4k下 ...

人家问炼丹 你说一通游戏
回复

使用道具 举报

头像被屏蔽
发表于 2020-9-20 19:04 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2020-9-20 19:09 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2020-9-21 13:44 来自手机 | 显示全部楼层
就算你把模型控制在10g,一旦迭代了不得不增加不就又完了。
回复

使用道具 举报

     
发表于 2020-9-21 14:06 | 显示全部楼层
要真出了20g版大不了再出二手换呗
回复

使用道具 举报

发表于 2020-9-21 14:18 | 显示全部楼层
没差别,大的模型16G也没辙,要上32G,甚至48G
回复

使用道具 举报

     
发表于 2020-9-21 15:21 | 显示全部楼层
我他妈要能买到3090我就不用跟3080那帮耍猴的傻逼较劲生气了。。。
回复

使用道具 举报

     
发表于 2020-12-23 11:34 来自手机 | 显示全部楼层
顶一下帖子问问,炼丹这事瓶颈在显存还是核心?显存位宽被阉到192bit的12g3060炼丹师们会抢么?
回复

使用道具 举报

     
发表于 2020-12-23 11:51 来自手机 | 显示全部楼层
lockoff0131 发表于 2020-12-23 11:34
顶一下帖子问问,炼丹这事瓶颈在显存还是核心?显存位宽被阉到192bit的12g3060炼丹师们会抢么? ...

显存关乎能不能跑,核显关乎速度。穷逼企业才抱着游戏卡用,更穷的才会用非旗舰游戏卡,起码20系批量只有2080ti才有企业抢,多卡是不能混插的

—— 来自 Sony H8296, Android 10上的 S1Next-鹅版 v2.4.3
回复

使用道具 举报

头像被屏蔽
     
发表于 2020-12-23 11:56 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2020-12-23 12:09 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2020-12-23 13:34 来自手机 | 显示全部楼层
建议2080ti
3080就只能cuda11+了

—— 来自 samsung SM-G9730, Android 10上的 S1Next-鹅版 v2.4.3
回复

使用道具 举报

头像被屏蔽
     
 楼主| 发表于 2020-12-23 13:52 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2020-12-23 14:30 来自手机 | 显示全部楼层
话说,为什么显存不能像内存一样想装多少装多少呢?

—— 来自 HUAWEI EBG-AN00, Android 10上的 S1Next-鹅版 v2.4.3
回复

使用道具 举报

     
发表于 2020-12-23 20:03 | 显示全部楼层
花海境 发表于 2020-12-23 14:30
话说,为什么显存不能像内存一样想装多少装多少呢?

—— 来自 HUAWEI EBG-AN00, Android 10上的 S1Next- ...

内存也跑不上20ghz
回复

使用道具 举报

     
发表于 2020-12-23 21:16 | 显示全部楼层
DeepFishing 发表于 2020-12-23 11:51
显存关乎能不能跑,核显关乎速度。穷逼企业才抱着游戏卡用,更穷的才会用非旗舰游戏卡,起码20系批量只有 ...

2080ti,4352个CUDA,13.4t flops

3060 12g,3840个cuda,而且30系的cuda算力比20系强(https://developer.nvidia.com/zh-cn/cuda-gpus#compute,一个8.6,一个7.5),这样一算3060的总cuda算力还超过2080ti

就算3060上市后指导价2700,不比2080ti便宜太多了?
回复

使用道具 举报

头像被屏蔽
     
 楼主| 发表于 2020-12-23 21:25 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2020-12-23 21:30 来自手机 | 显示全部楼层
lockoff0131 发表于 2020-12-23 21:16
2080ti,4352个CUDA,13.4t flops

3060 12g,3840个cuda,而且30系的cuda算力比20系强(https://developer ...

所以老黄特意阉割了fp16的性能,30系fp16和fp32性能差不多,而20系rtx卡账面fp16是翻倍的,8.6和7.5指的是计算能力而不是纯性能

—— 来自 Sony H8296, Android 10上的 S1Next-鹅版 v2.4.3
回复

使用道具 举报

     
发表于 2020-12-23 21:43 来自手机 | 显示全部楼层
lvcha 发表于 2020-12-23 21:25
这个cuda数量是根据性能折算的

原来这东西的”个”不是实际上的数量么
回复

使用道具 举报

     
发表于 2020-12-23 21:50 | 显示全部楼层
DeepFishing 发表于 2020-12-23 21:30
所以老黄特意阉割了fp16的性能,30系fp16和fp32性能差不多,而20系rtx卡账面fp16是翻倍的,8.6和7.5指的 ...

……找不到fp16在30系和20系的比较,不过看这意思你们是看不上这个3060了?
回复

使用道具 举报

头像被屏蔽
     
 楼主| 发表于 2020-12-23 22:43 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2020-12-23 23:12 来自手机 | 显示全部楼层
lvcha 发表于 2020-12-23 22:43
炼丹肯定看不上了。

谢谢
回复

使用道具 举报

     
发表于 2020-12-24 05:48 来自手机 | 显示全部楼层
花海境 发表于 2020-12-23 14:30
话说,为什么显存不能像内存一样想装多少装多少呢?

—— 来自 HUAWEI EBG-AN00, Android 10上的 S1Next- ...

因为老黄决定搞cuda生态的时候,发现显存对ai训练很关键。于是便像水果闪存一样,可以卖到金子般的价格

—— 来自 OnePlus HD1900, Android 10上的 S1Next-鹅版 v2.4.3
回复

使用道具 举报

     
发表于 2020-12-24 15:31 来自手机 | 显示全部楼层
我搞了张3070,我们的代码在30系跑跑不了,,我要跑路了,等不到我做适配了

—— 来自 Sony H8296, Android 10上的 S1Next-鹅版 v2.4.3
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2024-11-14 21:53 , Processed in 0.197189 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表