找回密码
 立即注册
搜索
查看: 3546|回复: 18

[硬件] AMD正式公布AI MAX 395+

[复制链接]
     
发表于 2025-1-7 12:01 | 显示全部楼层 |阅读模式

有128GB的型号, 分配32GB系统+96GB显存后

可以跑72B Q4的模型, 速度是4090 2.2倍, 推测是4-9Tokens/S

(但是一张4090本来也装不下)

首发HP和ASUS

穷人MI300 来了
回复

使用道具 举报

     
发表于 2025-1-7 12:07 来自手机 | 显示全部楼层
本帖最后由 吴怀在 于 2025-1-7 12:14 编辑

擦,怎么是移动端的?

多少钱?
能不能和5090插到一张主板上,玩游戏用n卡,跑ai两个并行
回复

使用道具 举报

     
发表于 2025-1-7 12:18 来自手机 | 显示全部楼层
移动端也挺好
这玩意适合上nas,等过几年便宜点。
回复

使用道具 举报

     
发表于 2025-1-7 15:06 来自手机 | 显示全部楼层
这个比老黄的project digits孰强孰弱?
回复

使用道具 举报

     
发表于 2025-1-7 15:19 | 显示全部楼层
吴怀在 发表于 2025-1-7 15:06
这个比老黄的project digits孰强孰弱?

Project Digits 能跑 200B 上限比不了
但是这个是 x86,随便折腾,老黄那个是定制 arm + 定制 Ubuntu DGX OS 6
回复

使用道具 举报

     
发表于 2025-1-7 15:27 来自手机 | 显示全部楼层
感觉卖点是富哥的便携游戏机
AI软件环境怎么想也是老黄和苹果更好搭

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-1-7 15:36 来自手机 | 显示全部楼层
老黄今年有个mini aipc感觉也挺强的

—— 来自 鹅球 v3.3.96-alpha
回复

使用道具 举报

发表于 2025-1-7 16:03 | 显示全部楼层
4090的2.2倍速度,这个数据怎么样得出来,
用4090爆显存后的速度跟未爆显存的395+比较?但4090真爆显存,相差应该不止2.2倍吧。
回复

使用道具 举报

     
发表于 2025-1-7 16:27 | 显示全部楼层
Midnight.Coup 发表于 2025-1-7 15:19
Project Digits 能跑 200B 上限比不了
但是这个是 x86,随便折腾,老黄那个是定制 arm + 定制 Ubuntu DGX  ...

这个网址上的排名有NVIDIA Project DIGITS了
https://vmem-for-llms.kcores.com/index-cn
回复

使用道具 举报

     
发表于 2025-1-7 16:43 | 显示全部楼层
🤔几年后会2999呢
回复

使用道具 举报

     
发表于 2025-1-7 16:45 来自手机 | 显示全部楼层
0WHan0 发表于 2025-1-7 16:27
这个网址上的排名有NVIDIA Project DIGITS了
https://vmem-for-llms.kcores.com/index-cn

怎么这么弱鸡啊
回复

使用道具 举报

     
发表于 2025-1-7 16:46 来自手机 | 显示全部楼层
Midnight.Coup 发表于 2025-1-7 15:19
Project Digits 能跑 200B 上限比不了
但是这个是 x86,随便折腾,老黄那个是定制 arm + 定制 Ubuntu DGX  ...

感觉还是过两年再看看了。
不知道那时候开源模型能做到最好闭源模型的几成。
回复

使用道具 举报

     
发表于 2025-1-7 16:52 | 显示全部楼层
本帖最后由 Midnight.Coup 于 2025-1-7 17:04 编辑
0WHan0 发表于 2025-1-7 16:27
这个网址上的排名有NVIDIA Project DIGITS了
https://vmem-for-llms.kcores.com/index-cn

和性能无关,只有带宽评分,虽然大模型和带宽强相关
本天梯重点关注显卡的内存带宽,并提供它们的带宽可用性排名
计算公式为 ( VMEM_Bandwidth × Num ) / LLMs_Size = VMEM_Availability,其中 VMEM_Bandwidth 是特定显卡型号的内存带宽(GB/s), Num 是运行 48GB LLM 所需的最小显卡数量,而 LLMs_Size 是 48GB。 VMEM_Availability 是最终的可用性评分。该公式假设每次计算都需要扫描与模型大小相匹配的内存空间。因此,总体内存带宽除以 LLM 大小得到该组合的最终吞吐量,这可以简单理解为这一组合的显卡每秒可以输出的最大理论 token 数量。
回复

使用道具 举报

     
发表于 2025-1-7 17:08 | 显示全部楼层

这个排行榜应该是这些显存带宽下的理论性能上限,核心就算再强都不会超过这个数,但也有核心性能不足跑不到上限的情况
回复

使用道具 举报

发表于 2025-1-7 19:17 | 显示全部楼层
0WHan0 发表于 2025-1-7 16:27
这个网址上的排名有NVIDIA Project DIGITS了
https://vmem-for-llms.kcores.com/index-cn

P4比T4高,T4比L4高,这排名没啥合理性
回复

使用道具 举报

     
发表于 2025-1-7 19:24 | 显示全部楼层
坏掉了 发表于 2025-1-7 19:17
P4比T4高,T4比L4高,这排名没啥合理性

8卡,4卡和2卡
回复

使用道具 举报

发表于 2025-1-7 19:41 | 显示全部楼层

原来如此
回复

使用道具 举报

发表于 2025-1-7 23:44 | 显示全部楼层
这东西应该不会上 HBM,如果是 4 通道 DDR5 6400 的话,160GB/s 内存带宽跑 70b 4bit 量化的 LLM 撑死能摸到 4t/s。9 t/s 是在做梦了。
回复

使用道具 举报

发表于 2025-1-8 00:13 来自手机 | 显示全部楼层
System Memory Type
256-bit LPDDR5x
Max. Memory
128 GB
Max Memory Speed
LPDDR5x-8000

https://www.amd.com/en/products/processors/laptop/ryzen/300-series/amd-ryzen-ai-max-plus-395.html

— from S1 Next Goose v3.3.96-alpha
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-1-22 16:13 , Processed in 0.056946 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表