找回密码
 立即注册
搜索
查看: 7210|回复: 39

[求助] 火山引擎调api使用deepseekR1为啥输入tokens消耗这么快?

[复制链接]
     
发表于 2025-2-19 11:36 | 显示全部楼层 |阅读模式
用的是deepseek-R1的模型,昨天提问了几个问题,每次提问都不到20个字,但是输入tokens就已经消耗了快10w了,输出tokens消耗了1.6w,感觉还算正常。
检查了一下我chatbox设置的上下文的消息数量上限是20,难道是上下文消息太多,导致未命中缓存的token太多,从而导致输入tokens变多吗?
回复

使用道具 举报

发表于 2025-2-19 11:40 | 显示全部楼层
对话的原理就是把你的前面所有内容再塞回LLM里,然后下一次输出。不是每次只塞你的输入。它的输出也会塞回去
回复

使用道具 举报

     
发表于 2025-2-19 11:46 | 显示全部楼层
没这功能llm会失忆的
回复

使用道具 举报

     
发表于 2025-2-19 11:48 | 显示全部楼层
你猜为什么输入token的计费比输出低很多
回复

使用道具 举报

     
发表于 2025-2-19 11:51 | 显示全部楼层
每次的问题不相关的话需要清空上下文关联或者新开个对话
回复

使用道具 举报

     
发表于 2025-2-19 11:52 来自手机 | 显示全部楼层
原来如此,看了下统计2天用了20万token
回复

使用道具 举报

     
发表于 2025-2-19 12:02 来自手机 | 显示全部楼层
你用chatbox看看不就知道了,平均一次约10000

—— 来自 鹅球 v3.3.96-alpha
回复

使用道具 举报

     
发表于 2025-2-19 12:03 来自手机 | 显示全部楼层
think的内容也算token

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-2-19 12:30 | 显示全部楼层
可以设定几轮对话历史吧。设置5轮以内就差不多了
回复

使用道具 举报

     
发表于 2025-2-19 14:10 | 显示全部楼层
如果你是用他家BOT也就是加联网那个调法会更多更多的,因为RAG塞进去的也算输入,且100%不能命中缓存
回复

使用道具 举报

     
发表于 2025-2-19 14:29 | 显示全部楼层
昨天问了strawberry有几个r,丫颠来倒去反复思考
就是这么刷计件工资的吗
回复

使用道具 举报

     
发表于 2025-2-19 14:58 | 显示全部楼层
嘎嘣脆 发表于 2025-2-19 14:29
昨天问了strawberry有几个r,丫颠来倒去反复思考
就是这么刷计件工资的吗

思考也算吗,好家伙
回复

使用道具 举报

     
发表于 2025-2-19 15:02 来自手机 | 显示全部楼层
我用的是硅基流动的api。让deepseek帮我改代码,主程序直接往里面丢,一天也就十万token

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-2-19 15:07 | 显示全部楼层
如果按输入输出计费,输入一般是1单位计价,输出是4单位计价,输入包含上下文一定数量内所有文字信息,,
按token计数估计是方便它消耗免费额度吧,是一种隐性的降低成本
回复

使用道具 举报

     
发表于 2025-2-21 18:38 | 显示全部楼层
大佬们有邀请码吗?好像用邀请码注册有券领,能发我一个吗,谢谢
回复

使用道具 举报

     
发表于 2025-2-21 18:45 | 显示全部楼层
luodang007 发表于 2025-2-21 18:38
大佬们有邀请码吗?好像用邀请码注册有券领,能发我一个吗,谢谢

https://www.volcengine.com/exper ... QY5&rc=Y51MUBS5
谢谢谢谢
回复

使用道具 举报

     
发表于 2025-2-21 18:50 来自手机 | 显示全部楼层
火山好像没有输入缓存命中情况单独计费。
连续对话的上文很大比例是会缓存命中的,如果分别计费能便宜很多。
回复

使用道具 举报

     
发表于 2025-2-21 19:02 | 显示全部楼层
目前几家主流提供deepseek的api平台我用下来看,火山和秘塔似乎是比较快的,硅基流动的pro有时候都磨磨唧唧的
回复

使用道具 举报

发表于 2025-2-21 22:30 来自手机 | 显示全部楼层
顺便问问

chatbox里面把上下文设置无限,但是似乎还是有限的,这个极限是多少?r1
回复

使用道具 举报

发表于 2025-2-21 22:45 | 显示全部楼层
我感觉r1的消耗量都还行,拿火山的dsv3来翻译大量文本的token消耗真的有点贵
回复

使用道具 举报

     
发表于 2025-2-22 13:01 | 显示全部楼层
火山的计算和别家应该不一样, 同样用cline, 我用火山的最多三个来回就消耗了50万欠费,而换成派欧算力云的,五十万个token用了三四天
回复

使用道具 举报

     
发表于 2025-2-22 14:09 来自手机 | 显示全部楼层
火山引擎邀请链接,可以一起薅一点代金券
https://www.volcengine.com/experience/ark?utm_term=202502dsinvite&ac=DSASUQY5&rc=CX7DMWHW
回复

使用道具 举报

发表于 2025-2-22 14:16 | 显示全部楼层
thq 发表于 2025-2-22 13:01
火山的计算和别家应该不一样, 同样用cline, 我用火山的最多三个来回就消耗了50万欠费,而换成派欧算力云 ...

确实,火山的50w我也是一两天就用完了,欧派云的50w到现在一周多了才用了一半
回复

使用道具 举报

     
发表于 2025-2-22 14:17 | 显示全部楼层
Deepseek官网最好的一点就是命中cache打骨折
现在第三方的apii好像都没有这个机制
回复

使用道具 举报

     
发表于 2025-2-22 14:50 来自手机 | 显示全部楼层
本帖最后由 sjax001 于 2025-2-22 14:52 编辑

派欧云有邀请码吗求一个!
回复

使用道具 举报

     
发表于 2025-2-22 15:11 | 显示全部楼层
我用的硅基的,真的很耗:16元100万,基本上我每次对话至少5000,多的10000也有。算起来就是一次8分到1毛6
回复

使用道具 举报

     
发表于 2025-2-22 15:16 | 显示全部楼层
火山我打开了知识库,上传了5个文件,不到200页吧,一天扣了我十几块
回复

使用道具 举报

     
发表于 2025-2-22 15:45 来自手机 | 显示全部楼层
chaoswing 发表于 2025-2-22 15:16
火山我打开了知识库,上传了5个文件,不到200页吧,一天扣了我十几块

知识库开了,就算什么都没有,一小时四毛五好像

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-2-22 16:05 | 显示全部楼层
无名小卒 发表于 2025-2-22 15:45
知识库开了,就算什么都没有,一小时四毛五好像

—— 来自 鹅球 v3.3.96

不操作都有消耗?
回复

使用道具 举报

     
发表于 2025-2-22 16:09 来自手机 | 显示全部楼层
zerona 发表于 2025-2-22 16:05
不操作都有消耗?

知识库相当于云服务器吧,开了就相当于开着一台电脑,按小时收费,上传文件另外计费。

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-2-22 16:11 | 显示全部楼层
本帖最后由 zerona 于 2025-2-22 17:32 编辑
无名小卒 发表于 2025-2-22 16:09
知识库相当于云服务器吧,开了就相当于开着一台电脑,按小时收费,上传文件另外计费。

—— 来自 鹅球 v ...

那page assist 的知识库呢?
我试着传了个文件,看用的嵌入模型是我之前下的deepseek r1。 这个就可以用自己的知识库了吧?


褥个羊毛
https://www.volcengine.com/exper ... QY5&rc=TMIIPZY2
回复

使用道具 举报

     
发表于 2025-2-22 16:37 来自手机 | 显示全部楼层
无名小卒 发表于 2025-2-22 15:45
知识库开了,就算什么都没有,一小时四毛五好像

—— 来自 鹅球 v3.3.96

为何不用coze平台呢?就算国外版上不了,国内版也有r1和qwen max可以免费用,知识库也是**的。
回复

使用道具 举报

     
发表于 2025-2-22 16:57 来自手机 | 显示全部楼层
之前看文档,火山的缓存是需要用 api 具体的创建一个 session 的,裸用可能是没有缓存的

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-2-22 17:11 | 显示全部楼层
火山引擎的邀请码,可以薅点羊毛
https://www.volcengine.com/exper ... QY5&rc=KWRL179F
回复

使用道具 举报

     
发表于 2025-2-22 17:48 | 显示全部楼层
zerona 发表于 2025-2-22 16:05
不操作都有消耗?

楼上说的很对,我也是四毛五一个小时
他这个付费比较复杂,有向量化的计算费用,有根据存储量和存储时间的费用
我估计是只要你建立了知识库,光那个索引就是最低四毛五

所以还是用rag吧
回复

使用道具 举报

     
发表于 2025-2-22 17:49 | 显示全部楼层
我意思是本地rag,不要用火山提供的
回复

使用道具 举报

     
发表于 2025-2-22 17:54 来自手机 | 显示全部楼层
官网试着写小说。越写到后面**时间就越长,还会发生字数减少,一个问题页面还是不要问太多次好
回复

使用道具 举报

     
发表于 2025-2-24 18:45 | 显示全部楼层
火山引擎邀请链接,有羊毛一起薅 https://www.volcengine.com/exper ... QY5&rc=XSVI9SCG
回复

使用道具 举报

     
发表于 2025-2-26 13:38 | 显示全部楼层
DeepSeek满血版免费领啦!邀请好友注册和使用,最高双方可获得145元代金券,免费抵扣3625万tokens,畅享R1与V3模型!参与入口:https://www.volcengine.com/exper ... QY5&rc=OLB5ECEW  邀请码:OLB5ECEW
回复

使用道具 举报

     
发表于 2025-2-26 14:02 来自手机 | 显示全部楼层
要不楼上几个建个aff专楼吧。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-3-4 03:12 , Processed in 0.191864 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表