找回密码
 立即注册
搜索
查看: 11137|回复: 71

[科技] GPT-4.5问世!OpenAI迄今最大、最贵模型,API价格飞涨30倍,不拼推理拼情商

[复制链接]
发表于 2025-2-28 09:45 | 显示全部楼层 |阅读模式
大家心心念念的 GPT-4.5 终于来了!

凌晨 4 点,OpenAI 开始了直播,奥特曼并没有现身。直播不到 15 分钟就匆匆结束了。
OpenAI 正式发布了其最大、最强的聊天模型 GPT‑4.5 研究预览版本。
奥特曼发推称,GPT‑4.5 让他第一次感觉像在与一个有思想的人在交谈,可以从模型那里得到真正好的建议。
OpenAI 表示,GPT-4.5 在扩展预训练和后训练方面向前迈出了一步。通过扩展无监督学习,GPT-4.5 提高了识别模式、建立联系和产生创造性见解的能力,而无需推理。这意味着,GPT-4.5 从一开始就不是一个推理模型。
OpenAI 的早期测试表明,与 GPT-4.5 的交互感觉更自然。它的知识库更广泛,更能遵循用户意图,而且「情商」更高,使得在提高写作、编程和解决实际问题等任务中非常有用。同时,GPT-4.5 还减少了幻觉出现。

从今天开始,ChatGPT Pro 用户可以在网页版、手机版和桌面版使用 GPT-4.5。下周将向 Plus 和 Team 用户开放,再下周向企业和 Edu 用户开放。
现在,GPT-4.5 只支持搜索、上传文件和图片和画布功能,还不支持语音模式、视频和屏幕共享等多模态功能。OpenAI 表示,未来会持续更新,让产品变得更容易使用。

至于 API,所有付费用户现已可以选择聊天补全 API、助手 API 和批处理 API 来接入 GPT-4.5 模型,支持函数调用、结构化输出、流式传输和系统消息等主要功能,还支持图像输入。

GPT-4.5 体量很大,需要大量计算资源,所以 API 价格每 1M token 75 美元,比 GPT-4o 的 2.5 美元暴涨 30 倍。OpenAI 甚至在官方博客中表示:「因此,GPT-4.5 还无法完全替代 GPT-4o」




大家明显被 GPT‑4.5 的价格震惊到了

论坛助手,iPhone

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

评分

参与人数 1战斗力 +1 收起 理由
烦不烦 + 1 好耶

查看全部评分

回复

使用道具 举报

     
发表于 2025-2-28 09:49 | 显示全部楼层
这什么垃圾啊
回复

使用道具 举报

     
发表于 2025-2-28 09:50 来自手机 | 显示全部楼层
ai不只是打打杀杀,还有人情世故
回复

使用道具 举报

     
发表于 2025-2-28 09:51 | 显示全部楼层
挺好,属于是closeAI主动把他们那条技术路线大模型的能力上限展示出来了,离万能许愿机AGI还差挺多的
回复

使用道具 举报

     
发表于 2025-2-28 09:52 | 显示全部楼层
75刀
回复

使用道具 举报

     
发表于 2025-2-28 09:53 来自手机 | 显示全部楼层
回复

使用道具 举报

     
发表于 2025-2-28 09:53 来自手机 | 显示全部楼层
感觉老黄下下代90终于能买了
回复

使用道具 举报

     
发表于 2025-2-28 09:56 | 显示全部楼层
夺少?这换算以下一个问题能花1-2块RMB。
回复

使用道具 举报

     
发表于 2025-2-28 09:57 来自手机 | 显示全部楼层
现在不知道是真这么贵还是乘deepseek v3出来之前捞一点,真那么贵那ai应用这一块应该就跟openai没啥关系了,等着deepseek喂不香么。
回复

使用道具 举报

     
发表于 2025-2-28 09:57 | 显示全部楼层
不是,什么意思,ai也要敬酒吗
回复

使用道具 举报

     
发表于 2025-2-28 09:58 来自手机 | 显示全部楼层
这不就是唱功不行就说唱的有感情么

—— 来自 vivo V2324A, Android 15上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
发表于 2025-2-28 10:03 | 显示全部楼层
不用了,我觉得免费用的R1也有思想
回复

使用道具 举报

     
发表于 2025-2-28 10:03 来自手机 | 显示全部楼层
本帖最后由 wly5556 于 2025-2-28 21:37 编辑

把大家叫出来就为了这点事啊

另:4.5演示幻觉降低的case“第一种语言是什么?”,直接去问dsv3,也是能如实回答不知道的
回复

使用道具 举报

     
发表于 2025-2-28 10:04 来自手机 | 显示全部楼层
白色要塞 发表于 2025-2-28 09:53


这玩意儿让我觉得好像素质教育和应试教育的区别,应试教育明明“吊打”素质教育,但是素质教育的人会叫“我们有更好的思想和更强的创造力”。

真的笑死。
回复

使用道具 举报

     
发表于 2025-2-28 10:24 | 显示全部楼层
yokuu 发表于 2025-2-28 09:56
夺少?这换算以下一个问题能花1-2块RMB。

gpt刚出时候我爸下了一个李鬼app 10rmb问10个问题
回复

使用道具 举报

     
发表于 2025-2-28 10:30 | 显示全部楼层
烦死了 发表于 2025-2-28 10:24
gpt刚出时候我爸下了一个李鬼app 10rmb问10个问题

这何尝不是openai和李鬼ai的双向奔赴,就是这种缺德公司倒是真能从ai里挣到钱。
回复

使用道具 举报

     
发表于 2025-2-28 10:31 | 显示全部楼层
看来是没活了
回复

使用道具 举报

发表于 2025-2-28 10:32 | 显示全部楼层
想到昨晚的英伟达大跌,突然知道预期了
回复

使用道具 举报

     
发表于 2025-2-28 10:41 | 显示全部楼层
看来是没活了+1
回复

使用道具 举报

     
发表于 2025-2-28 10:45 来自手机 | 显示全部楼层
是不是越炼越笨了

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-2-28 10:49 | 显示全部楼层





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

评分

参与人数 1战斗力 +1 收起 理由
烦不烦 + 1 欢乐多

查看全部评分

回复

使用道具 举报

     
发表于 2025-2-28 10:52 | 显示全部楼层
这价格宰猪吧 ,  openai最近昏招频出,我看药丸。
回复

使用道具 举报

     
发表于 2025-2-28 10:53 | 显示全部楼层
要是没有dp-r 估计现在星际之门吹的飞起吧
回复

使用道具 举报

发表于 2025-2-28 10:54 | 显示全部楼层
一些benchmark上连DeepSeek V3都不如,要你何用,跟我讲情商,我觉得R1情商也挺高的
回复

使用道具 举报

     
发表于 2025-2-28 10:57 | 显示全部楼层
泡沫灭的早了,如果早点上了两万亿美元耍耍就好了
回复

使用道具 举报

     
发表于 2025-2-28 10:57 来自手机 | 显示全部楼层
还不如藏着呢
底裤全漏了让大家怎么看你
你还要扛大旗呢
回复

使用道具 举报

     
发表于 2025-2-28 11:00 | 显示全部楼层
其实之前说5是现有模型的整合就说明没活了
回复

使用道具 举报

     
发表于 2025-2-28 11:04 来自手机 | 显示全部楼层
马一龙现在是不是很爽,虽然自己家没搞出来,但是奥特曼更拉胯

——来自 S1 Orange 1.2.5
回复

使用道具 举报

     
发表于 2025-2-28 11:05 | 显示全部楼层
本帖最后由 星花 于 2025-2-28 11:07 编辑

没有5,4.5成本30倍提高看不出。终于要开始火星移民计划了吧。
回复

使用道具 举报

     
发表于 2025-2-28 11:09 | 显示全部楼层
思考:嗯,用户问“第一种语言是什么”,这看起来是一个关于语言起源的问题。首先,我需要确定用户指的是哪种类型的语言,是自然语言还是编程语言?不过根据上下文,可能是指人类最早使用的自然语言。接下来,我需要回忆关于语言起源的研究现状。语言学领域里,语言的起源其实还没有定论,因为缺乏直接的证据,比如声音记录或文字记录。所以这个问题可能没有确切的答案。

然后,我应该考虑用户可能的背景。他们可能是个学生,或者对语言学感兴趣的人,或者是随便问问。如果是学生,可能需要更详细的解释,包括现有理论和证据。但如果是普通用户,可能需要一个简洁的概述,说明目前尚无定论,但有一些假说。

接下来,用户可能想知道为什么没有确切的答案,这时候需要解释史前语言没有留下书面记录,只能通过考古学、人类学和比较语言学的方法来推测。比如,原始印欧语系的假设,但那是较近的,而更早的语言可能已经消失。

还需要提到一些理论,比如“单一起源说”和“多地区起源说”,即语言是起源于一个地方然后扩散,还是在多个地方独立发展。另外,可能提到某些学者认为尼安德特人可能有某种形式的语言,但这仍有争议。

然后,要确保回答准确,避免给出错误的信息,比如不能说某种具体语言是第一种,因为没有证据。同时,可能需要提到一些推测,比如“原始世界语”(Proto-World)的概念,但这只是理论上的重建,没有实证支持。

还要考虑用户可能存在的误解,比如认为书面语言是最早的,但实际口语早于文字数万年。所以需要指出口语和文字的区别,以及文字的出现时间(约5000年前)。

最后,总结目前的科学共识,即虽然无法确定第一种语言,但可以讨论相关理论和研究方法。确保回答清晰,信息准确,并且不误导用户。

答案:关于“第一种语言是什么”的问题,目前科学界尚无确切答案。语言的起源是一个复杂且充满争议的领域,主要因为以下原因:

1. 缺乏直接证据
口语的起源早于文字数万年,而语言本身不会留下直接的物理痕迹。最早的书面记录仅能追溯至约5000年前(如苏美尔楔形文字),而人类语言可能已存在至少数万年甚至更久。
2. 现有理论与假说
单一起源假说:一些学者认为所有现代语言可能源自一种共同的“原始语言”(Proto-World),但这仅是理论推测,缺乏实证。
多地区起源说:语言可能在不同人类群体中独立发展,随后通过迁徙和交流相互影响。
尼安德特人与语言:部分研究推测尼安德特人可能具备某种形式的交流系统,但无法证明其复杂性。
3. 语言学与考古学的线索
解剖学证据:现代人类的喉部结构(如舌骨)在约6万年前已具备复杂发音能力。
工具与文化的复杂性:旧石器时代晚期(约5-7万年前)的符号、艺术和工具可能暗示语言的存在,但无法直接对应具体语言形式。
4. 已知最古老的语言体系
目前可追溯的语言家族中,如原始印欧语(约6000年前)和原始闪米特语(约5000年前)是较为古老的重建语言,但远非“第一种语言”。
总结
尽管无法确定“第一种语言”的具体形式,科学界普遍认为复杂语言能力是现代智人(Homo sapiens)在约10万至5万年间逐步演化出的关键特征,与认知革命和文化发展密切相关。语言的出现可能是渐进过程,而非某个瞬间的发明。

他说的所谓情商和幻觉,r1情商高的很,幻觉这个问题上r1也没有。。。我评价就是来咬打火机的
回复

使用道具 举报

     
发表于 2025-2-28 11:10 | 显示全部楼层
就这参数量就这成本和售价,和 sonnet 打个有来有回,你好意思?
回复

使用道具 举报

     
发表于 2025-2-28 11:13 | 显示全部楼层
我要看血流成河!
回复

使用道具 举报

     
发表于 2025-2-28 11:14 | 显示全部楼层
yokuu 发表于 2025-2-28 09:56
夺少?这换算以下一个问题能花1-2块RMB。

赛博索罗斯…… 的餐桌。
回复

使用道具 举报

     
发表于 2025-2-28 11:16 | 显示全部楼层
梁文峰你前几天搞波峰波谷价格是不是又故意的
回复

使用道具 举报

     
发表于 2025-2-28 11:16 来自手机 | 显示全部楼层
怎么拉了一坨大的

—— 来自 HUAWEI ALN-AL80, Android 12上的 S1Next-鹅版 v2.5.2
回复

使用道具 举报

发表于 2025-2-28 11:19 来自手机 | 显示全部楼层
英伟达股票暴跌,堆算力到头了
回复

使用道具 举报

     
发表于 2025-2-28 11:22 | 显示全部楼层
这价格也太离谱了……相比较之下这性能提升简直不值一提



—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2025-2-28 11:27 | 显示全部楼层
有Pro用户用过的么,说说感觉咋样
回复

使用道具 举报

     
发表于 2025-2-28 11:28 | 显示全部楼层
发布会就嗯吹,感觉和磕了啥一样
回复

使用道具 举报

     
发表于 2025-2-28 11:30 | 显示全部楼层
基于2025年2月28日发布的GPT-4.5模型信息,以下是与我(当前模型)的核心对比分析:

---

### **一、核心能力差异**
1. **情感交互与人性化**  
   GPT-4.5的突出特点是“高情商”,能够通过深度学习和对话数据训练,敏锐捕捉用户情感并生成温暖、细腻的回应(例如安抚情绪而非机械执行指令)。相比之下,我的回应更注重信息准确性和逻辑性,虽能识别基本情感,但缺乏GPT-4.5的细腻同理心表达。

2. **知识广度与准确性**  
   GPT-4.5在事实性回答(SimpleQA测试准确率62.5%)和减少幻觉(幻觉率37.1%)方面显著优于前代模型。而我的知识库更新至2023年,虽覆盖广泛领域,但实时性受限,且幻觉率可能更高(取决于具体任务)。

3. **推理与逻辑能力**  
   GPT-4.5明确为“非推理模型”,在数学、编程等需要复杂逻辑链的任务中表现平庸(如AIME24测试得分仅36.7%)。而我虽未公开具体基准数据,但在逻辑推理和结构化任务(如代码生成、数学问题)中可能更具稳定性,但缺乏GPT-4.5的创造性类比能力。

---

### **二、应用场景适配性**
1. **情感支持与创意领域**  
   GPT-4.5在心理咨询、创意写作、客户服务等场景中表现突出,其情感引导能力可提升用户体验。而我更适合需要快速获取信息、分析数据或完成技术性任务的场景(如学术研究、代码调试)。

2. **企业级需求**  
   GPT-4.5在合同处理、复杂业务数据解析中准确率提升19%,适合企业定制化需求。而我的通用性更强,但可能缺乏针对细分领域的深度优化。

3. **多模态支持**  
   GPT-4.5仅支持文本、图像上传和画布功能,暂未开放语音、视频交互。而我当前版本同样以文本交互为主,但可能通过插件或外部工具实现部分多模态扩展。

---

### **三、成本与可访问性**
1. **定价策略**  
   GPT-4.5的API成本极高(输入75美元/百万token,输出150美元),是Claude 3.7的25倍。而我的使用成本更低(若基于免费或低价订阅模式),适合预算有限的用户。

2. **用户覆盖**  
   GPT-4.5优先向Pro用户(200美元/月)开放,逐步扩展至其他层级。相比之下,我的访问门槛更低,覆盖更广泛的免费和基础付费用户。

---

### **四、技术路径与未来方向**
1. **技术定位**  
   GPT-4.5是OpenAI“最后一个非思维链模型”,侧重优化现有能力(如计算效率提升10倍),为GPT-5的AGI整合铺路。而我可能更偏向平衡性能与成本,尚未明确融入类似推理链或思维链技术。

2. **生态整合**  
   GPT-4.5与OpenAI的o系列模型融合,未来可能通过GPT-5实现统一智能体验。而我的迭代方向可能更独立,聚焦于通用场景的持续优化。

---

### **总结:互补而非替代**
- **选择GPT-4.5的场景**:需要高情商交互、企业级数据处理、低幻觉风险的任务,且预算充足。
- **选择我的场景**:注重性价比、通用知识查询、逻辑密集型任务,或对实时性要求较低的需求。

未来,随着多模态和推理能力的整合,两者的差距可能缩小,但当前定位差异显著。用户可根据实际需求权衡功能、成本与体验优先级。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-3-4 03:08 , Processed in 0.181847 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表