找回密码
 立即注册
搜索
楼主: lukesweet

[科技] 出差路上闲着,介绍下当前国内AI业界的战国志

[复制链接]
     
发表于 2023-11-10 12:56 | 显示全部楼层
用了几天文心一言4.0,不得不说,还是比openai要差很远。
能感受到他的进步,但是很多文本处理的事情上面,他还是太刻板了。
例如写一篇2000字左右的文章,问他修改意见,文心一言,大概能够从中学老师对作文的要求这种等级的逻辑和要求去判断。
而openai的4.0是能够做到以一个平常读者的心态去告诉我这篇文章的可读性,趣味性,逻辑连贯性好不好?甚至能分析会不会火。

意味着我欣赏百度的进步,但是它这个东西距离能够辅助工作还是挺远的。
回复

使用道具 举报

     
发表于 2023-11-10 13:08 | 显示全部楼层
moekyo 发表于 2023-11-10 12:19
你P2P挖矿赚的钱又不给我,我肯定不愿意啊,游戏这个是正面提高自己的游戏体验,不一样吧,当然,我就这一 ...

在直播用户大部分人0充值,直播站也要恰饭控制成本的前提下,p2p绝对是能提高直播流畅度清晰度提高体验的。
但是大部分普通用户不会管这个的,占了我电脑资源你就该死
当然我这不是说以后商业化产品中用大模型搞用户集群减少服务器资源就搞不起来
骂归骂,有利益在厂商还是能强上的,像直播P2P一样
回复

使用道具 举报

     
发表于 2023-11-10 13:22 来自手机 | 显示全部楼层
总是把你这个标题看成AV
回复

使用道具 举报

     
 楼主| 发表于 2023-11-10 13:39 | 显示全部楼层
淳煜王 发表于 2023-11-10 00:41
我除了画图、问答、字幕外对AI没任何感知,楼主能聊聊这玩意目前的商业化究竟是干嘛的么,比如网站问答机器 ...

好问题,目前看来有几个共识稍微强一点的方向:
助手:这个不用说,所有人都能理解,但目前看来靠网页/工具型APP是赚不到钱的,别说文心,OpenAI在商业化上都是弟弟,普通人没有这么多问答或者数据处理需求。所以引出了两个方向,第一种是结合硬件,这块有人在投(机器人、车载助手),但估计有具体的起色还得几年;第二个就特化地去满足各种应用场景,那么这个就变成了toB,翻译,客服等等,替代掉一些低级的人力。
娱乐:目前模型能力还集中在对话或者文生图,所以可以应用的场景基本是各种角色扮演的chatbot(主楼里说的Character.AI以及Minimax)。当然我觉得这块目前还探得比较浅,未来肯定要结合进游戏的,想象一下所有人都有自己支线故事的GTA,或者自由度再大一百倍的博德之门(不止文字,还有图像配合)。这块其实做的挺激进的,但难度非常大,需要公司有极强的多模态技术水平,同时又有游戏底子。
科研:不是简单的帮你水论文之类的,而是真的可以审视你的想法并提出探讨,搜索、快速消化现有成果,并且自动探索某个小方向。这块也有人在做,但目前还是比较浅的程度。
不客气地说,目前的商业化还是很难的,头部公司靠自己AI产品盈利的只有Character.AI和Midjourney,产业化还有较长的路要走
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-10 13:59 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2023-11-10 14:48 | 显示全部楼层
lukesweet 发表于 2023-11-10 13:39
好问题,目前看来有几个共识稍微强一点的方向:
助手:这个不用说,所有人都能理解,但目前看来靠网页/工 ...

假设我作为个人用户平均每天要生成10篇文章,用户基数在10w左右,定价要多少一个月才能回本,按文心的水平?openai呢?
回复

使用道具 举报

     
发表于 2023-11-10 15:16 来自手机 | 显示全部楼层
lvseqiji 发表于 2023-11-10 11:00
那个玩意,训练性能被迫阉割烂了,只能用来推理。但是现在大家要的是训练算力。
现在就是华子赚麻了,101 ...

国内只有一个做硬件的感觉也不好呀
回复

使用道具 举报

     
发表于 2023-11-10 15:18 | 显示全部楼层
lukesweet 发表于 2023-11-10 13:39
好问题,目前看来有几个共识稍微强一点的方向:
助手:这个不用说,所有人都能理解,但目前看来靠网页/工 ...

而是真的可以审视你的想法并提出探讨,搜索、快速消化现有成果,并且自动探索某个小方向。这块也有人在做,但目前还是比较浅的程度。
———
我现在就是用ai探讨、检索、快速消化已有成果,写作后跟ai一起review文章的程度。
而且gpt还能独立对应不同层次的文章,例如综述、论文还是科普知识
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-10 15:24 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-10 15:27 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-10 15:34 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-11-10 15:35 | 显示全部楼层
lukesweet 发表于 2023-11-10 13:39
好问题,目前看来有几个共识稍微强一点的方向:
助手:这个不用说,所有人都能理解,但目前看来靠网页/工 ...

游戏这块真的挺适合搞AI,训练库直接找网文,现在网文也被审核过的,理论上审查成本低点吧
二十年前还流行文字MUD,我挺想玩AI MUD的,chatgpt3.5的跑团生成还是有点菜了
回复

使用道具 举报

     
发表于 2023-11-10 17:13 | 显示全部楼层
白色的120 发表于 2023-11-10 10:31
腾讯怎么搞ai也玩养蛊这套?

—— 来自 Xiaomi 23013RK75C, Android 13上的 S1Next-鹅版 v2.5.4 ...

投资经验啊,腾讯是风**司不是技术公司。
回复

使用道具 举报

     
发表于 2023-11-10 18:13 | 显示全部楼层
淳煜王 发表于 2023-11-10 15:35
游戏这块真的挺适合搞AI,训 ...

和一些游戏公司聊过,游戏的核心点在于国内的游戏大厂(除了网易)不太愿意去花很多的钱去探索一个未知领域,做技术储备(这个领域的风险极大,也不太能够看到直接的收益,毕竟好玩不代表真正营收上的价值)。大家都想着等技术出来,用现成的。但游戏的特点就是,不自己去搞,只搞OpenAI那些GPT-3.5,或者GPT-4是搞不定这些事情的。
回复

使用道具 举报

发表于 2023-11-10 18:31 | 显示全部楼层
本帖最后由 riczxc 于 2023-11-10 19:18 编辑

我也一直没想懂,这波LLM除了娱乐性ChatBot以外还有什么用(CoPilot也算这轮吧)。

什么行业需要一班愚蠢、不太听话但博学的知识工人?貌似只有水军业?

好像只能卖铲子(例如向量数据库、芯片)和做大模型先占着位置比较靠谱?
回复

使用道具 举报

     
发表于 2023-11-10 18:36 | 显示全部楼层
lvseqiji 发表于 2023-11-10 11:00
那个玩意,训练性能被迫阉割烂了,只能用来推理。但是现在大家要的是训练算力。
现在就是华子赚麻了,101 ...

但是现在一方面华子可训练用的芯片卖断货了,另一方面华子自己也建议跑推理为主,训练还是该咋样就咋样。
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-10 18:39 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-11-10 19:05 | 显示全部楼层
yokohama5084 发表于 2023-11-10 15:34
转ds的人太多了,学历不硬别碰

第一学历应该是够用的,全美前三十物理系前十,主要是没什么码农背景有点担心,之前别人也是推荐申ba的项目或者申统计phd转ds方向,就是不知道业界未来和包容性如何
回复

使用道具 举报

     
发表于 2023-11-10 19:07 | 显示全部楼层
圈量子 发表于 2023-11-10 10:52
先说说自己的码农向技能 我认识的一些理论物理学家只用Mathematica,因为他们不需要会别的 ...

我们平常只用的到一些简单的python这些,跑个数据画个图的,顶天不同模型做个回归hh,尤其现在有chatgpt之后已经不怎么需要子集写码了
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-11 02:59 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-11-11 03:18 | 显示全部楼层
本帖最后由 御坂MKII 于 2023-11-11 03:29 编辑
omnitoken 发表于 2023-11-10 00:52
ToC端的应用手机上自带的那个其实是真的有落地用途的

楼主怎么评价OVM三家各自的状况呢?

我觉得米的模型只要足够做小爱和系统以及米家交互的胶水层就够了,嵌入小爱的模型又不是一个人在战斗。几轮更新之后小爱已经可以一次命令控制多个智能家居了,但是还做不到一条命令同时控制智能家居并做其他功能(比如开个空调顺便定个闹铃,开个灯顺便看看今天天气)。军军比起模型本身,多做做应用端感觉更好,模型只要推理能力足够支撑语言交互的前端就够了
原来是音响的小爱版本落后,手机上的小爱看起来已经可以处理复杂语句一次性执行多个跨模块的任务了
回复

使用道具 举报

     
发表于 2023-11-11 03:41 | 显示全部楼层
本帖最后由 御坂MKII 于 2023-11-11 03:59 编辑
riczxc 发表于 2023-11-10 18:31
我也一直没想懂,这波LLM除了娱乐性ChatBot以外还有什么用(CoPilot也算这轮吧)。

什么行业需要一班愚蠢 ...

除了楼上提到的一些,比如给炒股的人做一个现在同花顺问财的究极进化版,这个东西很多人有需求,而且可以卖的很贵。当然问财会涉及很多数据筛选甚至gb级数据聚合之类的大计算量的任务,这个时候就不是单单只靠 llm 就可以做到的了

实际上,现在的大模型提供了非常强而有力的自然语言转结构化语言的入口,只靠这个能力做垂直应用也是很大的空间

之后如果大模型可以在缩小参数规模的基础上保持足够强的推理能力,扩大定制化的能力的话,可以做的事还可以更多。现在那点儿 context 根本不够用我根本不需要没多久就忘了上下文的通用智障
回复

使用道具 举报

     
发表于 2023-11-11 03:55 | 显示全部楼层
GAT_ZZZ 发表于 2023-11-10 09:16
问问lz这个时间点本科学的偏理论的数学和物理双专业转数据科学相关的硕博前景如何呢,感觉继续干理论没这个 ...

要不一步到位来写数据库好了(
database development 里有一部分和数学强耦合(一部分是概率论相关,另一部分主要是和关系代数相关)的内容。只不过最后还是要落到工程能力上

评分

参与人数 1战斗力 +1 收起 理由
GAT_ZZZ + 1 受教了,到时候可以选修下相关课程.

查看全部评分

回复

使用道具 举报

     
发表于 2023-11-11 04:37 | 显示全部楼层
lvseqiji 发表于 2023-11-10 15:27
璧刃,摩尔线程这一大票ai芯片独角兽很多都是华子被制裁后获得热钱成立的,他们已经看过被制裁是怎样了, ...

除非是政府要求,甚至哪怕是政府要求,2b向也不可能去做多少实际的亏本替换 况且都还没有和数据库一样的去IOE指标呢。那自由市场首先还是要东西足够能用了才会考虑你,这种情况下,14nm 的卡根本没有任何竞争力
回复

使用道具 举报

     
发表于 2023-11-11 08:29 来自手机 | 显示全部楼层
lukesweet 发表于 2023-11-10 13:39
好问题,目前看来有几个共识稍微强一点的方向:
助手:这个不用说,所有人都能理解,但目前看来靠网页/工 ...

还有一个是教育,我已经见到好几个高中生自己充值开chatgpt会员了,这玩意真比大部分老师讲的清楚。再就是小型化轻量化之后作为agent了,当然这个大概率轮不到现在这帮高举高打瞎烧钱的公司吃肉,等到llm发展一段时间,其门槛自然会降到所有人都能做的地步
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-11 08:48 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-11-11 08:50 | 显示全部楼层
我还是觉得目前的LLM在定位上更像是一个高层次的人机交互接口,用不确定性换来了扩展性
     

评分

参与人数 1战斗力 +1 收起 理由
omnitoken + 1 哇哦这句话说的好

查看全部评分

回复

使用道具 举报

     
发表于 2023-11-11 09:12 | 显示全部楼层
快15年了,百度搞竞争对手的手段还是如此淳朴路径依赖了属于是
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-11 10:31 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-11 10:43 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2023-11-11 18:15 | 显示全部楼层
御坂MKII 发表于 2023-11-11 03:41
除了楼上提到的一些,比如给炒股的人做一个现在同花顺问财的究极进化版,这个东西很多人有需求, ...

那聚合部分还是用传统方法,不过是忽悠的部分变LLM了。而且LLM还不准,数字或者结论一弄错了就难以接受吧?
回复

使用道具 举报

     
发表于 2023-11-11 18:56 来自手机 | 显示全部楼层
本帖最后由 御坂MKII 于 2023-11-11 18:59 编辑
riczxc 发表于 2023-11-11 18:15
那聚合部分还是用传统方法,不过是忽悠的部分变LLM了。而且LLM还不准,数字或者结论一弄错了就难以接受吧 ...

fine tuning 总是要做的吧
主要现在问财很笨,问财的nlp本身能力很低,只能处理很简单的语句逻辑,甚至连 and or 都做不好。外加技术派本身其实也有很多均线 加权平均之类的公式计算需求。
从自然语言转结构化语言在这个场景下我觉得还是很适合llm的,不准可以 bad case 继续 tuning。反正现在的问财连理解都理解不了 不算回退

—— 来自 Xiaomi 2304FPN6DC, Android 13上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
发表于 2023-11-12 18:06 | 显示全部楼层
希望百度这种死妈公司别笑到最后
回复

使用道具 举报

     
发表于 2023-11-12 19:23 | 显示全部楼层
dada 发表于 2023-11-10 18:36
但是现在一方面华子可训练用的芯片卖断货了,另一方面华子自己也建议跑推理为主,训练还是该咋样就咋样。 ...

你说反了吧,在整个互联网场景下线上Serving比离线训练更麻烦
回复

使用道具 举报

发表于 2023-11-13 17:00 | 显示全部楼层
感谢这贴的干货,已经脱节CS好几代了
回复

使用道具 举报

     
发表于 2023-11-13 18:03 来自手机 | 显示全部楼层
最近自己在玩国内的llm,总体感觉GLM最好用,扩展能力最多,教程最全,特别是单机部署的版本,已经有成为国内开源基座的势头了。
回复

使用道具 举报

     
发表于 2023-11-13 18:24 来自手机 | 显示全部楼层
最近在用智谱清言做一个demo。做好了的话他在我这排名就是第一
回复

使用道具 举报

     
发表于 2023-11-13 18:33 | 显示全部楼层
lzchen 发表于 2023-11-13 18:03
最近自己在玩国内的llm,总体感觉GLM最好用,扩展能力最多,教程最全,特别是单机部署的版本,已经有成为国 ...

其实我们这边用来LoRA的时候,还是百川性能更好一些
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-13 18:40 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-11-13 19:46 来自手机 | 显示全部楼层
qratosones1337 发表于 2023-11-9 21:50
不光是大模型,腾讯和美团甚至是先从CTR这种最难搞的场景入手的——我都怀疑老黄是不是鲨了麻花藤和王兴 ...

蒋老师也玩爱撕衣?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-1-31 10:31 , Processed in 0.223585 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表