算法的实体到底是啥?
从tiktok出要卖的事起就有个疑问,作为tiktok的核心资产的算法的实体到底是啥?为什么国家一纸文件说不允许卖,就实际上没法卖?换个说法就是,如果这套算法本身是在美的tiktok运行的,按照西大脸都不要了的样子,直接fbi上门从机房把服务器带走然后给史密斯专员手下的互联网公司抄袭不就完事了吗?
如果不是这样,那实际上tiktok的数据,所谓的托管也仅仅是由美方的第三方企业进行脱敏处理,仍然需要国内的字节跳动的数据中心处理了才能作为让tiktok有效运营的数据使用吗?
论坛助手,iPhone 把服务器抢了也拿不到源码
实在不能理解的话可以想想光刻机,国内是有机器的,但还是不知道怎么造出来 啥时候说美国人的数据训练出来的模型不准卖美国公司了? 服务器上又没有源码,只有编译好的文件,拿到了也没法改啊 这算法很厉害吗?感觉不如小红书的 lnight 发表于 2025-1-20 07:16
这算法很厉害吗?感觉不如小红书的
之前美国人认识TT,不认识小红书啊,不过比他们的垃圾还是好多了 kabunsan 发表于 2025-1-20 07:53
我这种外行,其实不太理解,不就是不断推送用户以前点击过的类似视频吗?有啥特别难的?
—— 来自 鹅球 v ...
西大公司为了制造他们希望的信息茧房故意不做成这样的呗。
如果没放话卖也不能卖算法,那么tt如果卖了用户就回到了西大式信息茧房而不自知;放话了,那么用户体感或者臆测的任何变化都会阴谋论起来。 玩法多了去了
设计态 —— 算法代码和设计文档
运行态 —— 算法在服务器上运行了,给你推送视频的结果从服务器端网络传送到你手机
服务化的运行态 —— 算法的运行服务器在中国,美国的推送视频服务器,调用中国的算法服务器得到算法结果,美国的推送服务器只负责推送
没有设计态、只有运行态:服务器关机之后可能就有不再能耐长期运行
没有设计态和运行态、只有服务化的运行态:你美服务器上算法能不能用,决定中服务器提不提供你算法结果 kabunsan 发表于 2025-1-20 07:53
我这种外行,其实不太理解,不就是不断推送用户以前点击过的类似视频吗?有啥特别难的?
—— 来自 鹅球 v ...
我也不太理解,不过算法和算法之间的体验确实可以差很多,你想想google和baidu,不都是爬虫海量网站然后根据关键词推荐给你吗,怎么差距那么大?现在meta系的app就是难用得跟baidu似的 kabunsan 发表于 2025-1-20 07:53
我这种外行,其实不太理解,不就是不断推送用户以前点击过的类似视频吗?有啥特别难的?
—— 来自 鹅球 v ...
你想想自己用社交媒体的体验就知道了,比如你感兴趣后搜索了某个内容,推荐算法能否意识到你的兴趣及时给你推送同一内容的其他呈现;是否可以猜测出猜测准你还想看的相关内容;是否能识别出你的兴趣是一时的还是会持续一段时间来调整对你的推送权重。所有这些都是需要通过长期试探和迭代调整出来的,好的推荐算法会让你觉得停不下来,差的推荐算法却会让你感觉刷两下就没东西想看了 kabunsan 发表于 2025-1-20 07:53
我这种外行,其实不太理解,不就是不断推送用户以前点击过的类似视频吗?有啥特别难的?
—— 来自 鹅球 v ...
挺难的,遥记得本科毕业设计就是基于协同过滤算法的推荐系统,单纯是最最简单的推荐算法了,已经让我痛不欲生了,那些功能更强的算法得有多难啊,算法原理是一回事,实现是另一回事,应用更是另一回事 蓝极北 发表于 2025-1-20 09:21
挺难的,遥记得本科毕业设计就是基于协同过滤算法的推荐系统,单纯是最最简单的推荐算法了,已经让我痛不 ...
还真是,之前看过遗传算法的原理等视频。但是想了想,懂得原理和实际应用解决小问题的路还挺远的,很多时候完全想不到如何用。 西大的推荐算法里加了料,要搞意识形态引导,导致数据被污染
我看到的说法是这样 你面前有几千万本书,请你在短时间内找出某个人最爱看的书。而且这个人不会告诉你他具体爱看什么书,你需要去猜他爱看什么书。更狠的是,如果你犯了错误,对方可能就再也不来你这看书了。
—— 来自 鹅球 v3.3.96-alpha 烽火连城 发表于 2025-1-20 09:41
西大的推荐算法里加了料,要搞意识形态引导,导致数据被污染
我看到的说法是这样 ...
那目前tt的算法是怎么个设计思路,一切从用户的兴趣出发只考虑视频本身,还是有也能力从我国的总体利益出发搞引导 这个问题之前wsj报道过,大概意思是,西大的tt代码审核员抱怨,东大的tt码工更新速度太快了,他们审核不过来。
所以,我觉得算法实体其实是人。 流程+文档+代码+人员 百草厅的秘方实体到底是啥啊? kabunsan 发表于 2025-1-20 07:53
我这种外行,其实不太理解,不就是不断推送用户以前点击过的类似视频吗?有啥特别难的?
—— 来自 鹅球 v ...
难,tt和小红书对比shortes reel的确是降维打击
楼上有个找书的比喻非常不错,这不是单纯的检索,是对上亿量级的用户做画像,根据个人画像、群体特征再从海量内容里通过分析算法逐步试探出你的信息茧房结构,而且还不停地调整广告之类的比例和推送频率,非常玄学。
要不然你以为meta不想自己做吗?是真搞不成
—— 来自 鹅球 v3.3.96 让我想起十几二十年前的一个梗, 叫赛博算命
当时就畅想一个人用移动设备代替铜钱八卦, 用数据来勾画对方画像甚至人生, 当时好像苹果才刚出
现在tt已经做到了, 只不过体现在一个视频软件里 lnight 发表于 2025-1-20 07:16
这算法很厉害吗?感觉不如小红书的
我感觉小红书的算法总是不断推同样的东西,很容易腻…… lostfile 发表于 2025-1-20 10:02
这个问题之前wsj报道过,大概意思是,西大的tt代码审核员抱怨,东大的tt码工更新速度太快了,他们审核不过 ...
我觉得你这个说的很对。基本就是一套数据分析+模型修正+工程实现的自我迭代的流程,包括了人员数据和算法,狭义上的理论算法可能是最不重要的。在这个流程中融合了符合用户体验的推荐模型,同时还要实现足够的商业价值需求。 kabunsan 发表于 2025-1-20 07:53
我这种外行,其实不太理解,不就是不断推送用户以前点击过的类似视频吗?有啥特别难的?
—— 来自 鹅球 v ...
有时候真的很佩服大哥说这种话的勇气。小红书和抖音都是建立在你说的这种有啥特别难的算法上的。
要不你去弄一套? 枯风瘦雪 发表于 2025-1-20 08:28
你想想自己用社交媒体的体验就知道了,比如你感兴趣后搜索了某个内容,推荐算法能否意识到你的兴趣及时给 ...
我基本上没用过B站以外的视频APP。这样看来的话,B站的算法就是一坨屎了 是机魂 问道于盲 发表于 2025-1-20 16:11
我基本上没用过B站以外的视频APP。这样看来的话,B站的算法就是一坨屎了
阿B的算法就感觉过于灵敏而缺乏联想能力了,你点某个主题的视频,可能都还没表现出足够的喜欢(完播啊三连啊),但是sou一下这个内容的权重就飙上天无限给你推相似的……这个算法调的是真的很敏感 cauchua3 发表于 2025-1-20 09:57
那目前tt的算法是怎么个设计思路,一切从用户的兴趣出发只考虑视频本身,还是有也能力从我国的总体利益出 ...
按现在的态势,不黑就是通共 是强人工智能的一个切片。 算法不是只推你喜欢的,还要知道你不喜欢什么,并且要能联想,这个联想能力很难 枯风瘦雪 发表于 2025-1-20 16:13
阿B的算法就感觉过于灵敏而缺乏联想能力了,你点某个主题的视频,可能都还没表现出足够的喜欢(完播啊三 ...
是的,有时候你只是一时对某个标题产生了兴趣,并且这个兴趣很快就结束了,但愚蠢的算法会以为你真的产生兴趣了,导致你很多时候都不敢随意去点了,严重的影响体验 看完老美激情吐槽,感觉推荐个“你可能喜欢”的算法并不是meta当务之急
先停下往客户眼前塞广告塞选票吧
—— 来自 鹅球 v3.3.96 就是秘密,虽然不一定真的有什么秘密,但没有秘密也是秘密,数据挖掘早就变成了工程问题,美国企业并不是做不出山寨tik,只是做出来也没人用,没人用就没法优化算法
—— 来自 鹅球 v3.3.96-alpha 以我使用B站和抖音的经历,B站的推荐算法对我更合适,抖音太三次元了 本帖最后由 问道于盲 于 2025-1-20 16:24 编辑
larthasliu 发表于 2025-1-20 16:18
算法不是只推你喜欢的,还要知道你不喜欢什么,并且要能联想,这个联想能力很难 ...
是的,有些时候,你甚至会忍不住去点一下你不喜欢的东西,测试一下自己究竟有多不喜欢,但愚蠢的算法就以为你喜欢上了
我觉得算法真应该记录一下每个人关每个视频的时间点,判断一下是真喜欢还是假喜欢
normalli 发表于 2025-1-20 16:20
就是秘密,虽然不一定真的有什么秘密,但没有秘密也是秘密,数据挖掘早就变成了工程问题,美国企业并不是做 ...
需要足够多的数据收集和分析人员去分析用户行为数据中蕴含的用户意识,需要足够多的算法人员去根据这些意识调节算法的逻辑和权重,也需要足够多的内容和用户让这些调整接受检验完成算法的迭代
总归是个一环扣一环的大工程,字节靠着很多个项目的试错在头条和抖音上开了花,确实了不起,但这也意味着这份了不起的成果随便交给别人很可惜 枯风瘦雪 发表于 2025-1-20 16:13
阿B的算法就感觉过于灵敏而缺乏联想能力了,你点某个主题的视频,可能都还没表现出足够的喜欢(完播啊三 ...
应该是省钱,存储的每个用户的信息太少,就会显得他只基于你最近的观看信息来做推送。 kabunsan 发表于 2025-1-20 07:53
我这种外行,其实不太理解,不就是不断推送用户以前点击过的类似视频吗?有啥特别难的?
—— 来自 鹅球 v ...
根据变量和公式决定该推什么,什么效果好。这个是经过很久的真实用户反馈训练才形成的,所以值钱。而到生产服务器后,实际上是黑箱了
—— 来自 S1Fun 钦念以忱 发表于 2025-1-20 16:28
应该是省钱,存储的每个用户的信息太少,就会显得他只基于你最近的观看信息来做推送。 ...
也有可能,反正阿B的推荐算法很智障,我都是被迫习惯了 kabunsan 发表于 2025-1-20 07:53
我这种外行,其实不太理解,不就是不断推送用户以前点击过的类似视频吗?有啥特别难的?
—— 来自 鹅球 v ...
你得快速的通过用户的观看数据分析出用户究竟是喜欢还是讨厌还是单纯的看过了并找出推荐视频然后重复这一个循环真那么简单的看过什么推什么那市面上的app推荐算法都是可以做的
页:
[1]
2