动漫投票鉴赏区的索引第一个链接啥时候能修一下啊
本帖最后由 卡密sama 于 2024-4-4 15:47 编辑https://p.sda1.dev/16/a21eac565af74852aa26cbf3d93bd14f/QQ截图20240404154350.png
印象中好久之前就不能用了,有几次点进去还是不良网站。 我就是被第一个链接带进来S1的。但是国家队之后没人用鉴赏区了。 我昨天点进去还是不良网站,我以为是什么玩笑,还点了好几次
—— 来自 S1Fun 哦,坏了好久了。 这个域名到期没续费,eph也很久没上线了 Destiny4073 发表于 2024-4-4 19:46
这个域名到期没续费,eph也很久没上线了
好像之前有提过,说是不知道代码的前提下,没法再搞一套(把以前的所有片都包进去) 顶下老楼,投票鉴赏区两个链接都无了。。这怎么补番哦 啥时候修复第二个链接,不然投票不是没意义了吗,看不到分 kaion111 发表于 2024-12-26 17:08
啥时候修复第二个链接,不然投票不是没意义了吗,看不到分
有一说一,投票本身还是可以看到好评率比重,并非没有意义 Destiny4073 发表于 2024-4-4 19:46
这个域名到期没续费,eph也很久没上线了
好奇问一下,这两个链接是不是,假如,我是说假如可以像狗叔那样花钱可以修复起来(
比如大家众筹什么的( 主要不是域名和空间,是代码,你代码给我,我直接挂到s1或者直接开新域名就行了 hein 发表于 2024-12-26 18:08
主要不是域名和空间,是代码,你代码给我,我直接挂到s1或者直接开新域名就行了 ...
好像忘了是谁说的,没办法再搞一个新的代码出来 s1vote是坏了吗,怎么感觉最近都进不去
—— 来自 S1Fun 连个正经APP都没有的地方,别要求太多了 还真的有啊,玩什么论坛都喜欢专门下一个app的斯德哥尔摩患者 550616 发表于 2024-12-27 03:53
连个正经APP都没有的地方,别要求太多了
S1有APP的,只是使用起来不怎么好用( hou_hua 发表于 2024-12-27 00:27
s1vote是坏了吗,怎么感觉最近都进不去
—— 来自 S1Fun
我点了一下发现确实看不了了 aptx8285144 发表于 2024-12-26 23:14
好像忘了是谁说的,没办法再搞一个新的代码出来
会写代码的,一天就写出来,主要还是有人写过轮子了,轮子没了再写很痛苦的。 hein 发表于 2024-12-27 12:27
会写代码的,一天就写出来,主要还是有人写过轮子了,轮子没了再写很痛苦的。 ...
尝试了下用一天的摸鱼时间写一个看看……好吧多花了半天抓数据,又花了半天处理数据。
默认使用动态调节先验强度的贝叶斯平均算法计算的得分进行排序,把 s1vote 排除的 20 票以下的投票帖也都纳入了进来。
因为算法不同,两个站点的排名会有稍许偏差,不过前几百名应该大差不差。
https://s1-vote-3rd.pages.dev/
目前网页还比较糙,因为数据量过大,全部在前端处理的话性能方面的表现比较差,我计划再多完善一些功能后开源,暂时先做个原型放出来看看好了。
计划做的功能:
- 定时抓取数据更新评分,帖子越新抓取的频率越高
- 抓取数据使用开放文本格式保存,任何人都可以拿去使用分析
- 通过标题刮削等方式维护投票帖的番剧数据,增加可用于筛选的元数据
- 完善过滤、排序等功能,内建一套查询语法
- 再研究下有没有更好的排名算法
Junakr 发表于 2024-12-29 00:16
尝试了下用一天的摸鱼时间写一个看看……好吧多花了半天抓数据,又花了半天处理数据。
默认使用动态调节先 ...
看上去很不错,希望大佬到时候慢慢地把上面那个彩色分布图也能弄起来,给大佬加鹅 aptx8285144 发表于 2024-12-29 11:17
看上去很不错,希望大佬到时候慢慢地把上面那个彩色分布图也能弄起来,给大佬加鹅 ...
我倒是没有计划做数据可视化方面的工作,不过会弄个数据层方便有兴趣的朋友接入统计(应该)。
到时候代码使用自由协议开源,要是有朋友能帮忙增加功能是最好不过了,实在没人感兴趣的话就等我有空再看看。
顺便这个粗糙的页面也是准备推倒重做的,现在只是拿出来临时展示,评估一下贝叶斯平均的排名效果。 Junakr 发表于 2024-12-29 11:56
我倒是没有计划做数据可视化方面的工作,不过会弄个数据层方便有兴趣的朋友接入统计(应该)。
到时候代 ...
希望和旧s1vote一样,可以筛选某一年份或某一季度的排名。 吴怀在 发表于 2024-12-29 12:46
希望和旧s1vote一样,可以筛选某一年份或某一季度的排名。
这个是在计划中的,刮削拿到元数据后就会完善筛选功能。
不过近两千八百条帖子脚本处理完后校验数据也要费点功夫,慢慢来吧。 Junakr 发表于 2024-12-29 00:16
尝试了下用一天的摸鱼时间写一个看看……好吧多花了半天抓数据,又花了半天处理数据。
默认使用动态调节先 ...
本地处理的话 手机浏览器直接崩溃了 Destiny4073 发表于 2024-12-29 17:16
本地处理的话 手机浏览器直接崩溃了
没事,我手机也打不开,强行渲染会让手机变成暖手宝(顺便以手机屏幕的大小也不方便查看有很多列的表格)。
倒不是计算的问题,数据都已经提前算好了,主要在于前端框架使用的 UI 组件处理大量元素的渲染性能太差了,分页或者使用虚拟表格可以解决问题,不过这样就无法一次性展示所有数据,或者使用浏览器自带的搜索。
反正这就是一个凑合用的临时页面,我不想花太多时间优化,后面正式版会换成新页面并考虑移动端访问的(最主要一天时间差不多就只能做成这个样子)。 本帖最后由 Junakr 于 2024-12-29 21:00 编辑
Junakr 发表于 2024-12-29 17:59
没事,我手机也打不开,强行渲染会让手机变成暖手宝(顺便以手机屏幕的大小也不方便查看有很多列的表格) ...
考虑到这个网页估计要挂到我什么时候开发完正式版,姑且先简单优化了一下。
默认展示前 250 条,可选查看后 250 或者加载全部,顺便优化了一下缓存机制。
正如前面所说,这个网页最主要的目的还是用来评估贝叶斯平均算法,我并不熟悉统计学,算法因子是我和 GPT 两人一起拍脑袋选的,真心希望有大佬能够指点一二。
这是我使用算法的说明文档(渲染 PDF 比渲染到网页简单):https://s1-vote-3rd.pages.dev/bayesian_average.pdf
---
又优化了一下样式和页面刷新速度,再继续优化就要压缩 JSON 了,不是很想做,就到这里吧。 @hein@Destiny4073我对数学是不太擅长的,麻烦其他大佬替Junakr大佬在26楼参谋参谋,我这个比较数学盲看下来没有什么意见( 本帖最后由 hein 于 2024-12-29 22:33 编辑
Junakr 发表于 2024-12-29 11:56
我倒是没有计划做数据可视化方面的工作,不过会弄个数据层方便有兴趣的朋友接入统计(应该)。
到时候代 ...
哦,昨晚我就看到,凌晨太晚没回复。
前端其实无所谓,不用把精力放在美化和数据处理上,只要有基本数据,其实前端修改很方便的。
其实我以前设计的后台是有3个json:一个是影片列表日期和投票数据的常规数据,一个是影片完整的中日英文对照名和详情,还有一个是每个用户投票的信息(全放一个json还是每个投票一个json当时没想好,可以用来匹配和你兴趣相投的人的其它高评价动画),然后每周或者半月更新一次即可,且直接创建全部独立新json不覆盖原来的,原来的永久备份(加一份传到git上)用来制作投票曲线。并不使用数据库,方便任何人调用json。
后来人懒有现成网友做了,就不弄了。
感谢大家这么热心,其实现在挺可惜的,当年投票区热闹的时候没弄,现在投票区其实算凉了。
做了张表简单比对了下 s1vote 前二十和 s1vote3rd 前二十的区别。
s1vote 有一半的动画在 3rd 中的排名有下降,6 个排名上升,4 个不变。
正负三名内的排名变动就当作算法偏差不考虑了,值得注意的有这几个项目:
- 「机动战士高达 逆袭的夏亚」在两者评分相差无几的情况下,下降了 8 名
- 「光之美少女 All Stars F」下降了 472 名
- 「福星小子2 绮丽梦中人」下降 242 名
- 「机动战舰 -The prince of darkness-」下降 281 名
- 「数码宝贝03 驯兽师之王」下降 215 名
排名大幅下降的四部动画投票数在 100 票以内,因为样本量过少,在贝叶斯平均算法下被趋向于「平均化」了。
s1vote3rd 这边相对 s1vote 有一半的动画排名上升,6 个排名下降,4 个不变。
其中值得注意的是「少女与战车 剧场版」、「JoJo的奇妙冒险」、「乒乓 ピンポン THE ANIMATION」、「强风吹拂」这四部动画在新算法下进入了前二十,挤下了上面四个高分少票的动画。
这里前二十名的最低票数是 274,属于「机动战士高达 逆袭的夏亚」,排名 19。
我个人比较倾向后者的算法排名,让有大量票数的动画不会被只有几十人投票的高分动画超过,不过也因此只有很少人投票的优质动画也会被算法埋没在平均值中,永无出头之日。
或许应该引入类似 BGM 的 VIB 机制,给 very important s1er 更高的权重?当然这也只是我随便说说罢了(。
划分数据区间按季度排名,根据当前季度的总平均分和总投票数动态规划算法的权重应该是比较好的选择。
表格数据复制了一份到在线文档,有兴趣自取:
【腾讯文档】s1vote rank 20
https://docs.qq.com/sheet/DRWRxd1hWTkdIVHVh?tab=BB08J2 传一份统计局eph的图形效果的js,比较古老,现在应该有更新的效果了吧
本帖最后由 Junakr 于 2024-12-29 23:12 编辑
hein 发表于 2024-12-29 22:22
哦,昨晚我就看到,凌晨太晚没回复。
前端其实无所谓,不用把精力放在美化和数据处理上,只要有基本数据, ...
这边和我的想法差不多,我的数据储存方式目前暂定是每个投票帖一个 tid 命名的目录,目录下有两个 yaml 文件(不使用 json 的原因是 json 可写性太差了)和一个子目录 raw。
一个 yaml 保存动画的元数据(日期、类型、集数、中文名、日英别名等),除了初始化更新一遍后续手动维护,另外因为通过帖子标题能获取的动画信息有限,所以考虑绑定 BGM 条目 ID,抓不抓那边的数据作为补充后面再说。
另一个 yaml 保存帖子的投票信息,基本上就是整理了一遍接口调回来的最新数据,记录每个选项的投票数和所有投票用户的 ID,这个 yaml 的数据都是自动更新的,不用手动维护。
子目录 raw 下面保存每次更新数据调用接口返回的原始结果(同时调用 /thread、/poll 两个接口),打上时间戳对每次调用存一个 json,用于记录历史数据,不过我计划不会做投票趋势这种东西,总之数据先留着。
因为计划做一个数据中台,所以光使用配置文件记录数据还不够,这些文件我也都会上传到 GitHub,同时也会同步导入一份到 SQLite 方便查询。
另外我也观察到鉴赏区新帖近年的投票数都很少了(都来外面投票了),所以也担心新算法的效果可能不太好(等等今年还有一个投票帖有接近四百票,让我看看是什么……哦是 GBC)。
总之有空我就继续开发吧,进度会慢一些,尽量在年前搞一版出来,如果做一半做不下去了我就开源丢出去,到时再看看有没有朋友接力吧(不是。 Junakr 发表于 2024-12-29 22:59
等下快捷键冲突提前发出去了,还没写完……
---
确实,有了原始数据,前端页面想着玩就怎么玩 hein 发表于 2024-12-29 23:07
确实,有了原始数据,前端页面想着玩就怎么玩
我应该有一半是被 s1vote 带进泥潭的,鉴赏区真的挺不错的,许多老动画都能很方便的找到当时坛友们的讨论,氛围和现在的动画楼也完全不一样。
所以前段时间看到 s1vote 也无法访问时觉得非常可惜,当时就考虑自己要不要去抓下数据重建一下了,等了几天还是决定用自己的方式去开发一个投票索引了。
为了避免我自己过两年脱宅跑路,所以代码和数据计划全部开源,页面使用纯静态构建无服务端需求,多点部署(GitHub、Gitee、Cloudflare),让脚本尽可能的自动化运行,需要手动维护的数据开放 PR 让坛友也能修改,虽然我估计应该不会有几个人帮忙……不过姑且先这么做着吧。 投票区的历史已经更新,有需要的观众们可以去移步“考证”,感谢几位大佬的修复 Junakr 发表于 2024-12-29 23:28
我应该有一半是被 s1vote 带进泥潭的,鉴赏区真的挺不错的,许多老动画都能很方便的找到当时坛友们的讨论 ...
用大佬处理的数据也试着搞了个页面:
https://github.com/hexh250786313/stage9th
国内访问用:https://stage9th.hexh.xyz/
数据是偷大佬的,代码是 ai 写的,我也非常努力了呢
aptx8285144 发表于 2025-1-5 16:32
投票区的历史已经更新,有需要的观众们可以去移步“考证”,感谢几位大佬的修复 ...
刚发现 s1vote 恢复了啊,@hein 版主可以把链接挂回去了。
年底突然各种事比较忙,不好意思搁置了开发,年前尽量赶下进度。 花スープ 发表于 2025-1-16 00:07
用大佬处理的数据也试着搞了个页面:
https://github.com/hexh250786313/stage9th
需要数据的话直接跟我说就好啦,不需要从网页源码中拿啦,正好一直在想着什么时候再抓一份最新数据,原始的计算前数据都会公开,只是我还没做好开源准备。
可视化方面做词云的话有很多图表库可用,我主要认为做词云的意义不大,纯好看。
这边看了一眼坛友的代码是单独 fetch 的 json,react 前端也有自己的优势,加载比我的快很多,到时候我搭好数据平台应该对下接口稍微调整下就能用,两个页面可以支持到。 Junakr 发表于 2025-1-16 00:48
需要数据的话直接跟我说就好啦,不需要从网页源码中拿啦,正好一直在想着什么时候再抓一份最新数据,原始 ...
感谢 花スープ 发表于 2025-1-16 00:54
感谢
使用不多的睡眠时间姑且先更新了一遍最新的数据。
投票帖数:2801 - 2795 = 6
投票数:305668 - 305292 = 376
总得分:280797 - 280416 = 381
独立投票人数:24702 - 24678 = 24
半个多月有这么多数据增长我还挺意外的,鉴赏区也不算很凉嘛。
这边单独上传了一份 json,你可以直接用,不用去手动拷贝字符串了:
https://s1-vote-3rd.pages.dev/poll_results.json https://s1-vote-3rd.pages.dev/?new=true
增加根据帖子发布时间降序排列的排序选项,方便查找最新的投票帖进行投票。
至于为什么要使用这么别扭的方式做一堆链接固定几种排序而不是用自定义表格排序……
相信我,我调试过,目前使用的表格组件在处理大数据量下的排序筛选性能相当差,加上我又不愿意分页,这会消耗大量不必要的计算资源,让浏览器卡死。
所以,姑且凑合用吧,网页使用的计算后 JSON 数据也放出来了,有需要的朋友也可以自己拿去筛选分析(如果需要抓取的原始数据可以私聊我)。
页:
[1]
2