革萌 发表于 2021-3-8 10:33

如何设计一个合理的漫画评分卡

本帖最后由 革萌 于 2021-3-8 10:59 编辑

最近看了看自己在在线网站的漫画收藏,突然有了这个兴趣。
首先的想法是把所有收藏夹里的信息爬下来,按照tag计数,收藏夹里出现次数就对应tag的分数。然后收藏夹里的作者,姑且算十分。然后还有一些其他的参考项目,比如漫画的被收藏次数,评论次数。都除以十计入分值。
然后随便爬了一部分漫画,取要打分的漫画tag和tag列表里有分的对照,tag分加一起,然后漫画作者如果和收藏夹有重合,加十分,再加上收藏分和评论分。做了一个排序........

结果发现非常不理想,分数靠前的都是一些tag非常多的老作品,同一作者的漫画作品在分数上分散的到处都是。完全起不到推荐的效果。
基本过程就是 收藏夹处理=>1.收藏作者列表,2.收藏tag列表和对应的分数(在收藏作品中的出现次数)

漫画分数 = ( 漫画作者在收藏作者列表中?10:0)+sum(漫画tag在收藏tag列表中?tag分数:0)+漫画被收藏的次数/10+漫画被评论的次数/10


后来的想法是tag分数不加和,而是取最高。但是同作家作品只要有共同的高分tag就会分到一起,但是区分度又不明显了...


漫画分数 = ( 漫画作者在收藏作者列表中?10:0)+max(漫画tag在收藏tag列表中?tag分数:0)+漫画被收藏的次数/10+漫画被评论的次数/10


乔槁 发表于 2021-3-8 10:51

本帖最后由 乔槁 于 2021-3-8 11:07 编辑

按照动漫之家的日文原名,去爬日本亚马逊评分与评价。

国内平台评分不太可信,冷门漫画数据量不够,翻译质量有干扰,漫画本身被和谐etc……

革萌 发表于 2021-3-8 10:55

乔槁 发表于 2021-3-8 10:51
按照动漫之家的日文原名,去爬日本亚马逊评分与评价。

国内平台评分不太可信,冷门漫画数据量不够,翻译质 ...

额.......核心是针对自己的喜好做推荐.......不是通用分啦

兔耳僵尸 发表于 2021-3-8 10:57

本帖最后由 兔耳僵尸 于 2021-3-8 12:39 编辑

tag按加权平均算?
想了想主要是信息太少了,漫画不像文本那么容易提取特征,漫画之间的联系也太少。如果能拿到大量用户的收藏那确实可以做一个推荐系统,这一般是平台提供的功能

乔槁 发表于 2021-3-8 11:58

本帖最后由 乔槁 于 2021-3-8 11:59 编辑

革萌 发表于 2021-3-8 10:55
额.......核心是针对自己的喜好做推荐.......不是通用分啦
就经验来说,点击量和质量未必有关系。
评分基本仅供参考,tag更是一团糟,建议不统计。

感觉就算做出来,也不如日亚推荐准。
页: [1]
查看完整版本: 如何设计一个合理的漫画评分卡