本帖最后由 yweili999 于 2024-4-4 08:22 编辑
https://zhuanlan.zhihu.com/p/690640864
“是的,就是我们认识那个弱智吧”
不行太好笑了。
[2403.18058] COIG-CQIA: Quality is All You Need for Chinese Instruction Fine-tuning (arxiv.org)
中科院为了搞出更适合中国宝宝的 AI,搜集了各大社区平台的语料,精心整理出一份数据集。
他们拿这些数据去炼ai,然后测了下各家数据炼出来的性能,就下面这个表:
嗯?第一名ruozhiba?
我的心情:看看是谁的部将, 76.9 得分第一……嗯? Ruozhiba?什么论坛,没听说过?等会,弱智吧?真的假的?
往上前一翻,还真就那个弱智吧,他们收集了点赞最多的500个帖子,可以看到,吃了弱智吧数据集的 Yi-34B 在开放式问答、头脑风暴、分类、生成、总结、封闭式问答、 提取、代码8个项目下都拿到了最高分。(遥遥领先!)
哇,真的是你啊再看眼这个表:
最强的是,弱智吧 code 得分连 SegmentFault 都超了。
知乎均分第二,Math 这一项拿了第一,守住了知识平台的荣光。要是这波没弱智吧知乎就第一了! 题外话,小红书均分才50.3,遥遥落后! 研究员说, 有趣的是,弱智吧在所有子集中平均排名第二。我们推测这是因为它可以增强模型的逻辑推理能力,从而有利于大多数指令跟踪任务。 我还有一点小疑问,就他们为什么会想到去弱智吧收集数据(挠头)。
|