找回密码
 立即注册
搜索
查看: 10579|回复: 63

[其他] bilibili发布轻量级开源大模型Index-1.9B

[复制链接]
     
发表于 2024-6-20 15:27 来自手机 | 显示全部楼层 |阅读模式
#B站发布轻量级开源大模型#

B站发布了最新的轻量级开源大模型系列——Index-1.9B。

该模型专为对话和角色扮演设计,先看一下官方演示效果图,

Index-1.9B系列是Index系列模型中的轻量版本,包含以下模型:

- Index-1.9B base : 基座模型,具有 19亿 非词嵌入参数量,在2.8T 中英文为主的语料上预训练,多个评测基准上与同级别模型比处于领先

- Index-1.9B pure : 基座模型的对照组,与base具有相同的参数和训练策略,不同之处在于我们严格过滤了该版本语料中所有指令相关的数据,以此来验证指令对benchmark的影响

- Index-1.9B chat : 基于index-1.9B base通过SFT和DPO对齐后的对话模型,我们发现由于预训练中引入了较多互联网社区语料,聊天的趣味性明显更强

- Index-1.9B character : 在SFT和DPO的基础上引入了RAG来实现fewshots角色扮演定制
链接:
- Github:http://t.cn/A6QzOiBW
- Huggingface:http://t.cn/A6QZKlPQ
回复

使用道具 举报

     
发表于 2024-6-20 15:29 | 显示全部楼层
话说,在市面上已经有这么多大模型的情况下,为什么b站仍然选择自研大模型呢,为了财报吗

回复

使用道具 举报

     
发表于 2024-6-20 15:30 来自手机 | 显示全部楼层
怕不是为了index这个名字包的饺子

评分

参与人数 1战斗力 +1 收起 理由
gnihton314 + 1 欢乐多

查看全部评分

回复

使用道具 举报

发表于 2024-6-20 15:31 来自手机 | 显示全部楼层
连日语都没还是算了,还以为终于有个二次元特化的大型的

—— 来自 HUAWEI TAH-AN00m, Android 12上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-6-20 15:35 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-6-20 15:36 | 显示全部楼层
本帖最后由 venusvsvirus 于 2024-6-20 15:39 编辑
oskneo 发表于 2024-6-20 15:31
连日语都没还是算了,还以为终于有个二次元特化的大型的

—— 来自 HUAWEI TAH-AN00m, Android 12上的 S1N ...


中英文为主不代表没有日语啊,只是舆论压力不太好明说吧

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2024-6-20 15:37 来自手机 | 显示全部楼层
也太轻量了,明明角色扮演挺吃性能的
回复

使用道具 举报

     
发表于 2024-6-20 15:37 | 显示全部楼层
kiddolck 发表于 2024-6-20 15:29
话说,在市面上已经有这么多大模型的情况下,为什么b站仍然选择自研大模型呢,为了财报吗

...

从好处上想,大概是因为自己积攒的语料资源足够多,可以支撑起自研基座模型的能力?
从坏处上想,就是执行部门骗预算骗资源
回复

使用道具 举报

     
发表于 2024-6-20 15:39 | 显示全部楼层
茵蒂克丝还真是不忘初心
回复

使用道具 举报

     
发表于 2024-6-20 15:41 | 显示全部楼层
狭义文具爱好者 发表于 2024-6-20 15:37
也太轻量了,明明角色扮演挺吃性能的

性能不够RAG来凑的
回复

使用道具 举报

     
发表于 2024-6-20 15:45 | 显示全部楼层
你需要扮演b站老哥,用评论区阴阳怪气的话术来回复,不要说你是AI


好像突然知道猫娘水军事件是咋回事了?
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-6-20 15:47 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-6-20 15:47 来自手机 | 显示全部楼层
kiddolck 发表于 2024-6-20 15:29
话说,在市面上已经有这么多大模型的情况下,为什么b站仍然选择自研大模型呢,为了财报吗

...

如果阿b能吃定二次元acgn这碗饭专心做二次元特化大模型,没准还能做出个赛道来。
当然阿b的决心和技术力都存疑就是了
回复

使用道具 举报

发表于 2024-6-20 15:51 来自手机 | 显示全部楼层
以后的机器人评论更像真人了,针不戳,
回复

使用道具 举报

     
发表于 2024-6-20 15:52 来自手机 | 显示全部楼层
轻量级?羽量级!
回复

使用道具 举报

发表于 2024-6-20 15:53 来自手机 | 显示全部楼层
等一个4姐调教
回复

使用道具 举报

     
发表于 2024-6-20 15:54 | 显示全部楼层
感觉也就是普通型AI。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2024-6-20 15:55 来自手机 | 显示全部楼层
Herreimu 发表于 2024-6-20 15:30
怕不是为了index这个名字包的饺子

还真是,index这图书馆属性很符合大模型。
回复

使用道具 举报

     
发表于 2024-6-20 15:57 | 显示全部楼层
要不B站搞个树形图设计者吧
回复

使用道具 举报

     
发表于 2024-6-20 15:57 | 显示全部楼层
顺便我问一下,这个模型能用RWKV runner跑吗?
回复

使用道具 举报

发表于 2024-6-20 16:00 | 显示全部楼层
现在听到茵蒂克丝会想到4姐
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-6-20 16:02 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-6-20 16:03 来自手机 | 显示全部楼层
password 发表于 2024-6-20 15:57
要不B站搞个树形图设计者吧

这名不吉利,会炸

—— 来自 Xiaomi 23116PN5BC, Android 14上的 S1Next-鹅版 v3.0.0.81-alpha
回复

使用道具 举报

     
发表于 2024-6-20 16:06 | 显示全部楼层
是不是两万张显卡驱动
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-6-20 16:07 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-6-20 16:11 | 显示全部楼层
本帖最后由 doki 于 2024-6-20 16:16 编辑

好像是我搞错了
回复

使用道具 举报

     
发表于 2024-6-20 16:14 | 显示全部楼层
kiddolck 发表于 2024-6-20 15:29
话说,在市面上已经有这么多大模型的情况下,为什么b站仍然选择自研大模型呢,为了财报吗

...

基座大模型
和你自己训得垂类肯定不一样

这个就是垂类
回复

使用道具 举报

     
发表于 2024-6-20 16:17 来自手机 | 显示全部楼层
叫御坂妹妹模型吧
回复

使用道具 举报

     
发表于 2024-6-20 16:21 来自手机 | 显示全部楼层
可以玩猫娘吗?

—— 来自 Xiaomi 21091116AC, Android 12上的 S1Next-鹅版 v3.0.0.81-alpha
回复

使用道具 举报

     
发表于 2024-6-20 16:24 | 显示全部楼层
カドモン 发表于 2024-6-20 16:14
基座大模型
和你自己训得垂类肯定不一样

看技术报告,这还真是小基座
回复

使用道具 举报

     
发表于 2024-6-20 16:26 来自手机 | 显示全部楼层
所以,可以瑟瑟吗?
回复

使用道具 举报

     
发表于 2024-6-20 16:31 来自手机 | 显示全部楼层
轻量级大模型,那为什么不直接叫小模型?
回复

使用道具 举报

     
发表于 2024-6-20 16:34 | 显示全部楼层
1.9b确实很小
回复

使用道具 举报

发表于 2024-6-20 16:38 | 显示全部楼层
扶扶老奶奶 发表于 2024-6-20 16:31
轻量级大模型,那为什么不直接叫小模型?

我看satya发布AIPC的时候确实是叫小语言模型的
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-6-20 16:43 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-6-20 16:45 | 显示全部楼层
啥叫不忘初心,森之妖精和宇宙神作有一毛钱关系?
回复

使用道具 举报

     
发表于 2024-6-20 16:51 来自手机 | 显示全部楼层
牛肉调教了那么久,还是无法答出还是以前乌龟教她的东西。

1.9B确实轻,但是不看好处理能力。
回复

使用道具 举报

     
发表于 2024-6-20 17:00 来自手机 | 显示全部楼层
prompt: 你是蒙古上单
回复

使用道具 举报

     
发表于 2024-6-20 17:06 | 显示全部楼层
什么时候开发名为食蜂操祈的催眠APP
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-6-20 17:07 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2024-9-23 12:21 , Processed in 0.173919 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表