卡片召唤师
精华
|
战斗力 鹅
|
帖子
注册时间 2023-4-5
|
本帖最后由 Machinery 于 2023-4-16 00:38 编辑
rwkv-4-raven
要解释rwkv-4-raven就要解释ChatRWKV,要解释ChatRWKV就要解释RWKV挨个来吧
RWKV是国人研发的(作者知乎主页:https://www.zhihu.com/people/bopengbopeng),具有Transformer级LLM模型性能的 RNN模型(注意,是RNN模型),结合了RNN和Transformer的优点,更好的性能表现,快速推理,更节省VRAM,更快的训练速度,(相对)无限的上下文长度,自由的语句嵌入等
作者github主页:https://github.com/BlinkDL
而ChatRWKV则是在这个模型基础设计上进行对话微调的系列模型,根据不同的参数量,训练集语料比例以及版本划分为不同的模型命名,以及对应开源的模型权重
项目地址:https://huggingface.co/BlinkDL/rwkv-4-raven
RWKV-4-Pile系列模型有3B/7B/14B等版本,最近在Alpaca, CodeAlpaca, Guanaco, GPT4All, ShareGPT等公开数据集上进行微调,具体安装使用可以根据作者的readme步骤进行
—— 来自 S1Fun |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
评分
-
查看全部评分
|