fly63前端网

www.fly63.com

首页文章资源工具教程 栏目
  • 关于我们
  • 网站投稿
  • 赞助一下
搜索

在线工具_工作生活好帮手

打造各种简单、易用、便捷的在线工具,网友无需注册和下载安装即可使用

点击查看

关闭

提交网站

Firefly(流萤)
分享
复制链接
新浪微博
QQ 好友

扫一扫分享

GitHub:https://github.com/yangjianxin1/Firefly
网站描述:中文对话式大语言模型

Firefly(流萤): 中文对话式大语言模型(全量微调+QLoRA),支持微调Mixtral-8x7B、Zephyr、Mistral、Aquila2、Baichuan2、CodeLlama、Llma2、Llama、Qwen、Baichuan、ChatGLM2、InternLM、Ziya、Bloom等大模型。


项目简介

Firefly(流萤) 是一个开源的中文大语言模型项目,支持QLoRA和全量参数微调Baichuan2、CodeLLaMA、LLaMA2、LLaMA、Qwen、Baichuan、ChatGLM2、InternLM、Ziya、Bloom、XVERSE等开源模型。 正如我们的项目名称一样,希望本项目能够像流萤一般发出淡淡微光,为中文大语言模型社区尽绵薄之力,促进中文大语言模型社区的发展。

如果你的训练资源有限,我们极力推荐使用QLoRA的指令微调方式,因为我们在Open LLM Leaderboard上验证了该方法的有效性,详情见模型评测章节。

流萤(萤火虫的别称)是中华传统文化的一个符号,虽说腐草为萤,带有悲悯意味,但萤火虽小,也能凭借其淡淡荧光,照亮夜空。本项目的名称取自杜牧的《秋夕》:银烛秋光冷画屏,轻罗小扇扑流萤。


项目内容

项目主要内容如下:

支持全量参数指令微调、QLoRA低成本高效指令微调、其中QLoRA是我们主推的一种高效的训练方式。

支持绝大部分主流的开源大模型,如Baichuan2、CodeLLaMA、LLaMA2、LLaMA、Qwen、Baichuan、ChatGLM2、InternLM、Ziya、Bloom、XVERSE等。

支持lora与base model进行权重合并,推理更便捷。

模型裁剪:通过LLMPruner:大语言模型裁剪工具 ,开源裁剪后的Bloom模型权重 。在保留预训练中文知识的前提下,有效减少模型参数量,降低训练成本,提高训练效率。

整理并开源指令微调数据集:firefly-train-1.1M 、moss-003-sft-data、ultrachat、 WizardLM_evol_instruct_V2_143k、school_math_0.25M。

开源Firefly系列指令微调模型权重 。

在Open LLM Leaderboard上验证了QLoRA训练流程的有效性。


安装环境

在requirements.txt下固定了几个主要的python包的版本,执行如下脚本即可。

注意:Baichuan2需要安装pytorch 2.0。除Baichuan2以外,其他模型的训练,我们均在torch==1.13上进行训练。

pip install requirements.txt


链接: https://fly63.com/nav/4041

more>>
相关栏目
文心一言
百度研发的知识增强大语言模型
官网
Bard
Google 推出的一款对话式 AI 工具
官网
讯飞星火
科大讯飞推出的新一代认知智能大模型
官网
Gemini
谷歌发布最新人工智能模型
官网
盘古大模型
华为盘古大模型,重塑千行百业
官网
豆包AI
字节跳动旗下 AI 智能助手
官网
Anthropic Claude
Anthropic发布的与ChatGPT竞争的聊天机器人
官网
Adobe Firefly
Adobe最新推出的AI图像生成和编辑工具
官网
Midjourney
一款AI绘画工具
官网
LLaMA
Meta(Facebook)推出的AI大语言模型
点击进入GitHub
AI提示语
AI提示指令,让生产力加倍!
官网
百川智能
汇聚世界知识,创作妙笔生花
官网
通义千问
一个不断进化的AI大模型
官网
Ollama
本地便捷部署和运行大型语言模型LLM框架
官网GitHub
DeepSeek
幻方量化公司旗下的开源大模型平台
官网GitHub
火山写作
字节跳动推出的一款AI智能写作服务
官网

手机预览