LLaMA Factory+ModelScope实战——使用 Web UI 进行监督微调

2024-05-13 1459阅读

LLaMA Factory+ModelScope实战——使用 Web UI 进行监督微调

文章原始地址：https://onlyar.site/2024/01/14/NLP-LLaMA-Factory-web-tuning/

引言

大语言模型微调一直都是一个棘手的问题，不仅因为需要大量的计算资源，而且微调的方法也很多。在尝试每种方法过程中，配置环境和第三方库也颇为麻烦。。而 LLaMA Factory1 是一个高效的大语言模型训练和推理的框架，不仅集成多种高效训练方法，而且能持续适配国内外各种开源大模型。该框架还提供了能够一站式实现大模型预训练、监督微调、评估、推理的 Web UI 界面，使用户能够直观地看到训练选项、模型数据集选项、训练进度等重要信息。

为方便国内用户使用，该框架支持了魔搭社区（ModelScope）的模型和数据集资源，训练前可自动下载并缓存资源。

而 Yi 系列大模型2是李开复博士创办的“零一万物”公司研发的首款开源大模型。参数规模有 6B 和 34B。其中的 Yi-34B 不仅支持 200K tokens 的超长窗口，更是在众多性能评测榜单上取得领先成绩。

本次我们基于 LLaMA Factory 框架，在一张 V100 显卡上使用 ModelScope 上支持的在线数据集对 Yi-6B 模型进行监督微调，使其获得对话能力。

环境准备

LLaMA Factory框架目前托管在 github 上，所以，我们要先使用 git 来安装 LLaMA Factory 开源框架：

git clone https://github.com/hiyouga/LLaMA-Factory.git

等待仓库下载完毕，进入仓库并安装所需依赖：

cd LLaMA-Factory
pip install -r requirements.txt

注意：截至文章编辑时（2024 年 1 月 22 日），该框架在使用最新版本的 torch 库时，会出现无法正常推理的情况。请根据您的硬件环境选择合适的 torch 版本进行安装，版本范围为 torch>=1.13.1,

VPS购买请点击我

免责声明：我们致力于保护作者版权，注重分享，被刊用文章因无法核实真实出处，未能及时与作者取得联系，或有版权异议的，请联系管理员，我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理! 图片声明：本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库和百度，360，搜狗等多加搜索引擎自动关键词搜索配图，如有侵权的图片，请第一时间联系我们，邮箱：ciyunidc@ciyunshuju.com。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!

LLaMA Factory+ModelScope实战——使用 Web UI 进行监督微调

LLaMA Factory+ModelScope实战——使用 Web UI 进行监督微调

引言

环境准备

相关阅读

怎么把织梦的模板替换?

dedecms怎么调用特定的栏目文档?

怎么抓包一个网页?

wap怎么封装app?

目录[+]