”斯坦福Alpaca“ 的搜索结果

     斯坦福的 Alpaca 是一种基于指令执行的语言模型,它可以根据用户给出的指令,生成不同类型的文本内容,例如诗歌、故事、代码等。Alpaca 的特点是它可以快速地适应新的任务和数据集,而不需要重新训练或微调。Alpaca ...

     去年的Alpaca 7B模型,不仅展示了在处理指令任务上的出色能力,还因其相对小的规模和低廉的复现成本而引起了大家的注意。在本篇博客中,汇总了官方报告和官方Git的内容,通过阅读可以了解Alpaca 7B模型的起源、训练...

alpaca-lora微调

标签:   chatgpt  alpaca  lora

     预训练模型:decapoda-research/llama-7b-hf 会自动下载。共计33个405M的bin文件,...该数据基于斯坦福alpca数据进行了清洗。由于微调时间较长,这里直接后台运行。效果如下,显存占用约8个G。1、将项目下载到本地。

     self-instruct是一种任务不可知(task-agnostic)的方法,通过自己生成指令数据(指令、输入和输出样本)并使用它进行引导来提高语言模型的指令遵循能力。大型“指令调优”语言模型在新任务上展现了Zero-shot的卓越...

10  
9  
8  
7  
6  
5  
4  
3  
2  
1