LLaMA - 程序员宅基地

LLaMA 入门指南

LLaMA（Large Language Model – Meta AI）是一种由Facebook母公司Meta AI提出的大型语言模型。它是设计用来理解和生成自然语言文本的模型。LLaMA通过大规模数据集训练，可以在多种任务中表现出色，包括文本分类、...

LLaMA的解读与其微调(含LLaMA 2)：Alpaca-LoRA/Vicuna/BELLE/中文LLaMA/姜子牙

标签： ChatGPT LLaMA 斯坦福Alpaca

还开始研究一系列开源模型(包括各自对应的模型架构、训练方法、训练数据、本地私有化部署、硬件配置要求、微调等细节)该项目部分一开始是作为此文《》的第4部分，但但随着研究深入为避免该文篇幅又过长，将把『第...

【Llama2 windows部署详细教程】第三节 Llama2 跑起来

标签： windows llama python

这里是通过 transformers的 convert_llama_weights_to_hf.py进行转换的，这个依赖模块是上述第二步进行安装的，只要找到安装成功后的目录，就可以找到这个文件。这一步非常重要，很多小伙伴在做模型量化的时候，可能...

Meta最新模型LLaMA细节与代码详解

标签：人工智能深度学习自然语言处理

本文对Facebook Meta AI最新提出的大语言模型LLaMA进行简单的介绍，以及对其开源出的代码和细节进行了详细的说明。

Meta开源的LLaMa到底好不好用？最全测评结果来了

标签：人工智能机器学习深度学习

源｜机器之心Meta 开源的大模型系列 LLaMA 评测出炉，对比结果显示，和 ChatGPT 还是有差距的。ChatGPT 的持续爆火，早已让各大科技公司坐不住了。就在刚刚过去的一周，Meta「开源」了一个新的大模型系列 ——LLaMA...

大规模语言模型--LLaMA 家族

标签：语言模型 llama 人工智能

模型的外推性是指大模型在训练时和预测时的输入长度不一致，导致模型的泛化能力下降的问题。总结来说， RoPE 的 self-attention 操作的流程是：对于 token 序列中的每个词嵌入向量，首先计算其对应的 query 和 ...

详解各种LLM系列｜（1）LLaMA 1 模型架构、预训练、部署优化特点总结

标签： llama 深度学习人工智能

整理了LLaMA 1 模型架构、预训练、部署优化特点

LLaMA 简介：一个具有 650 亿参数的基础大型语言模型官网介绍

标签： llama 语言模型人工智能

更小、性能更高的模型（例如 LLaMA）使研究界中无法访问大量基础设施的其他人能够研究这些模型，从而进一步实现这一重要且快速变化的领域的访问民主化。型是可取的，因为它需要更少的计算能力和资源来测试新方法、...

【LLM】LLaMA简介：一个650亿参数的基础大型语言模型

标签：语言模型人工智能 LLaMA

作为 Meta 对开放科学承诺的一部分，今天我们将公开发布LLaMA(大型语言模型 Meta AI) ，这是一个最先进的大型语言基础模型，旨在帮助研究人员推进他们在人工智能这一子领域的工作。更小，更高性能的模型，例如 LLaMA...

LLaMA系列 | LLaMA和LLaMA-2精简总结

标签： llama 大模型 llm

LLaMA系列 | LLaMA和LLaMA-2精简总结

Llama3 AI应用开发实战

标签： AIGC/LLM llama3

Meta推出迄今为止能力最强的开源大模型Llama 3系列，发布8B和70B两个版本。Llama 3训练数据集比 Llama 2 使用的数据集大了足足七倍。本课程旨在帮助学员深入了解Llama3模型，掌握其应用开发的核心技能，为未来的AI...

如何在Windows本地和云端安装LLaMA 2 (ChatGPT)

标签： windows pytorch LLaMa ChatGPT

3. 在Windows本地安装LLaMA 2 - 步骤1：创建新的Conda环境 - 步骤2：激活新环境 - 步骤3：安装PyTorch - 步骤4：克隆代码库 - 步骤5：切换目录 - 步骤6：安装Python模块 - 步骤7：启动服务器 - 步骤8：访问...

开发和启用llama2 api

标签：自然语言处理 llama2

这是一个基于Gradio的通用文本生成模型Web UI框架，支持transformers、GPTQ、llama.cpp (ggml)、Llama模型等。它的目标是成为文本生成的AUTOMATIC1111/stable-diffusion-webui。以下是启动API的完整流程： 1. 安装...

中文LLaMA&Alpaca大模型

标签：软件/插件 LLaMA

本项目基于Meta发布的可商用大模型Llama-2开发，是中文LLaMA&Alpaca大模型的第二期项目，开源了中文LLaMA-2基座模型和Alpaca-2指令精调大模型。这些模型在原版Llama-2的基础上扩充并优化了中文词表，使用了大规模...

Docker下部署LLAMA 2

标签： docker LLAMA

本指南主要介绍如何在docker下部署LLAMA 2，附带命令代码和docker文件的编辑代码

Llama2-7B/13B chat模型（下载地址）.txt

标签： chat llama 大模型人工智能对话

•Llama2-7B官网版本 •Llama2-7B-Chat官网版本 •Llama2-13B官网版本 •Llama2-13B-Chat官网版本 •Llama2-7B Huggingface版本 •Llama2-7B-Chat Huggingface版本

袖珍版“Llama2” Windows上也能用了！VisualStudio2022下编译通过

标签：袖珍版“Llama2” VS2022

袖珍版“Llama2” Windows上也能用了！VisualStudio2022下编译通过。提供了 1500 万参数，和 4400 万参数的两个模型，可以在project内直接下载： • model15m.bin，大小 59M • model44m.bin，大小 160M tokenizer....

Llama2-Chinese.tar

标签： 0

Llama2-Chinese.tar

为ChatGPT/ChatGLM/LLaMA/StableLM/MOSS等多种LLM提供了一个轻快好用的Web图形界面源码+教程

标签：软件/插件课程资源 ChatGPTAPI

为ChatGPT/ChatGLM/LLaMA/StableLM/MOSS等多种LLM提供了一个轻快好用的Web图形界面。使用System Prompt可以很有效地设定前提条件。使用Prompt模板功能时，选择Prompt模板集合文件，然后从下拉菜单中选择想要的...

基于中文金融知识的LLaMA系微调模型的智能问答系统：LLaMA大模型训练微调推理等详细教学

标签： NLP 智能问答知识图谱人工智能

基于中文金融知识的LLaMA系微调模型的智能问答系统：LLaMA大模型训练微调推理等详细教学

本地部署开源大模型的完整教程LangChain + Streamlit+ Llama

标签：软件/插件课程资源大模型部署

本地部署开源大模型的完整教程LangChain + Streamlit+ Llama

META的LLaMA大模型部署指令调优教程内含模型下载方法.pdf

标签：课程资源

内含大模型下载链接大模型压缩教程大模型运行环境搭建

Firefly(流萤): 中文对话式大语言模型(全量微调+QLoRA)，支持微调Llma2、Llama、Qwen、B

标签：语言模型

开源firefly-llama2-13b，在Open LLM排行榜上以62分，同量级模型排名第三，比榜首略低0.5分。开源firefly-baichuan-13b，使用一百万多轮对话数据，提升baichuan-13b的多轮对话能力。 Firefly-Baichuan-13B生成样例...

支持模型(ChatGLM-6B, LLaMA, Bloom-7B, baichuan-7B), 支持(LoRA, QLoRA

标签：数学数据集 ui LORA LLM-SFT

中文大模型微调(LLM-SFT), 数学指令数据集MWP-Instruct, 支持模型(ChatGLM-6B, LLaMA, Bloom-7B, baichuan-7B), 支持(LoRA, QLoRA, DeepSpeed, UI, TensorboardX),

中文LLaMA模型和指令精调的Alpaca大模型：中文数据进行二次预训练，进一步提升了中文基础语义理解能力

标签：大模型人工智能深度学习自然语言处理

中文LLaMA模型和指令精调的Alpaca大模型：中文数据进行二次预训练，进一步提升了中文基础语义理解能力

ChatGLM和LLaMA中文指令微调教程.zip

标签：大语言模型 Chatglm

本资源是大模型的微调教程内含数据集和模型连接，可以作为入门教程

计算机行业深度研究：LLaMA等开源模型凸显先进算法及行业数据的重要性.pdf

标签：软件/插件算法 chatgpt

LLaMA 基于通用领域的开源数据集进行训练,训练数据涵盖 40 种语言,包含约 1.4 万亿 Tokens尽管 LLaMA 模型参数量较小,但性能丝毫不逊色于 PaLM.GPT-3 等大语言模型。并且较小的参数规模显著降低了 LLaMA 模型的落地...

LLaMA 2: Open Foundation and Fine-Tuned Chat Models 全文翻译

标签： LLaMA2 自然语言处理算法

LLaMA 2: Open Foundation and Fine-Tuned Chat Models 全文翻译原文：https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/Llama 2 下载网址：...

LLMs之Llama3：Llama 3的简介、安装和使用方法、案例应用之详细攻略

标签： Llama 3 大语言模型 llama

LLMs之Llama 3：Llama 3的简介、安装和使用方法、案例应用之详细攻略目录 Llama 3的简介 Llama 3的安装和使用方法 Llama 3的案例应用 Llama 3的简介 2024年4月18日，Meta 重磅推出了...

一文速览Llama 3及其微调：如何通过paper-review数据集微调Llama3 8B

标签： Llama 3 论文审稿GPT 微调Llama3 8B

4.19日凌晨正准备睡觉时，突然审稿项目组的文弱同学说：Meta发布Llama 3系列大语言模型了一查，还真是本文以大模型开发者的视角，帮你迅速梳理下LLama的关键特征，并对比上一个版本的LLama2，且本文后续，将更新用我...

”LLaMA“ 的搜索结果

LLaMA 入门指南

LLaMA的解读与其微调(含LLaMA 2)：Alpaca-LoRA/Vicuna/BELLE/中文LLaMA/姜子牙

【Llama2 windows部署详细教程】第三节 Llama2 跑起来

Meta最新模型LLaMA细节与代码详解

Meta开源的LLaMa到底好不好用？最全测评结果来了

大规模语言模型--LLaMA 家族

详解各种LLM系列｜（1）LLaMA 1 模型架构、预训练、部署优化特点总结

LLaMA 简介：一个具有 650 亿参数的基础大型语言模型官网介绍

【LLM】LLaMA简介：一个650亿参数的基础大型语言模型

LLaMA系列 | LLaMA和LLaMA-2精简总结

Llama3 AI应用开发实战

如何在Windows本地和云端安装LLaMA 2 (ChatGPT)

开发和启用llama2 api

中文LLaMA&Alpaca大模型

Docker下部署LLAMA 2

Llama2-7B/13B chat模型（下载地址）.txt

袖珍版“Llama2” Windows上也能用了！VisualStudio2022下编译通过

Llama2-Chinese.tar

为ChatGPT/ChatGLM/LLaMA/StableLM/MOSS等多种LLM提供了一个轻快好用的Web图形界面源码+教程

基于中文金融知识的LLaMA系微调模型的智能问答系统：LLaMA大模型训练微调推理等详细教学

本地部署开源大模型的完整教程LangChain + Streamlit+ Llama

META的LLaMA大模型部署指令调优教程内含模型下载方法.pdf

Firefly(流萤): 中文对话式大语言模型(全量微调+QLoRA)，支持微调Llma2、Llama、Qwen、B

支持模型(ChatGLM-6B, LLaMA, Bloom-7B, baichuan-7B), 支持(LoRA, QLoRA

中文LLaMA模型和指令精调的Alpaca大模型：中文数据进行二次预训练，进一步提升了中文基础语义理解能力

ChatGLM和LLaMA中文指令微调教程.zip

计算机行业深度研究：LLaMA等开源模型凸显先进算法及行业数据的重要性.pdf

LLaMA 2: Open Foundation and Fine-Tuned Chat Models 全文翻译

LLMs之Llama3：Llama 3的简介、安装和使用方法、案例应用之详细攻略

一文速览Llama 3及其微调：如何通过paper-review数据集微调Llama3 8B

推荐文章