hugging llama face

Hugging Face CEO: 2024 将是AI丰收年

来自CEO的新年祝福 ❤️附加了他对于2024年人工智能界的四大预测你觉得2024年人工智能和机器学习界会是什么样的呢？欢迎留言 ......

丰收年 Hugging Face 2024 CEO更新时间 2024-01-12

Windows11下私有化部署大语言模型实战 langchain+llama2

一、本机环境 1.硬件环境： CPU：锐龙5600X 显卡：GTX3070 内存：32G 注：硬件配置仅为博主的配置，不是最低要求配置，也不是推荐配置。 2.软件环境： Windows系统版本：Win11专业版23H2 Python版本：3.11 Cuda版本：12.3.2 VS版本：VS2022 ......

实战 langchain 模型 Windows 语言更新时间 2024-01-07

非工程师指南: 训练 LLaMA 2 聊天机器人

引言本教程将向你展示在不编写一行代码的情况下，如何构建自己的开源 ChatGPT，这样人人都能构建自己的聊天模型。我们将以 LLaMA 2 基础模型为例，在开源指令数据集上针对聊天场景对其进行微调，并将微调后的模型部署到一个可分享的聊天应用中。全程只需点击鼠标，即可轻松通往荣耀之路！😀 为什么这 ......

机器人机器指南 LLaMA更新时间 2024-01-06

Huggy Lingo: 利用机器学习改进 Hugging Face Hub 上的语言元数据

太长不看版: Hub 上有不少数据集没有语言元数据，我们用机器学习来检测其语言，并使用 librarian-bots 自动向这些数据集提 PR 以添加其语言元数据。 Hugging Face Hub 已成为社区共享机器学习模型、数据集以及应用的存储库。随着 Hub 上的数据集越来越多，元数据，作为一 ......

机器 Hugging 语言数据 Huggy更新时间 2024-01-04

欢迎 Mixtral - 当前 Hugging Face 上最先进的 MoE 模型

最近，Mistral 发布了一个激动人心的大语言模型: Mixtral 8x7b，该模型把开放模型的性能带到了一个新高度，并在许多基准测试上表现优于 GPT-3.5。我们很高兴能够在 Hugging Face 生态系统中全面集成 Mixtral 以对其提供全方位的支持 🔥！ Hugging Fac ......

最先模型 Mixtral Hugging Face更新时间 2024-01-04

Hugging Face 年度回顾：2023，开源大模型之年

在 2023 年，大型语言模型（Large Language Models，简称 LLMs）受到了公众的广泛关注，许多人对这些模型的本质及其功能有了基本的了解。是否开源的议题同样引起了广泛的讨论。在 Hugging Face，我们对开源模型抱有极大热情。开源模型的优势在于，它们不仅促进了研究的可复制 ......

模型 Hugging 年度 Face 2023更新时间 2023-12-29

llama benchmarks

Introduction Here we re-evaluate llama2 benchmarks to prove its performence. datasets In this blog, we'll test the following datasets shown in the ima ......

benchmarks llama更新时间 2023-12-24

llama大模型部署

看模型加载的参数设置. import torch # 初始化Half Tensor h = torch.tensor([1.0,2.0,3.0], dtype=torch.half) # h = torch.tensor([1.0,2.0,3.0], dtype=torch.float16) # 跟 ......

模型 llama更新时间 2023-12-22

llama的hf源码结构

上一个博客我们看了rope. 那么llama的hidden_states就没啥难点了. 再整体把握一下hf里面llama的代码结构. 文件是:D:\Users\admin\miniconda3\Lib\site-packages\transformers\models\llama\modeling_ ......

源码结构 llama更新时间 2023-12-21

llama的rope源码阅读

关键代码的理解: class LlamaRMSNorm(nn.Module): def __init__(self, hidden_size, eps=1e-6): """ LlamaRMSNorm is equivalent to T5LayerNorm """ super().__init__( ......

源码 llama rope更新时间 2023-12-21

在灾难推文分析场景上比较用 LoRA 微调 Roberta、Llama 2 和 Mistral 的过程及表现

引言自然语言处理 (NLP) 领域的进展日新月异，你方唱罢我登场。因此，在实际场景中，针对特定的任务，我们经常需要对不同的语言模型进行比较，以寻找最适合的模型。本文主要比较 3 个模型: RoBERTa、Mistral-7B 及 Llama-2-7B。我们用它们来解决一个常见问题 —— 对灾难相关 ......

灾难场景过程 Roberta Mistral更新时间 2023-12-21

llama-factory fine-tuning 4 (mixtral fine-tuning)

introduction fine-tuning command click to view the code CUDA_VISIBLE_DEVICES=0 python src/train_bash.py \ --stage sft \ --do_train \ --model_name_or_p ......

fine-tuning tuning fine llama-factory factory更新时间 2023-12-19

大模型那么火，教你一键Modelarts玩转开源LlaMA(羊驼)大模型

本文分享自华为云社区《大模型那么火，教你一键Modelarts玩转开源LlaMA(羊驼)大模型》，作者：码上开花_Lancer 。近日， LlaMA(羊驼)这个大模型再次冲上热搜！ LLaMA（Large Language Model Meta AI），由 Meta AI 发布的一个开放且高效的大 ......

模型 Modelarts LlaMA更新时间 2023-12-15

llama-factory fine-tuning 3

1 Introduction In this blog, we will use 3 dataset to fine-tuning our model using llama-factory. 2 dataset preparation 2.1 MedQA dataset (address) in ......

llama-factory fine-tuning factory tuning llama更新时间 2023-12-14

使用 PyTorch FSDP 微调 Llama 2 70B

引言通过本文，你将了解如何使用 PyTorch FSDP 及相关最佳实践微调 Llama 2 70B。在此过程中，我们主要会用到 Hugging Face Transformers、Accelerate 和 TRL 库。我们还将展示如何在 SLURM 中使用 Accelerate。完全分片数据并 ......

PyTorch Llama FSDP 70B 70更新时间 2023-12-12

19.Some people say:Face-to-face classes are a better option for college students than online classes. Present possible counterarguments to the claim, rebut it and reaffirm the argument.

Round 1: Presenting Possible Counterarguments Speaker 1 (Student A): Hello, everyone! The claim that face-to-face classes are a better option than onl ......

classes counterarguments Face-to-face the argument更新时间 2023-12-10

使用双卡/8卡3090微调llama2-70B/13B模型

写在前面本篇博文将会教大家如何在消费级的设备（或者各种超级便宜的洋垃圾上）实现13B/70B等无法在单张消费级显卡上加载（但可以在一台机器上的多张卡上加载）的模型的微调。由于绝大部分做实验，仅要求实现推理，或者在微调时没有资源上到全量/13B+级别的真·大模型的微调，没有涉及到将一个模型放在多张 ......

模型 llama2 llama 3090 13更新时间 2023-12-10

使用8卡3090微调llama2-70B模型

写在前面很多问题尚未弄清，还在进一步调整目前已知我用8卡的3090 采用deepspeed ZeRO3进行运行，下面是deepspeed3的配置 1 { 2 "fp16": { 3 "enabled": "auto", 4 "loss_scale": 0, 5 "loss_scale_wind ......

模型 llama2 llama 3090 70更新时间 2023-12-08

8卡3090GPU云服务器上采用VLLM部署中文llama2-70b模型及OpenAI格式接口

TigerBot-70b-4k-v4 推理部署模型本地部署（基于HuggingFace) 根据实际测试，加载模型需要约129G显存，最低需要6张3090显卡（流水线并行）如果使用vllm进行加速推理（张量并行），考虑8张3090显卡或者4张A100-40G（模型分割要求）模型下载截至目前，模 ......

模型接口格式服务器 OpenAI更新时间 2023-12-07

深入解析LLaMA如何改进Transformer的底层结构

本篇文章将以LLaMA 模型为例，介绍大语言模型架构在Transformer 原始结构上的改进，并介绍Transformer 模型结构中空间和时间占比最大的注意力机制优化方法。 ......

底层 Transformer 结构 LLaMA更新时间 2023-12-07

llama源码阅读

收到这个启发: https://www.bilibili.com/video/BV1Cw411y7gs/?p=5&spm_id_from=pageDriver&vd_source=d68ed178f151e80fea1e02efd205802c 原来的模型也可以自己单机低成本调试. 这个是调试代码 ......

源码 llama更新时间 2023-12-05

从Hugging Face下载模型到本地并调用

不同的模型需要的显存不同，下载前先查一下自己GPU能支持什么模型 1. 用如下脚本可以下载HuggingFace上的各种模型，网址 https://huggingface.co/models download.py #coding=gbk import time from huggingface_ ......

模型 Hugging Face更新时间 2023-12-04

llama-factory fine-tuning-3 (conception and technologies explanation)

train method supervised fine-tuning Reward Modeling PPO training DPO training full-parameter partial-parameter LoRA QLoRA command parameter fp16 gradi ......

llama-factory technologies explanation fine-tuning conception更新时间 2023-11-29

llama-factory fine-tuning

data preparation for llama-factory fine-tuning, here is the instruction for custom dataset preparation. dataset classification alpaca stanford_alpaca ......

llama-factory fine-tuning factory tuning llama更新时间 2023-11-29

medical custom dataset for fine-tuning llama2

data preparation we use huggingface shibin6624/medical to fine-tuning llama2, please note that this dataset is consist of en and cn data, here we just ......

fine-tuning medical dataset custom llama2更新时间 2023-11-29

使用llama构建一个蜜罐(前端)

title: 使用llama构建一个蜜罐(前端) banner_img: https://cdn.studyinglover.com/pic/2023/07/e9a49d4a404ed9bc4b0f119249194e3d.png date: 2023-8-1 00:12:00 tags: - 网络 ......

蜜罐前端 llama更新时间 2023-11-26

使用llama构建一个蜜罐(后端)

title: 使用llama构建一个蜜罐(后端) banner_img: https://cdn.studyinglover.com/pic/2023/07/869e354fa5d2254251c10bc2e3cf1bef.png date: 2023-7-29 17:52:00 tags: - 网 ......

蜜罐 llama更新时间 2023-11-26

cloudlflare推理llama2

title: cloudlflare推理llama2 banner_img: https://cdn.studyinglover.com/pic/2023/10/0863cb015e8d69fbce68ebe57bea96d8.jpg date: 2023-10-11 15:32:00 catego ......

cloudlflare llama2 llama更新时间 2023-11-26

GPU部署llama-cpp-python(llama.cpp通用)

title: GPU部署llama-cpp-python(llama.cpp通用) banner_img: https://cdn.studyinglover.com/pic/2023/08/a5e39db5abf0853e6c456728df8bd971.jpg date: 2023-8-6 23 ......

llama llama-cpp-python cpp python GPU更新时间 2023-11-26

快速上手llama2.c

title: 快速上手llama2.c banner_img: https://github.com/karpathy/llama2.c/blob/master/assets/llama_cute.jpg date: 2023-7-25 16:19:00 tags: - 踩坑快速上手llama2. ......

llama2 llama更新时间 2023-11-26

共250篇 :1/9页 首页上一页1234下一页尾页