Gq.转个人主页

@m0_69966537

Gq.转

2024-05-09 19:13:32 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

对examples/train_lora/llama3_lora_eval.yaml模型评估配置文件的理解。

该配置文件的作用是：使用已经 LoRA 微调好的LLaMA3-8B-Instruct 模型（包括 adapter），加载MMLU 测试集进行 5-shot 评估，结果保存到，每次评估处理 4 条样本。如果后续要评估其他任务（比如或cmmlu_test），只需要更改task字段即LoRA（Low-Rank Adaptation）是一种参数高效微调方法：它不改动原始大模型的参数。而是插入少量可训练的“

#人工智能 #深度学习 #机器学习

大模型工作流程详解

大模型处理文本的核心流程分为三个阶段：1）输入处理，将文本分词、嵌入为向量并添加位置编码；2）模型计算，通过多层Transformer结构进行上下文理解和推理；3）输出生成，将概率分布转换为文本并循环生成完整内容。整个过程实现了"文本→数字→计算→数字→文本"的转换，结合符号处理和神经网络计算，使模型能够理解和生成人类语言。

#uv #网络

Docke启动Ktransformers部署Qwen3MOE模型实战与性能测试

本文介绍了使用Docker部署Qwen3MOE大模型并测试性能的过程。由于CPU不支持AVX512指令集，改用AVX2版本的ktransformers镜像。通过Docker容器运行模型，详细说明了启动命令和参数配置，包括模型路径、优化配置等。重点测试了模型响应性能，结果显示预填充阶段速度为58.34 tokens/s，解码阶段为19.09 tokens/s，揭示了模型在不同处理阶段的性能特征，为优

#docker #容器 #运维

通过vllm部署qwen3大模型以及基于 vLLM 的 OpenAI 兼容 API 接口调用方法总结

第一句是关于春节，中国家庭做饺子，长辈讲关于年兽的故事。这里要注意“make dumplings”翻译成“包饺子”比较合适，而“Nian”是年兽，应该音译为“年兽”或者“年兽”，但通常用“年兽”更常见。model="/home/xugq/qwen3-1.7b/",# 使用模型路径，如通过--served-model-name指定名称需与 vLLM 服务启动时指定的名称一致。：指定使用的推理解析器，

#人工智能 #算法 #linux

通过vllm部署qwen3大模型以及基于 vLLM 的 OpenAI 兼容 API 接口调用方法总结

该报错说明KV缓存所需的内存超过了可用的显存，KV缓存的计算涉及模型层数、序列长度和批次大小等因素，模型默认设置的max_seq_len是40960，这大大超过了服务器的负载上限，应该降低通过调整–max_model_len参数以减少KV缓存需求。接口必须确认实际加载的模型名称，避免因名称不匹配导致404错误。适用场景：非对话式文本生成（如问答、续写）适用场景：多轮对话（如聊天机器人）

#网络 #linux #运维 +1

多机多卡微调流程

摘要：多机多卡分布式训练是高效微调大模型的关键技术。核心流程包括：1）硬件配置多台配备多GPU的服务器，通过高速网络连接；2）软件环境需保持各节点驱动、CUDA、Python等版本一致；3）采用数据并行(DDP)或模型并行(FSDP)策略修改代码，处理梯度同步和参数分片；4）使用torchrun启动分布式任务；5)监控GPU利用率和通信状态。关键点包括环境一致性、网络配置、数据分配和并行策略选择

#python

昇腾# Ascend CANN 8.2.RC1 安装排障小结

Ascend CANN 8.2.RC1安装排障总结在aarch64服务器安装CANN 8.2.RC1时，关键报错Check owner failed是由于安装子进程校验目录owner与用户UID/GID不一致导致。解决方案：安装顺序：严格按Driver→Toolkit→NNAL顺序安装统一owner：安装后执行chown -R root:root /usr/local/Ascend 环境变量

#r语言 #开发语言

docker部署并测试翻译模型-CSANMT连续语义增强机器翻译

机器翻译模型部署详细步骤及api调用测试。

#docker #机器翻译 #容器

通过vllm部署qwen3大模型以及基于 vLLM 的 OpenAI 兼容 API 接口调用方法总结

#网络 #linux #运维 +1

昇腾# Ascend CANN 8.2.RC1 安装排障小结

#r语言 #开发语言

共 16 条

请选择