a_Loki 个人主页

@a_Loki

a_Loki

2023-07-15 13:52:04 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

打造可扩展的大模型训练框架：支持PEFT微调、分布式训练与TensorBoard可视化

本文介绍了一个模块化的NLP模型训练框架，支持LoRA微调、多卡训练和TensorBoard可视化。主要内容包括：1) 分布式训练环境初始化；2) JSON数据集预处理为HuggingFace格式；3) 支持8bit量化的模型加载；4) 自定义Trainer实现训练可视化；5) 将所有模块整合为完整训练流程。该框架基于HuggingFace Transformers和PEFT库开发，具备生产环境适

#分布式 #语言模型 #python

25年1月更新。Windows 上搭建 Python 开发环境：PyCharm 安装全攻略（文中有安装包不用官网下载）

PyCharm 提供两种主要版本——社区版（免费）和专业版（付费）。对于初学者和个人开发者而言，社区版通常足够满足需求。你可以通过官方网站下载适用于 Windows 的 PyCharm 社区版。点击浏览选择你的安装目录然后点下一步，（还是不要有中文，然后选择空间大的盘，尽量不要在c盘）这里和python环境一样，直接给大家一个下载好的不用去官网下了。这里全部选上，可以帮你自动添加环境变量很方便，

#pycharm #ide #python

从训练到部署：基于 Qwen2.5 和 LoRA 的轻量化中文问答系统全流程实战

《基于LoRA技术的轻量级中文问答系统构建方案》介绍了一套完整的轻量级大语言模型解决方案。采用阿里云Qwen2.5系列模型结合LoRA微调技术，实现了从多GPU分布式训练到Web部署的全流程。方案包含三大核心模块：分布式训练脚本、LoRA模型合并工具，以及基于Gradio的Web交互界面。通过LoRA技术显著降低训练成本，合并后的模型简化了部署流程，Gradio界面支持流式响应和多轮对话。该方案具

从简单的 OpenAI API 调用到构建 AI Agent：一步步实现

本文展示了如何将基础的OpenAI API调用逐步改造为功能完善的AI助手。通过添加交互循环、上下文记忆、外部工具调用和模块化设计，最终实现了一个支持多任务处理、能持续对话的智能代理。原始代码仅能处理单次请求，改进后版本具备记忆功能、天气查询和数学计算能力，同时优化了API密钥管理和代码结构。这一演进过程清晰地呈现了构建实用AI助手的关键步骤，为开发更复杂的智能代理奠定了基础。

#人工智能 #microsoft

打造可扩展的大模型训练框架：支持PEFT微调、分布式训练与TensorBoard可视化

#分布式 #语言模型 #python

从训练到部署：基于 Qwen2.5 和 LoRA 的轻量化中文问答系统全流程实战

cuda11.6和对应的cudnn（windows）

大家自取，cudnn的官网注册还是有点麻烦的。

#python #人工智能 #深度学习 +1

deepseek从入门到精通pdf自取

直接给链接：https://pan.quark.cn/s/1d6a0f5ea540。

VideoFileClip 获取视频报错、

报错内容：OSError: MoviePy error: failed to read the duration of file /mnt/data/test/monitor/videos/new_video/1652063723941.mkv.Here are the file infos returned by ffmpeg:ffmpeg version 4.2.2-static https:

#音视频

了解 ReAct 框架：语言模型中推理与行动的协同

本文探讨了2022年提出的ReAct框架，该框架通过动态结合推理和行动来提升大型语言模型处理复杂任务的能力。ReAct框架的核心在于引导模型在推理（任务分解）和行动（工具调用）间循环迭代，从而增强模型的可解释性和通用性。文章详细介绍了ReAct的工作原理、与OpenAI tool_calls机制的配合方式，并提供了Python实现示例，展示如何构建支持多意图任务（如天气查询和数学计算）的智能代理。

#react.js #语言模型 #javascript

共 17 条

请选择