logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLaMA-Factory 快速入门:手把手教你微调大模型

LLaMA-Factory是一款开源大语言模型微调框架,支持LLaMA、ChatGLM等模型的快速适配。它提供全量微调、LoRA等多种方式,简化了模型定制过程。使用步骤包括:安装依赖、准备模型与数据(支持Alpaca等格式)、启动微调(可通过命令行或WebUI)、推理部署(支持Gradio交互)。关键功能包括:降低显存消耗(混合精度训练)、多GPU加速、数据增强。典型应用包括客服机器人、文案生成和

文章图片
LLaMA-Factory和python版本的兼容性问题解决

LLaMA-Factory的模型微调工具,在版本 LLaMA Factory, version 0.9.3.dev0,至少还是需要python3.10的,高版本的可能面临版本冲突导致无法正常安装。根据llamafactory-cli.exe version 验证命令和git版本管理的的追溯,可以看到本次安装的LLaMA-Factory的tag版本。从日志中看到,当前安装时候用的python版本是p

文章图片
#python#开发语言
LLaMA-Factory的5种推理方式总结

LLaMA-Factory提供5种大模型推理方式:1)交互式命令行对话,适合快速测试;2)Web可视化界面,支持图形化交互;3)vLLM批量推理,提升3-5倍吞吐量;4)API服务化部署,方便集成应用;5)量化推理优化,可降低显存占用70%。框架还支持多模态任务(如LLaVA),并可根据场景选择本地调试或生产级方案,其中vLLM引擎和量化技术显著提升效率。详细配置参考官方文档。

Windows系统上Python如何升级及版本管理

本文介绍了在Windows系统下将Python 3.11升级到3.12的详细步骤。首先建议确认当前版本并备份项目数据,然后提供三种升级方式:官方安装程序(推荐)、命令行pip升级(适合高级用户)和conda升级(适合虚拟环境)。文中还包含旧版本卸载指南、环境变量清理方法,以及多版本共存管理技巧。操作过程强调路径配置、依赖备份和环境验证,确保升级过程安全可控,最后建议在非生产环境充分测试后再正式迁移

文章图片
#python#开发语言
SpringAI编码实战:使用本地免费部署的大语言模型跑起来

通过本篇教程,你不仅学会了 Spring AI 的核心组件,还成功在本地搭建了 Ollama 和 Qwen 模型,并用它们运行了你的第一个 AI 应用。这为你探索人工智能的世界打下了坚实的基础。

文章图片
#java#spring
Cuda及python各个版本的研究

摘要: CUDA是NVIDIA开发的GPU并行计算架构,能显著加速深度学习训练与推理。PyTorch推荐使用CUDA 12.x或11.8搭配Python 3.9+,支持最新优化特性;TensorFlow建议CUDA 11.8+TF 2.15稳定组合。关键注意事项包括驱动版本匹配、cuDNN兼容性及Python版本要求(CUDA 12.x需Python≥3.9)。大模型场景优先选择CUDA 11.8

#python
Pandas使用教程:从入门到实战的数据分析利器

Pandas数据分析入门指南 Pandas是Python的核心数据分析库,提供Series和DataFrame两种核心数据结构。本文介绍了Pandas的基础功能,包括数据导入导出(CSV/Excel/JSON)、数据清洗(缺失值处理/去重)、数据选择与过滤(loc/iloc索引)、数据操作(列操作/分组聚合)以及高级应用(时间序列/文本处理)。还包含性能优化技巧和电商数据分析实战案例,展示如何通过

文章图片
#pandas#数据分析#数据挖掘
深刻理解深度学习的注意力机制Attention

特点说明全局建模可以一次性看全句所有词并行计算不像 RNN 要一个个处理,可以并行聚焦关键自动抓住关键内容易扩展可堆叠、可组合,非常灵活Attention 就是让模型学会“聚焦重点”的机制,就像你看书时自动划重点一样,它能帮助模型更聪明地理解输入数据的结构和语义。

文章图片
#深度学习#人工智能
深刻理解深度学习的注意力机制Attention

特点说明全局建模可以一次性看全句所有词并行计算不像 RNN 要一个个处理,可以并行聚焦关键自动抓住关键内容易扩展可堆叠、可组合,非常灵活Attention 就是让模型学会“聚焦重点”的机制,就像你看书时自动划重点一样,它能帮助模型更聪明地理解输入数据的结构和语义。

文章图片
#深度学习#人工智能
Jupyter Lab 使用从入门到精通:一站式数据科学与开发环境指南

本文全面介绍JupyterLab,一个基于Web的交互式开发环境。主要内容包括:1)基础安装配置方法;2)核心功能如数据处理、可视化、机器学习的应用;3)丰富的插件生态系统,涵盖代码增强、版本控制、AI辅助等;4)高级配置包括远程访问、扩展开发和性能优化;5)前沿功能如实时协作和GPU加速。JupyterLab凭借模块化设计、多语言支持和强大的扩展能力,成为数据科学和开发领域的重要工具,文章还提供

文章图片
#jupyter#ide#python
    共 21 条
  • 1
  • 2
  • 3
  • 请选择