logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

快速部署指南:在PyCharm中调试和运行lora-scripts项目代码

通过PyCharm与lora-scripts结合,实现本地可调试的LoRA模型训练。从环境搭建、YAML配置到断点调试和显存优化,覆盖全流程实战技巧。利用Conda隔离依赖,TensorBoard监控训练动态,精准定位数据加载与参数注入问题,让个人开发者也能高效掌控模型微调过程。

#LoRA
Smart Install Maker 5.03 2004纯净版安装包制作工具实战应用

Smart Install Maker 5.03 是一款面向 Windows 平台的轻量级安装包制作工具,专为中小型软件开发商及独立开发者设计。其核心优势在于通过图形化界面简化复杂安装逻辑的实现,显著降低打包门槛。广泛应用于桌面应用分发、企业内部工具部署及第三方组件集成等场景。默认情况下,生成的安装程序使用通用图标。但在正式发布中,必须替换为品牌专属.ico文件。操作路径如下:进入;点击“Brow

CRNN OCR模型更新日志:从v1.0到最新版的改进

架构升级:从静态分类到序列建模,真正理解“文本”的语义结构精度飞跃:中文识别准确率突破 89%,复杂场景表现稳定工程完善:集成了自动化预处理与双模服务接口,开箱即用该项目证明了在无 GPU 环境下,通过合理选型与工程优化,依然可以构建高性能 OCR 服务。无论是个人开发者还是企业用户,都能快速接入并落地应用。🎯 推荐使用场景- 发票/单据信息抽取- 手写笔记数字化- 街景文字识别(SLAM辅助)

Qwen3-VL-30B在滑雪场安全监控中的行为识别应用

本文介绍Qwen3-VL-30B视觉语言大模型在滑雪场安全监控中的应用,通过多模态理解、时序建模与自然语言生成,实现对摔倒、碰撞等危险行为的精准识别与语义化告警,提升安全管理效率。

Qwen3-14B 模型更新日志:新特性持续迭代中

Qwen3-14B以140亿参数实现性能与部署效率的平衡,支持32K上下文、原生Function Calling和多工具协同调用,适合私有化部署。它在长文本理解、任务规划和实际执行能力上表现突出,是构建企业级AI Agent的理想选择。

Python语音识别实战:DFCNN与Transformer模型实现

语音识别技术自20世纪50年代起步,经历了从基于模板匹配的早期方法,到隐马尔可夫模型(HMM)主导的统计方法,再到深度学习驱动的端到端模型的演变。近年来,随着神经网络架构(如CNN、RNN、Transformer)的发展,语音识别的准确率和鲁棒性显著提升。当前,语音识别已广泛应用于智能助手、客服机器人、语音搜索等领域,成为人机交互的重要接口。

Robot-Kol: 机械臂二维运动控制的人工神经网络开源项目

人工神经网络(ANN)是模拟人类大脑神经元连接和运作方式的信息处理系统。它们由大量互联的节点组成,也称为神经元,通过学习算法进行自我优化,从而能够识别复杂模式和执行数据处理任务。从早期的感知器模型到深度学习的突破,人工神经网络已经发展为多个层次,广泛应用于图像识别、语音识别、自然语言处理等领域。开源(Open Source)不仅仅是指代码的可访问性,它的核心在于一种协作和共享的文化哲学。开源项目允

Qt与OpenCV联合开发摄像头实时视频捕捉项目

在现代图像处理与计算机视觉应用中,Qt与OpenCV的联合开发已成为一种高效且广泛采用的技术组合。Qt作为一套成熟的C++图形界面开发框架,提供了丰富的UI组件和跨平台支持;而OpenCV则专注于图像处理与视频分析,拥有强大的算法库。二者结合,不仅能够实现复杂的图像处理逻辑,还能快速构建交互式图形界面,极大提升了开发效率和用户体验。本章将从基础概念入手,介绍Qt与OpenCV各自的特点,并深入探讨

Qwen3-VL-8B在智慧农业中的病虫害图像识别试验

本文介绍轻量级多模态大模型Qwen3-VL-8B在农业病虫害识别中的应用,展示其端到端图文推理、中文支持与边缘部署能力,结合提示工程实现专业农技诊断,并探讨其在田间落地的架构设计与扩展场景。

Gemini心理咨询智能问答情绪疏导落地实践

本文探讨Gemini大模型在心理咨询中的应用,涵盖情绪识别、对话生成、安全机制与人机协同模式,提出基于多模态技术的心理服务系统构建方案。

    共 69 条
  • 1
  • 2
  • 3
  • 7
  • 请选择