
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文介绍了使用LLaMA-Factory微调多模态大模型Qwen3-VL的全流程。首先配置NVIDIA显卡驱动,确保显存满足要求(12G以上)。然后通过LLaMA-Factory进行模型微调,包括数据准备、参数设置和训练启动。微调完成后,将LoRA适配器与基础模型合并导出完整模型。最后使用vLLM部署服务,并提供了API调用示例进行多模态对话测试。整个过程涵盖了从环境配置到模型部署的完整链路,适用

本文介绍了基于Qwen3-VL多模态大模型构建的打架斗殴异常行为实时分析系统。系统通过微调Qwen3-VL模型,实现对视频中打架斗殴行为的精准识别与描述。项目包含200个训练视频和100个测试视频,采用ShareGPT格式标注数据。技术方案包括模型微调、LoRA参数合并及vLLM部署,最终通过Gradio开发了支持文本、图片和视频交互的Web服务。系统可应用于智慧安防等场景,实现异常行为的实时监测

本文介绍了基于Qwen3-VL多模态大模型构建的打架斗殴异常行为实时分析系统。系统通过微调Qwen3-VL模型,实现对视频中打架斗殴行为的精准识别与描述。项目包含200个训练视频和100个测试视频,采用ShareGPT格式标注数据。技术方案包括模型微调、LoRA参数合并及vLLM部署,最终通过Gradio开发了支持文本、图片和视频交互的Web服务。系统可应用于智慧安防等场景,实现异常行为的实时监测

本文介绍了使用LLaMA-Factory微调多模态大模型Qwen3-VL的全流程。首先配置NVIDIA显卡驱动,确保显存满足要求(12G以上)。然后通过LLaMA-Factory进行模型微调,包括数据准备、参数设置和训练启动。微调完成后,将LoRA适配器与基础模型合并导出完整模型。最后使用vLLM部署服务,并提供了API调用示例进行多模态对话测试。整个过程涵盖了从环境配置到模型部署的完整链路,适用

摘要 本文介绍了如何使用MCP协议构建网页浏览智能体,实现自动化的网页内容抓取与总结。通过MCP协议连接AI模型与外部工具,项目采用Playwright浏览器控制层,解决了AI应用中的知识时效性和操作自动化问题。文章详细展示了环境搭建、服务器配置、核心代码实现以及性能优化策略,包括内存管理和请求优化。该智能体可应用于竞品监控、学术研究等多种场景,并针对反爬虫机制、动态内容加载等挑战提供了解决方案。

精品收藏:GitHub人工智能AI开源项目绝对精品!!!花了点时间,鄙人把这几年收藏的开源精品项目,整理一下,方面以后查找。其中涵盖了姿态检测,图像分割,图像分类,美学评价、人脸识别、多尺度训练,移动端的AI计算引擎,卫星图像,NLP,Python包,文字检测,NCRF,DALI等开源项目。更多开源项目,持续更细中……目录目录精品收藏:GitHub人工智能AI开源项目常...
人工智能项目集合推荐(数据集 模型训练 C++和Android部署)

OpenCV中BLOB特征提取与几何形状分类一:方法二值图像几何形状提取与分离,是机器视觉中重点之一,在CT图像分析与机器人视觉感知等领域应用广泛,OpenCV中提供了一个对二值图像几何特征描述与分析最有效的工具 - SimpleBlobDetector类,使用它可以实现对二值图像几何形状的分离与分析。而它之所以强大是因为整合OpenCV中其它一些API的功能,主要是有三个:自动的图像灰度与二值化
OpenCV+yolov2-tiny实现目标检测(C++) 目标检测算法主要分为两类:一类是基于Region Proposal(候选区域)的算法,如R-CNN系算法(R-CNN,Fast R-CNN, Faster R-CNN),它们是two-stage(两步法)的,需要先使用Selective search或者CNN网络(RPN)产生Region Proposal,然后再在Region..
深度学习目标检测:YOLOv5实现红绿灯检测(含红绿灯数据集+训练代码); 红绿灯数据集,交通信号灯数据集;红绿灯检测;交通信号灯检测








