logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Qwen-Image生成写实人物肖像,真实感达到新高度

Qwen-Image基于MMDiT架构,实现高保真写实人物肖像生成,支持1024×1024分辨率输出与像素级编辑,具备中英文混合理解与文化语境适配能力,适用于广告、电商、影视等专业场景,推动AIGC向工业化落地迈进。

Wan2.2-T2V-5B生成视频的安全过滤机制介绍

本文介绍Wan2.2-T2V-5B文本到视频模型的全流程安全过滤体系,涵盖输入层关键词扫描与语义识别、潜空间生成控制及输出帧级审核修复,实现高效合规的内容生成。系统在保持低延迟的同时,显著提升安全性与合规率,适用于多场景AIGC应用。

Claude 3影视剪辑本地部署

本文探讨Claude 3在影视剪辑中的本地化部署,涵盖技术准备、硬件选型、推理优化及与主流剪辑软件的集成应用,展示其在剧情分析、镜头建议和自动化流程中的实际效能。

Qwen3-14B与推理加速框架vLLM兼容性测试

本文探讨了通义千问Qwen3-14B与高效推理引擎vLLM的深度结合,通过PagedAttention和连续批处理技术显著提升吞吐量与响应速度,实测显示吞吐提升近18倍,支持32K长上下文和Function Calling,为企业级AI应用提供高性价比解决方案。

ASR595X本地语音识别支持小智音箱指令解析

ASR595X芯片支持本地语音识别,集成DSP与NPU,实现低延迟、高隐私的离线唤醒和指令识别,适用于智能家居场景。

DeepSeek智能制造质检本地部署

DeepSeek智能制造质检本地部署方案,结合深度学习与边缘计算,支持缺陷识别、尺寸测量等功能,强调数据安全与实时性,适用于汽车、电子等行业。

#DeepSeek#智能制造
基于OpenCV的纹理相机标定与圆心检测算法实战

折腾这么久,你会发现:相机标定本质上是一个系统工程问题。它不单纯依赖某个神奇算法,而是靠各个环节的精心打磨和协同配合。从图像采集那一刻起,每一个决策都在影响最终结果。你是随便拍几张图交差,还是认真控制光照、角度、清晰度?你是盲目相信 OpenCV 默认参数,还是深入理解每个变量的意义并针对性调优?答案决定了你的系统是“能用”,还是“好用”。下次当你面对一张扭曲的图像时,别急着抱怨镜头不行。想想看—

PyTorch模型导出ONNX格式以适配Qwen3-VL-30B边缘部署

本文介绍如何将Qwen3-VL-30B等大型多模态模型从PyTorch导出为ONNX格式,解决动态图追踪、算子兼容性等问题,并利用ONNX Runtime实现边缘设备的高效推理,支持TensorRT、OpenVINO等后端加速,推动大模型在车载、医疗和工业场景落地。

BadAppleScr-2.4.2动态视频屏保定制工具实战应用

BadAppleScr-2.4.2通过深度整合视频解码、系统级图形渲染与用户行为监听,构建了一个轻量高效的屏保运行时环境。其核心模块包括基于FFmpeg的多格式解码引擎、支持Alpha混合的GDI+/Direct2D双渲染路径、以及低开销的消息钩子系统,确保在60FPS全屏播放下CPU占用率低于8%(Intel i5-10210U实测)。软件采用I帧密集型H.264编码策略,规避B/P帧依赖,显著

谷歌Gemini智能家居案例分享

谷歌Gemini通过多模态感知、本地化大模型和设备协同中间件,实现智能家居的主动服务与情境智能,涵盖安全、舒适与家庭协作场景,并强调隐私保护与开发者集成。

    共 59 条
  • 1
  • 2
  • 3
  • 6
  • 请选择