
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文分享了基于华为昇腾NPU的vLLM-Ascend全链路调优指南。作者提出三阶段调优方法论:基准测试建立性能基线、参数调优寻找最优配置、故障排查确保稳定性。重点介绍了针对昇腾硬件的特化优化策略,包括BlockSize对齐、BatchSize与显存权衡、显存利用率微调等参数优化方法,以及开启TaskQueue等昇腾原生特性。文章还提供了详细的故障排查技巧和通用配置清单,强调通过科学测试和参数调整最

华为推出的Catlass是昇腾NPU的高性能算子模板库,采用"配置即代码"理念替代传统手写指令的开发模式。该库通过五层抽象模型(Device、Kernel、Block、Tile、Basic)实现硬件透明化,开发者只需配置GemmShape和DispatchPolicy即可生成优化算子。核心特性包括形状驱动的数据切分、双缓冲调度策略,支持自定义数据搬运和访存优化,显著提升缓存利用

本文详细介绍了在Windows系统上部署OpenManus的步骤,包括Python和Conda环境的安装、OpenManus的本地部署、Ollama的安装与配置、以及如何通过内网穿透工具cpolar实现远程访问。通过这些步骤,用户可以构建一个本地化的AI助手,实现智能化的任务处理和决策支持。OpenManus的部署不仅展示了AI技术的便捷性和高效性,也为未来的功能扩展和应用创新提供了广阔的空间。

最近,千问团队给AI圈投下了一枚重磅炸弹——推出全新推理模型**QwQ32B**!这个仅有320亿参数的小巨人,居然能够与那些动辄数千亿参数的大佬们一较高下。据官方表示,在多个基准测试中,它和deepseek-R1这样的顶级选手打得难解难分,简直让人目瞪口呆!为了验证这一奇迹般的性能,我决定在自己的Windows电脑上亲自体验一番,看看这位小巨人到底有没有那么神。下面,就让我们一起揭开它的神秘面纱

最近,国产AI圈里的新星——Deepseek,简直是火到不行。但是,你是不是已经对那些千篇一律的手机APP和网页版体验感到腻味了?别急,今天就带你解锁一个超炫的操作:在你的Windows电脑上本地部署Deepseek!这不仅让你享受飞一般的互动速度,还能让你瞬间成为AI圈的技术大牛!跟着我一起来吧,保证简单到你怀疑人生。

你仅需提供简单的几个提示词,即可快速高效帮你生成更为丰富的提示词并生成满意的图片或者视频。无论是为了创作艺术作品、设计商业宣传素材,还是满足个人兴趣爱好等,都能快速将脑海中的想法转化为逼真的图片或生动的视频。

嘿,小伙伴们!今天我要揭开一个超炫的秘密——如何把家里的fnOS飞牛云NAS变成一个强大的AI工作站。想象一下,当所有人都在排队等待官方服务器响应时,你却能在自己的小黑盒子里随心所欲地使用DeepSeek-R1大模型,是不是觉得特别有范儿?对于那些技术控来说,这简直就是解决排队问题的最佳方案!不论是轻量级还是满血版,都可以根据你的硬件条件自由选择。而且NAS24小时在线的特点,让它成为长期项目的完

本文介绍一套基于全志V3S主控与CS创世SD NAND芯片(CSNP1GCR01-AOW)的智能路灯网关存储方案。该方案不仅提供了灵活的存储接口支持与优异的环境适应性,更集成了先进的NAND Flash管理算法,具备数据容灾、断点续传与高强度持续写入等能力,为户外智能照明提供了一种高性价比、工业级的嵌入式数据存储解决路径。

openEuler作为数字世界的"通用底盘",通过统一架构支持从云端到终端的全场景数字化需求。文章展示了其在三个关键场景的应用:云端高性能数据库(openGauss)、边缘AI推理(ONNX Runtime)和终端IoT开发(openEuler Embedded)。通过OBS统一构建平台,openEuler实现了跨x86、ARM和RISC-V架构的软件生态一致性,提供从芯片适配

本文探讨基于OpenWRT系统构建嵌入式Web服务的实现方法,并融合NAT穿透技术达成跨公网的远程访问方案。该架构设计特别针对物联网设备本地服务向互联网的开放需求,具有显著的工程应用价值。








