
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
继上一篇Llama-2-7B测试后,本文升级到Llama-3.1-8B进行性能对比。实测数据:吞吐量从16.6提升到17.32 tokens/s(+4.3%),显存从13.61GB增至16.06GB(+18%)。同时尝试了更专业的huggingface-cli下载方式(vs Python代码),支持断点续传更稳定。详细记录5个踩坑过程:gated模型访问、线程资源限制、NPU算子兼容性等。继续使用

继上一篇Llama-2-7B测试后,本文升级到Llama-3.1-8B进行性能对比。实测数据:吞吐量从16.6提升到17.32 tokens/s(+4.3%),显存从13.61GB增至16.06GB(+18%)。同时尝试了更专业的huggingface-cli下载方式(vs Python代码),支持断点续传更稳定。详细记录5个踩坑过程:gated模型访问、线程资源限制、NPU算子兼容性等。继续使用

Rust实战:200行代码写一个命令行TODO工具

Seedream 4.0震撼测评:AI图像创作进入4K时代 字节跳动推出的Seedream 4.0在AI图像生成领域实现重大突破,登顶权威榜单双赛道。其核心优势包括: 4K超清画质,细节表现力极强; 多模态输入,支持图文混合创作; 主体一致性,解决角色变形问题; 秒级生成,推理速度提升10倍; 一站式编辑,从生成到优化无缝衔接。用户已用它创作绘本、手办、商业大片等,成本低至0.2元/张。体验地址:

做有声书的朋友是不是总遇到:用EasyVoice生成了自然的AI语音,想让团队成员一起试听调整,却只能导出音频文件发群里?本地部署虽然能保护文本版权,但“文件传输”让协作变成“版本灾难”📄。别慌,内网穿透来帮忙,让你的EasyVoice变成“云端配音棚”,团队实时试听修改,有声内容创作从此“安全又高效”!EasyVoice的核心功能就像“私人配音演员”,支持20+种音色(新闻播报/情感朗读/动漫

用 TRAE AI 助手2小时开发了一个 MySQL MCP 工具,让非技术人员也能用自然语言查数据库、导出 Excel。工具支持智能查询、安全防护(只读模式)、零门槛使用。文章详细记录了从需求到测试的完整开发流程,以及对 AI 辅助开发的深度思考,适合所有对 AI+MCP 感兴趣的读者。

本文记录了在昇腾NPU上部署Llama-2-7B大模型的完整过程。作者选择昇腾910B芯片进行测试,主要基于其自主可控、生态完善和免费试用资源等优势。通过GitCode平台申请云上NPU资源,配置了包含PyTorch 2.1和CANN 8.0的开发环境。在部署过程中,作者分享了多个实用技巧,如必须显式导入torch_npu才能使用NPU功能、模型迁移的正确写法等。最终成功加载7B模型(FP16精度

本文介绍了基于Rokid CXR-M SDK开发AR眼镜实时翻译应用的过程。针对YouTube英文技术视频字幕翻译不准确且影响观看体验的问题,作者利用Rokid AR眼镜的显示框架,结合腾讯云语音识别和翻译API,实现了语音到文字的实时转换与显示。

无需高速,Gemini3.0在国内分分钟使用,速来!

本文探讨AI时代下编程学习方式的变革。Python因其表达清晰成为AI协作的最佳工具,编程核心已从"会写代码"转向"会用AI解决问题"。推荐书籍《AIGC高效编程》采用"知识导入+AI辅助优化"的创新学习结构,包含20个实用项目,覆盖数据分析、自动化办公等应用场景。








