logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

昇腾平台多模态微调与推理实战,从理论到落地的完整探索

它不仅预置了30+主流多模态模型(包括视图生成的Wan、HunyuanVideo,视图理解的InternVL、QwenVL等),还提供了完整的数据工程、模态编码与对齐、评价体系。多模态大模型正在改变AI的应用边界,从文生图到文生视频,从图像理解到全模态交互,这些能力的背后离不开强大的算力支持和高效的推理框架。多模态模型的性能瓶颈往往不在单个算子,而在系统层面的通信、显存、调度协同。对于想在昇腾平台

文章图片
#服务器
昇腾平台多模态微调与推理实战,从理论到落地的完整探索

它不仅预置了30+主流多模态模型(包括视图生成的Wan、HunyuanVideo,视图理解的InternVL、QwenVL等),还提供了完整的数据工程、模态编码与对齐、评价体系。多模态大模型正在改变AI的应用边界,从文生图到文生视频,从图像理解到全模态交互,这些能力的背后离不开强大的算力支持和高效的推理框架。多模态模型的性能瓶颈往往不在单个算子,而在系统层面的通信、显存、调度协同。对于想在昇腾平台

文章图片
#服务器
昇腾平台多模态微调与推理实战,从理论到落地的完整探索

它不仅预置了30+主流多模态模型(包括视图生成的Wan、HunyuanVideo,视图理解的InternVL、QwenVL等),还提供了完整的数据工程、模态编码与对齐、评价体系。多模态大模型正在改变AI的应用边界,从文生图到文生视频,从图像理解到全模态交互,这些能力的背后离不开强大的算力支持和高效的推理框架。多模态模型的性能瓶颈往往不在单个算子,而在系统层面的通信、显存、调度协同。对于想在昇腾平台

文章图片
#服务器
vLLM-ascend 下的 PD 分离实战:从DeepSeek-V3-w8a8模型到压测,一次把坑踩完

调小 --max-model-len / --max-num-batched-tokens / --max-num-seqs。,因此 max-model-len / max-num-batched-tokens 可按场景调小。

文章图片
#前端#服务器
国内可用的 Gemini 3.0 体验方法:最新免费教程入口,让你轻松上手王炸 AI

以及 Sora 2,GPT-5,Claude 4.5,Nano Banana,Grok 等几十款全球热门 AI 大模型。根据 Model Card 披露的数据,Gemini 3.0 在推理、多模态等基准上实现了全方位的霸榜。此外,Gemini 3.0 Pro 的视觉理解能力更强,甚至能准确提取潦草的中文手写稿件内容。可以看到,Gemini 3.0 Pro 正确理解了用户要求,动画流畅、代码几乎无

文章图片
#人工智能#前端
音符跃然眼前-Rokid AR眼镜赋能的沉浸式音乐灵感捕捉系统

本文详细介绍了如何基于Rokid CXR-M SDK开发一款面向音乐创作者的沉浸式灵感捕捉系统。该系统充分利用AR眼镜的实时音频捕获、AI场景定制和自定义界面能力,解决了传统音乐创作中灵感易逝、记录繁琐、创作中断等核心痛点。文章从系统架构设计入手,深入剖析了音频处理、AI辅助创作、AR界面交互等关键技术的实现细节,并提供了完整的代码示例和性能优化方案。通过本系统,音乐人可以在任何场景下即时捕获创作

文章图片
#ar#restful#后端
openGauss020-openGauss 向量数据库深度解析:从存储到AI的全栈优化

openGauss 通过 行列混合存储、DataVec 向量化引擎、MOT 内存表、DB4AI 库内AI 等核心技术,构建了一个既能处理传统关系型数据,又能高效处理向量数据的 统一数据平台。在企业数字化转型、AI 落地的背景下,openGauss 为企业提供了 高性能、高安全、易运维 的向量数据解决方案。六大核心价值重塑数据处理范式极致的性能体验openGauss通过向量化执行引擎彻底改变了传统的

文章图片
#数据库#人工智能
三周 800 Star,100% AI 写出的开源项目震撼了整个社区:程序员真的危了?

https://github.com/fullstackagent/fulling 项目本身功能是一个集成了 next.js shadcn/ui 底层默认 pgsql 数据库 和 claude code 的一个编程工具,运行在 kubernetes 上,简单来说就是点个按钮直接开始梭哈 claude code, 其他事情 agent 都帮你干了。感觉是个比 supabase 更简单更灵活的方案,因

文章图片
#人工智能
三周 800 Star,100% AI 写出的开源项目震撼了整个社区:程序员真的危了?

https://github.com/fullstackagent/fulling 项目本身功能是一个集成了 next.js shadcn/ui 底层默认 pgsql 数据库 和 claude code 的一个编程工具,运行在 kubernetes 上,简单来说就是点个按钮直接开始梭哈 claude code, 其他事情 agent 都帮你干了。感觉是个比 supabase 更简单更灵活的方案,因

文章图片
#人工智能
    共 12 条
  • 1
  • 2
  • 请选择