
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
🌈你好呀!我是🌌 在所有感兴趣的领域扩展知识,不定期掉落福利资讯(*^▽^*)
openFuyao 的长远目标是将其在异构算力抽象、拓扑感知调度上的创新实践,上升为一套被国际认可的。

随着多模态大模型(LMM)成为主流,其在文档理解、图表分析、细粒度视觉问答(VQA)精度墙(Accuracy Wall):通用推理引擎对视觉特征与文本特征的融合处理未达最优,导致复杂图像的理解与推理准确率受限。多样性墙(Diversity Wall):在生成长篇、创造性或需要大量事实回溯的内容时,传统的 TOPK(例如1024)采样限制了模型从更广概率分布中选取最佳 Token 的能力,影响文本的

随着多模态大模型(LMM)成为主流,其在文档理解、图表分析、细粒度视觉问答(VQA)精度墙(Accuracy Wall):通用推理引擎对视觉特征与文本特征的融合处理未达最优,导致复杂图像的理解与推理准确率受限。多样性墙(Diversity Wall):在生成长篇、创造性或需要大量事实回溯的内容时,传统的 TOPK(例如1024)采样限制了模型从更广概率分布中选取最佳 Token 的能力,影响文本的

随着多模态大模型(LMM)成为主流,其在文档理解、图表分析、细粒度视觉问答(VQA)精度墙(Accuracy Wall):通用推理引擎对视觉特征与文本特征的融合处理未达最优,导致复杂图像的理解与推理准确率受限。多样性墙(Diversity Wall):在生成长篇、创造性或需要大量事实回溯的内容时,传统的 TOPK(例如1024)采样限制了模型从更广概率分布中选取最佳 Token 的能力,影响文本的

在昇腾 910B 上部署 Qwen3-235B 是一次对硬件极限的挑战。在显存空间仅剩不足 10% 的极限环境下,通过GMM专家融合HCCL AIV 通信加速以及SwiGLU 算子下沉,我们成功搭建起了一个高效、稳定的推理环境,验证了昇腾架构对超大规模 MoE 模型的支持能力。希望这篇博文能帮助更多在昇腾平台上探索大模型前沿的开发者!

在昇腾 910B 上部署 Qwen3-235B 是一次对硬件极限的挑战。在显存空间仅剩不足 10% 的极限环境下,通过GMM专家融合HCCL AIV 通信加速以及SwiGLU 算子下沉,我们成功搭建起了一个高效、稳定的推理环境,验证了昇腾架构对超大规模 MoE 模型的支持能力。希望这篇博文能帮助更多在昇腾平台上探索大模型前沿的开发者!

在 2025 年的今天,“数字员工”(Digital Employee)已不再是一个遥不可及的概念。依托于火山引擎 Coze 等低代码平台,企业能够迅速构建出具备推理能力的 Agent。然而,在实际深入业务流——特别是制造业、进出口贸易等实体产业时,我们面临着一个典型的“数据木桶效应”大模型(LLM)的推理能力(Brain)日益强大,但文档解析能力(Eyes)却往往滞后。企业的核心知识大量封存在

7月WAIC展会上,我看到了“AI全景图”:底层硬件、上层应用、终端设备、具身智能机器人…… 其中,大模型与具体行业应用深度融合的创新成果大量涌现,展现出百花齐放的产业活力。几年前还很难想象,一张完整、高清、逼真的护照照片,仅仅需要喂Prompt给Midjourney,再用PS简单拼接一下就能搞定;一个视频会议中的“我”,其实是deepfake模型在后台实时换脸,还能根据语音同步表情。

DevUI MateChat 在教育领域的实践,证明了其作为 AI 交互基座的强大适应性。它通过组件化解决了内容呈现的复杂性(公式、代码),使开发者得以专注于“知识点关联推荐”和“错误类型识别”等核心教学算法。MateChat 的标准化方案,为构建高效率、个性化且具备数据反馈机制的在线智能助教系统提供了坚实的工程基础,为开发者提供了可参考的落地实操案例。hello,我是是Yu欸。原文链接 👉,⚡








