logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从物理⽅程到硬件算⼦:拆解⼯业仿真跨平台编译的⾏业空⽩与研发探索

本⽂结合公开⼚商产品参数与桌⾯调研数据,拆解。编译器侧:CANN、BladeDISC、清程极智⼋卦炉等编译⼯具,⾯向通⽤深度学习算⼦优化,不⽀。异构芯⽚可⽤算⼦,前端 CAE 研发、后端算⼦编译分属两套技术团队,数据孤岛推⾼全⾏业研发成。落地成本佐证:根据低空产业公开研报,eVTOL 机型迭代过程中,芯⽚更换带来的算⼦重构成本占。CAE 软件侧:索⾠等国产仿真软件聚焦多物理场求解引擎开发,产品输出

文章图片
从物理⽅程到硬件算⼦:拆解⼯业仿真跨平台编译的⾏业空⽩与研发探索

本⽂结合公开⼚商产品参数与桌⾯调研数据,拆解。编译器侧:CANN、BladeDISC、清程极智⼋卦炉等编译⼯具,⾯向通⽤深度学习算⼦优化,不⽀。异构芯⽚可⽤算⼦,前端 CAE 研发、后端算⼦编译分属两套技术团队,数据孤岛推⾼全⾏业研发成。落地成本佐证:根据低空产业公开研报,eVTOL 机型迭代过程中,芯⽚更换带来的算⼦重构成本占。CAE 软件侧:索⾠等国产仿真软件聚焦多物理场求解引擎开发,产品输出

文章图片
从物理⽅程到硬件算⼦:拆解⼯业仿真跨平台编译的⾏业空⽩与研发探索

本⽂结合公开⼚商产品参数与桌⾯调研数据,拆解。编译器侧:CANN、BladeDISC、清程极智⼋卦炉等编译⼯具,⾯向通⽤深度学习算⼦优化,不⽀。异构芯⽚可⽤算⼦,前端 CAE 研发、后端算⼦编译分属两套技术团队,数据孤岛推⾼全⾏业研发成。落地成本佐证:根据低空产业公开研报,eVTOL 机型迭代过程中,芯⽚更换带来的算⼦重构成本占。CAE 软件侧:索⾠等国产仿真软件聚焦多物理场求解引擎开发,产品输出

文章图片
CAE 与底层算⼦割裂已成⾏业共性痛点,浅谈⼀体化链路的研 发思路

解,多场数据需要⼈⼯对⻬格式、反复迭代参数,整机⽓动 + 热仿真周期动辄数周,⻛洞试验叠加⼈。纪、壁仞等国产异构芯⽚,必须由算⼦⼯程师根据仿真数据⼿动重写、调试定制算⼦。尺⼨⻜⾏器整机仿真未实测落地,精度优化数据为理论推演,需要后续项⽬资⾦落地后批量⼯业对。拓扑算⼦编译模块:可针对简单流体⽅程⾃动⽣成昇腾、英伟达双平台算⼦,复杂多场耦合⾮标算。欢迎⾏业仿真⼯程师、芯⽚底层研发同⾏交流技术,共同落地

文章图片
CAE 与底层算⼦割裂已成⾏业共性痛点,浅谈⼀体化链路的研 发思路

解,多场数据需要⼈⼯对⻬格式、反复迭代参数,整机⽓动 + 热仿真周期动辄数周,⻛洞试验叠加⼈。纪、壁仞等国产异构芯⽚,必须由算⼦⼯程师根据仿真数据⼿动重写、调试定制算⼦。尺⼨⻜⾏器整机仿真未实测落地,精度优化数据为理论推演,需要后续项⽬资⾦落地后批量⼯业对。拓扑算⼦编译模块:可针对简单流体⽅程⾃动⽣成昇腾、英伟达双平台算⼦,复杂多场耦合⾮标算。欢迎⾏业仿真⼯程师、芯⽚底层研发同⾏交流技术,共同落地

文章图片
开源工业 RAG 本地知识库工具,PDF 离线私有化文档问答,可定制部署

基于 Ollama+Qwen 开发Industrial-RAG-Toolkit 工业本地知识库,全项目 MIT 开源,面向机械、汽配、电机行业工程师落地离线文档检索问答。项目开源地址:https://gitee.com/mq79/industrial-rag-toolkit。1. 支持 PDF/TXT 单文档本地导入,私有化离线大模型问答,不上传数据云端。2. 工厂内网集群部署 + 多账号权限:3

vLLM 分层量化 + 片上 SRAM 缓存调度|国产存算芯片推理优化工程实测

vLLM 分层量化 + 片上 SRAM 缓存调度|国产存算芯片推理优化工程实测 本文基于 vLLM 开源推理引擎、Qwen2-7B 模型,针对国产昇腾存算芯片带宽、显存瓶颈做优化试验,完整记录分层混合量化、动态稀疏、片上 KV 驻留调度三项优化的落地过程与对标数据,仅做技术试验复盘。五、总结 整套优化方案依托开源框架二次迭代,无芯片流片投入,从软件调度层面充分盘活国产存算芯片片上存储资源,实测数据

#缓存
vLLM 分层量化 + 片上 SRAM 缓存调度|国产存算芯片推理优化工程实测

vLLM 分层量化 + 片上 SRAM 缓存调度|国产存算芯片推理优化工程实测 本文基于 vLLM 开源推理引擎、Qwen2-7B 模型,针对国产昇腾存算芯片带宽、显存瓶颈做优化试验,完整记录分层混合量化、动态稀疏、片上 KV 驻留调度三项优化的落地过程与对标数据,仅做技术试验复盘。五、总结 整套优化方案依托开源框架二次迭代,无芯片流片投入,从软件调度层面充分盘活国产存算芯片片上存储资源,实测数据

#缓存
vLLM 分层量化 + 片上 SRAM 缓存调度|国产存算芯片推理优化工程实测

vLLM 分层量化 + 片上 SRAM 缓存调度|国产存算芯片推理优化工程实测 本文基于 vLLM 开源推理引擎、Qwen2-7B 模型,针对国产昇腾存算芯片带宽、显存瓶颈做优化试验,完整记录分层混合量化、动态稀疏、片上 KV 驻留调度三项优化的落地过程与对标数据,仅做技术试验复盘。五、总结 整套优化方案依托开源框架二次迭代,无芯片流片投入,从软件调度层面充分盘活国产存算芯片片上存储资源,实测数据

#缓存
基于 AI-FNO 的 eVTOL 飞行器整车外流场气动仿真工程复盘与实测

分别采用气动流场涡叠加抵消技术、雷诺数连续插值自适应湍流模型、流-热-结构多场同步耦合迭代算法、风场预判+姿态预补偿飞控逻辑四大核心技术方向,对整机仿真体系、飞控控制逻辑、机身结构设计进行系统性优化升级。1. 多旋翼耦合气动干扰:旋翼下洗气流与桨尖涡相互叠加干涉,造成整机悬停抖动、有效升力损耗、飞行噪音超标,常规参数调节无法从根源解决涡系耦合问题。4. 低空乱流适应性弱:传统飞控采用被动修正机制,

#汽车
到底了