logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CANN中MmDeqSwigluQuantMmDeq算子模型的深层解析

是为大语言模型(LLM)高效推理定制的量化感知复合算子,由 “矩阵乘(Mm)- 反量化(Deq)-Swiglu 激活 - 量化(Quant)- 矩阵乘(Mm)- 反量化(Deq)” 等操作串联组成,核心是在保证推理精度的前提下,通过低精度计算(int8)和硬件加速大幅降低内存与计算开销,适配资源受限场景的 LLM 部署。

文章图片
#CANN#华为
【HarmonyOS系列课程体验测评1】HarmonyOS介绍

摘要: 鸿蒙OS课程颠覆了传统操作系统认知,带来全新开发体验。课程揭示了鸿蒙“设备互联”的核心思想,打破单设备思维;元服务“免安装、随用随走”的特性重构了应用开发模式;“一次开发,多端部署”显著提升效率,而DevEco Studio等工具则实现了工业化开发流程。学习过程中,既感受到技术迭代的焦虑,也激发了抓住全场景开发红利的热情。鸿蒙正推动开发者与系统共同定义未来交互方式。(149字)

文章图片
#harmonyos#华为
用CANN DataFlow优化工业视频检测:从代码到效果的细节拆解

每个节点用@process_point装饰,指定运行设备(CPU/AI Core),输入输出通过队列自动流转。预处理节点(CPU):负责图像格式转换、归一化,输出直接进队列。import cv2# 定义队列:pre2infer存预处理结果,infer2post存推理结果# 1. BGR转RGB(工业摄像头默认BGR)# 2. Resize到640×640# 3. 归一化(转float32,减均值除

文章图片
#人工智能#CANN#昇腾
openEuler云原生AI性能测试:Qwen3模型KServe部署实战

在当今人工智能(AI)与云原生技术交汇的浪潮中,构建高性能、高可用的 AI 服务已成为企业数字化转型的关键。openEuler 作为面向数字基础设施的开源操作系统,凭借其在高并发、低延迟场景下的深度优化,正成为承载 AI 工作负载的理想选择。与此同时,Kubernetes 云原生生态为 AI 模型的部署、弹性伸缩和管理提供了前所未有的灵活性和可扩展性。

文章图片
#云原生#人工智能
openEuler云原生AI性能测试:Qwen3模型KServe部署实战

在当今人工智能(AI)与云原生技术交汇的浪潮中,构建高性能、高可用的 AI 服务已成为企业数字化转型的关键。openEuler 作为面向数字基础设施的开源操作系统,凭借其在高并发、低延迟场景下的深度优化,正成为承载 AI 工作负载的理想选择。与此同时,Kubernetes 云原生生态为 AI 模型的部署、弹性伸缩和管理提供了前所未有的灵活性和可扩展性。

文章图片
#云原生#人工智能
在 openEuler 24.03 LTS SP2 上安装部署 iSula 容器引擎及性能测试

iSula 是华为开源的轻量级容器引擎,专为云原生场景设计。iSula 通用容器引擎相比 Docker,是一种新的容器解决方案,提供统一的架构设计来满足CT(通信技术)和IT(信息技术)领域的不同需求。

#开发语言#rust
openEuler云原生AI性能测试:Qwen3模型KServe部署实战

在当今人工智能(AI)与云原生技术交汇的浪潮中,构建高性能、高可用的 AI 服务已成为企业数字化转型的关键。openEuler 作为面向数字基础设施的开源操作系统,凭借其在高并发、低延迟场景下的深度优化,正成为承载 AI 工作负载的理想选择。与此同时,Kubernetes 云原生生态为 AI 模型的部署、弹性伸缩和管理提供了前所未有的灵活性和可扩展性。

文章图片
#云原生#人工智能
openEuler云原生AI性能测试:Qwen3模型KServe部署实战

在当今人工智能(AI)与云原生技术交汇的浪潮中,构建高性能、高可用的 AI 服务已成为企业数字化转型的关键。openEuler 作为面向数字基础设施的开源操作系统,凭借其在高并发、低延迟场景下的深度优化,正成为承载 AI 工作负载的理想选择。与此同时,Kubernetes 云原生生态为 AI 模型的部署、弹性伸缩和管理提供了前所未有的灵活性和可扩展性。

文章图片
#云原生#人工智能
Rust初学者常见问题总结:让你顺利写下你的第一个“Hello Rust!“

本文介绍了Rust编程中常见的三个问题及解决方法:1) 编译时缺少C语言链接器问题,需安装Visual Studio构建工具;2) 使用Cargo创建新项目后的操作指南,包括项目结构解析和常用命令;3) Rust工具链不匹配问题,建议检查安装工具链配置。文章提供了详细步骤帮助初学者快速解决这些入门级问题。

文章图片
#rust#开发语言#后端
100% AI 写的开源项目三周多已获得 800 star 了

https://github.com/fullstackagent/fulling 项目本身功能是一个集成了底层默认pgsql数据库 和的一个编程工具,运行在kubernetes上,简单来说就是点个按钮直接开始梭哈, 其他事情agent都帮你干了。感觉是个比supabase更简单更灵活的方案,因为我不需要按照supabase的 SDK 写代码了。我个人感觉这个项目意义还是非常大的,好不好用暂且不说

文章图片
#人工智能
    共 26 条
  • 1
  • 2
  • 3
  • 请选择