logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

GLM-4.7 & MiniMax M2.1 实测上线:来AI Ping 免费用两款最强模型!

GLM-4.7 与 MiniMax M2.1 的同场上线,恰好代表两条逐渐成熟的路线:一条强调可控推理与工具协同,面向复杂工程任务的一次性交付;另一条强调 MoE 架构带来的吞吐效率与多语言工程优化,更适合持续运行的 Agent 流水线。

文章图片
#人工智能
GLM-4.7 & MiniMax M2.1 实测上线:来AI Ping 免费用两款最强模型!

GLM-4.7 与 MiniMax M2.1 的同场上线,恰好代表两条逐渐成熟的路线:一条强调可控推理与工具协同,面向复杂工程任务的一次性交付;另一条强调 MoE 架构带来的吞吐效率与多语言工程优化,更适合持续运行的 Agent 流水线。

文章图片
#人工智能
openEuler 云原生容器基础搭建与Podman应用部署实操

openEuler是一款面向数字基础设施的开源操作系统,支持ARM、x86、RISC-V等多种架构,适用于服务器、云计算及边缘计算等场景。本文基于openEuler 20.03系统,在华为云ECS环境下演示了使用Podman部署容器化应用的全流程,包括环境准备、Podman安装、Nginx容器启动及网络故障排查。重点解决了镜像源不可达问题,并提供了持久化存储、镜像构建等实践指导,帮助开发者快速上手

文章图片
#云原生#运维
openEuler 开发环境搭建与工具链优化实践深度评测

openEuler作为面向数字基础设施的开源操作系统,在开发环境构建方面具有显著优势。本文基于华为云服务器环境,详细介绍了openEuler 20.03开发环境的搭建过程。系统分析了openEuler完善的软件包管理、优化的编译工具链、容器化开发支持和多语言环境等特性。通过实际操作演示了基础开发工具安装、VS Code编辑器配置以及Python等语言环境的搭建流程。实践表明,openEuler为开

文章图片
#服务器#操作系统#运维
仓颉三方库开发实战:技术博客_source_map_js实现详解

本文介绍了使用仓颉语言实现的source_map_js库,这是一个符合Source Map v3规范的JavaScript源映射处理工具。项目采用模块化设计,包含VLQ编解码、映射关系表示和原始结构处理等核心功能。通过Position、Mapping和RawSourceMap等精心设计的数据结构,实现了高效的源位置映射处理。项目充分利用仓颉语言的类型系统和Option类型进行错误处理,展示了仓颉在

文章图片
#开发语言
昇腾大模型量化实战:ModelSlim 工具上手与 W8A8 精度优化全流程解析

本文详细介绍了使用昇腾ModelSlim工具对Qwen2.5-72B大模型进行W8A8量化的全流程。首先阐述了量化对于大模型推理性能提升的重要性,然后介绍了ModelSlim工具的功能特点和环境配置要求。重点讲解了量化过程中的关键步骤:模型加载、校准数据准备、AntiOutlier离群值抑制、量化参数配置等。通过实测数据表明,W8A8量化可使显存占用降低42%,推理时延提升33%,而精度损失仅1.

文章图片
#人工智能#机器学习
昇腾大模型量化实战:ModelSlim 工具上手与 W8A8 精度优化全流程解析

本文详细介绍了使用昇腾ModelSlim工具对Qwen2.5-72B大模型进行W8A8量化的全流程。首先阐述了量化对于大模型推理性能提升的重要性,然后介绍了ModelSlim工具的功能特点和环境配置要求。重点讲解了量化过程中的关键步骤:模型加载、校准数据准备、AntiOutlier离群值抑制、量化参数配置等。通过实测数据表明,W8A8量化可使显存占用降低42%,推理时延提升33%,而精度损失仅1.

文章图片
#人工智能#机器学习
昇腾大模型量化实战:ModelSlim 工具上手与 W8A8 精度优化全流程解析

本文详细介绍了使用昇腾ModelSlim工具对Qwen2.5-72B大模型进行W8A8量化的全流程。首先阐述了量化对于大模型推理性能提升的重要性,然后介绍了ModelSlim工具的功能特点和环境配置要求。重点讲解了量化过程中的关键步骤:模型加载、校准数据准备、AntiOutlier离群值抑制、量化参数配置等。通过实测数据表明,W8A8量化可使显存占用降低42%,推理时延提升33%,而精度损失仅1.

文章图片
#人工智能#机器学习
昇腾大模型量化实战:ModelSlim 工具上手与 W8A8 精度优化全流程解析

本文详细介绍了使用昇腾ModelSlim工具对Qwen2.5-72B大模型进行W8A8量化的全流程。首先阐述了量化对于大模型推理性能提升的重要性,然后介绍了ModelSlim工具的功能特点和环境配置要求。重点讲解了量化过程中的关键步骤:模型加载、校准数据准备、AntiOutlier离群值抑制、量化参数配置等。通过实测数据表明,W8A8量化可使显存占用降低42%,推理时延提升33%,而精度损失仅1.

文章图片
#人工智能#机器学习
昇腾大模型量化实战:ModelSlim 工具上手与 W8A8 精度优化全流程解析

本文详细介绍了使用昇腾ModelSlim工具对Qwen2.5-72B大模型进行W8A8量化的全流程。首先阐述了量化对于大模型推理性能提升的重要性,然后介绍了ModelSlim工具的功能特点和环境配置要求。重点讲解了量化过程中的关键步骤:模型加载、校准数据准备、AntiOutlier离群值抑制、量化参数配置等。通过实测数据表明,W8A8量化可使显存占用降低42%,推理时延提升33%,而精度损失仅1.

文章图片
#人工智能#机器学习
    共 133 条
  • 1
  • 2
  • 3
  • 14
  • 请选择