logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

探索Mistral-7B-Instruct-v0.2在 Atlas 800T上的推理部署

本文介绍了在GitCode云端Notebook环境中部署Mistral-7B-Instruct-v0.2大语言模型的完整流程。使用Atlas 800T NPU(1*Ascend 910B)硬件环境,详细说明了从环境检查、依赖安装(包括transformers、accelerate等库)、通过ModelScope SDK高速下载模型,到测试模型推理性能的完整步骤。文章提供了具体的代码示例和操作截图,

文章图片
#算力
探索SGLang + Qwen2-7B-Instruct 在_Atlas 800T 的推理调优

本文分享了在GitCode云端Notebook环境中对Qwen2-7B-Instruct模型进行性能调优的完整实践。通过ModelScope高效下载模型后,重点测试了不同批大小、KV缓存和量化设置下的推理性能,并提供了详细的调优步骤和实测数据。文章面向初次接触大模型优化的开发者,涵盖环境准备、模型加载、性能测试方法及优化建议,帮助读者快速掌握Qwen2-7B模型的性能调优技巧。

文章图片
#sglang#spring#java
从 0 到 1:Llama 3-8B 在昇腾 Atlas 800T 上的推理调优与算力榨干指南

本文介绍了在GitCode云端Notebook环境中部署Meta-Llama-3-8B-Instruct大模型的完整流程。教程从环境准备开始,详细说明了如何利用ModelScope实现模型高速下载,并提供了适配Ascend NPU的推理代码编写方法。文章包含环境检查、模型下载、性能测试和NPU负载监控等关键步骤,同时针对常见问题给出了解决方案。通过图文并茂的方式,作者展示了从零开始部署大模型的全过

文章图片
#数据库#昇腾
从 0 到 1:Llama 3-8B 在昇腾 Atlas 800T 上的推理调优与算力榨干指南

本文介绍了在GitCode云端Notebook环境中部署Meta-Llama-3-8B-Instruct大模型的完整流程。教程从环境准备开始,详细说明了如何利用ModelScope实现模型高速下载,并提供了适配Ascend NPU的推理代码编写方法。文章包含环境检查、模型下载、性能测试和NPU负载监控等关键步骤,同时针对常见问题给出了解决方案。通过图文并茂的方式,作者展示了从零开始部署大模型的全过

文章图片
#数据库#昇腾
使用openEuler来测试GCC编译效率实战测评

本文在openEuler 25.09系统上对GCC 12.3.1编译器进行了性能测评。通过创建包含多种算法的测试程序,对比了不同优化级别(O0-O3、Os)下的编译效率和执行性能。测试结果显示,随着优化级别提高,编译时间略有增加但执行性能显著提升。此外,还模拟了多文件项目编译场景,测试了并行编译(-j选项)对编译速度的影响。实验结果表明,openEuler上的GCC编译器在代码优化和并行编译方面表

文章图片
#开源#操作系统
使用openEuler进行多核性能测评,从单核到多核的极致性能探索

本文测评openEuler操作系统在多核环境下的性能表现,重点测试矩阵运算场景。测试环境基于openEuler 25.09系统,配置16线程处理器。通过编写多线程矩阵乘法程序(1024×1024矩阵),对比了1/2/4/8/16线程的性能差异。测试结果显示,随着线程数增加,计算时间显著降低,验证了openEuler在多核调度和负载均衡方面的优异表现。测试程序包含矩阵初始化、并行计算、单线程对比等功

文章图片
#开源#操作系统
使用openEuler在异构硬件上释放算力潜能

openEuler性能验证测试表明,该系统在多架构硬件环境下表现优异。测试采用x86和ARM双平台,验证了CPU、内存、存储及异构计算能力。结果显示openEuler能准确识别不同硬件架构,存储性能测试中顺序读写速度达1GB/s以上,随机读写IOPS超10万。GPU加速测试确认了其对NVIDIA显卡的良好支持,CUDA计算能力验证通过。测试数据表明openEuler具备优秀的跨平台兼容性和高性能表

文章图片
#算力#开源#操作系统
喂饭级 Gemini 3.0 使用教程:看完就学会,国内直接使用

DeepSider还内置了DeepL、谷歌翻译、GPT 4omini三大翻译源,在遇到看不懂的单词或短句时,都可以直接调用侧边栏快速翻译成中文。以Edge浏览器为例,进入插件安装页面后,点击获取按钮,就可以安装DeepSider插件了。装完插件后,在任何网页上点击右上角的DeepSider图标,就能打开侧边栏选择你需要的模型。,以及Sora 2,GPT-5,Claude 4.5,Nano Bana

文章图片
【Linux高级IO】五种IO模型

在信息技术日新月异的今天,Linux操作系统以其强大的稳定性和灵活性,成为了服务器、嵌入式系统以及众多开发者心中的首选平台。而在Linux系统的广阔天地中,I/O(输入/输出)操作无疑是连接用户与硬件、软件之间的桥梁,其性能的优化直接关系到整个系统的响应速度和数据处理能力。

文章图片
#linux#redis#数据库 +3
【Linux网络】Linux网络编程套接字,UDP与TCP

在当今这个信息技术日新月异的时代,网络编程已成为连接世界、构建各类互联网应用不可或缺的一部分。而Linux,作为开源操作系统的典范,其强大的网络功能和灵活性,为开发者们提供了一个广阔而深入的实践平台。在众多网络编程技术中,套接字(Socket)编程无疑是核心与基石,它不仅支撑着Web服务、即时通讯、在线游戏等日常应用,还是实现分布式系统、云计算服务的关键技术之一。

文章图片
#网络#linux#udp +1
    共 59 条
  • 1
  • 2
  • 3
  • 6
  • 请选择