logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

基于 GitCode 昇腾 NPU 的 LLaMA 7B 部署与性能测评全流程

最近发现一款宝藏网站——GitCode,它与百度的星河社区一样,都可以提供免费的服务器资源给开发者使用,不过GitCode的优点在于可以用华为昇腾的910B卡进行深度模型的推理部署。同时,我也测评了他俩的性能,GitCode的免费服务器性能要比百度星河社区的服务器性能好很多,而且自由度更高,可以安装自己想要安装的所有深度学习框架,而百度的星河社区现在不仅需要算力卡,还只能使用百度自家的paddle

文章图片
#昇腾
基于 GitCode 云端环境的 CANN ops-math 算子库深度测评:Ascend NPU 上的数学引擎解析

ops-math仓库:https://gitcode.com/cann/ops-mathops-math是 CANN 算子库体系中的基础组件之一,专门用于提供数学类算子(math operators)的底层实现。基础算术运算数学函数归约运算矩阵操作比较逻辑类型变换:Cast、Clip、Round 等它相当于 Ascend 平台上的“数学引擎”,为上层框架(如 MindSpore、Paddle、Py

#人工智能
告别信息过载:基于 Nexent 构建开发者技术雷达智能体

原因我猜测是 PDF 里的排版干扰——多栏布局、公式、参考文献列表——导致文本提取时结构被打乱,总结模型拿到的是一堆碎片化文字,质量自然不如结构化的 Markdown,可以使用更好的大模型比如Claude 4.6、ChatGPT 5.2、Deepseek 3.2这种,就能很好的避免这种情况的发生。智能体没有调用 MCP,转而调用内置联网搜索,搜索了"GitHub Trending Rust",拿到

文章图片
将 Bright Data 集成到 Zapier Agents,赋能 AI 协作伙伴

本指南介绍如何将 Bright Data 集成到 Zapier Agents 中,以自动化网页数据任务、生成报告,并拓展你的 AI Agent 能力。

文章图片
#人工智能
GitCode × 昇腾 NPU:vLLM 推理框架性能实测分析指南

项目vLLM推理延迟 (Batch=1)0.27 s0.19 s702.5763.1显存占用30 GB28 GB稳定性无波动无波动缓存复用不支持支持(节省25%时间)vLLM 在昇腾 910B 上稳定运行,无需额外编译或算子修改。Continuous Batching + KV Cache 带来约 10% 吞吐提升25% 延迟下降。显存利用率更优,资源占用更平衡。本次评测验证了vLLM 框架在昇腾

【在昇腾NPU上部署Llama-2-7B:从环境配置到性能测试的完整实战】

这次昇腾+MindSpore的测试之旅,从环境搭建到性能优化,前前后后花了两周时间。虽然过程中遇到了不少坑,但总体感觉昇腾的生态比想象中要成熟。

文章图片
#经验分享
python脚本抢各大平台大额优惠卷

当电商平台上演盛大的购物狂欢时,如双十一、双十二,我们常常面临着选择困难症:琳琅满目的商品使我们不知所措,而一旦选定了心仪的商品,看到价格后却可能望而却步。面对这种情况,很多人渴望能够享受到各种优惠,比如大额满减和优惠券,然而通常情况下,这些优惠券抢购的竞争激烈,一般人难以抢到。不过,别担心!今天我将分享如何利用Python实现零成本抢购优惠券,帮助你在电商狂潮中脱颖而出。通过这个方法,你将有机会

文章图片
#python#开发语言
OpenNJet应用引擎——云原生时代的Web服务新选择

OpenNJet 应用引擎是基于 NGINX 的面向互联网和云原生应用提供的运行时组态服务程序,作为底层引擎,OpenNJet 实现了 NGINX 云原生功能增强、安全加固和代码重构,利用动态加载机制可以实现不同的产品形态,如 Web 服务器、流媒体服务器、负载均衡、代理 (Proxy)、应用中间件、API 网关、消息队列等产品形态等等。OpenNJet正是在这样的背景下应运而生,它不仅继承了NG

文章图片
#github#开源#云原生
【Redis快速入门】深度学习Redis分片集群搭建及其原理

Redis Cluster模式为了解决单机Redis容量有限的问题,将数据按一定的规则分配到多台机器,内存/QPS不受限于单机,可受益于分布式集群高扩展性。Redis Cluster是一种服务器Sharding技术(分片和路由都是在服务端实现),采用多主多从,每一个分区都是由一个Redis主机和多个从机组成,片区和片区之间是相互平行的。Redis Cluster集群采用了P2P的模式,完全去中心化

文章图片
#redis#数据库#缓存
【OpenAI开发者大会,全新大模型它来了,价格大跌...】

继今年春天发布 GPT-4 之后,OpenAI 又创造了一个不眠夜。过去一年,ChatGPT 绝对是整个科技领域最热的词汇。北京时间 11 月 7 日凌晨 02:00,OpenAI 的首次 DevDay 开发者日活动正式开始。Keynote 主论坛环节由 Sam Altman 主讲并在油管现场直播,配合现场的演示,展示了多款新产品的发布,整整 45 分钟,内容紧凑而真诚。

文章图片
#人工智能#大数据#机器学习 +2
    共 91 条
  • 1
  • 2
  • 3
  • 10
  • 请选择