logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

优化通义大模型推理性能:企业级场景下的延迟与成本削减策略

本文探讨了通义千问、Qwen等大模型在企业级应用中的推理优化技术,从计算图优化、批处理策略、量化压缩和系统架构四个维度提出解决方案。针对金融、电商、医疗等场景面临的延迟敏感(<500ms)、高吞吐(10k+ QPS)和成本约束(<2台A100)三大挑战,文章通过PyTorch Profiler剖析模型瓶颈,发现Attention计算(62.3%耗时)和层间数据传输(22.7%)是主要性

#人工智能
Go 语言云原生微服务全栈实战:Docker 镜像优化、K8s 编排与 Istio 流量治理

本系列文章详细讲解了如何使用 Go 语言构建基于微服务架构的应用系统,涵盖了从开发到部署、治理的全流程。文章首先介绍了 Go 语言在微服务开发中的优势,如高性能、并发模型和简洁语法,并通过一个用户服务示例展示了如何实现 RESTful API。随后,文章探讨了如何构建和优化 Docker 镜像,使用多阶段构建将镜像体积从 800MB 缩减至 20MB。接着,文章介绍了如何使用 Kubernetes

文章图片
#云原生#golang#微服务
RTX 5070显卡深度评测:GDDR7显存如何提升AI训练与游戏体验?

RTX 5070显卡深度评测:GDDR7显存如何提升AI训练与游戏体验?

文章图片
#人工智能#游戏
构建企业级AI智能体(Spring AI Alibaba + JManus实战)

本文介绍了基于Spring AI Alibaba和JManus的电商客服工单智能处理系统架构。针对传统AI应用的三大痛点(任务耦合、状态丢失和服务孤岛),系统采用智能体架构实现动态任务分解、状态持久化和服务热插拔。核心组件包括Planning Agent进行任务路由,以及多个专业Agent协同处理工单分类、退款和通知等流程。通过Redis实现多轮对话管理,采用三级缓存架构优化性能,并设计熔断机制保

#人工智能#spring#java
2026计算机专业毕业设计选题推荐【机器学习方向】

摘要: 本文介绍了一位8年经验的软件架构师(CSDN优质创作者/腾讯云TVP)提供的计算机专业毕设辅导服务,涵盖Java、Python、小程序等全栈技术。重点推荐了9个2026年机器学习方向热门毕设选题,包括校园图书推荐、安防行为检测、招聘匹配、垃圾分类等系统设计,每个选题均包含背景、基础功能与创新亮点(如个性化推荐、可解释性分析、实时报警等)。所有项目提供源码定制与论文指导,适合本科/研究生选择

#机器学习#人工智能
2026计算机专业毕业设计选题推荐【安卓APP方向】

2026年安卓APP毕业设计选题推荐(摘要) 本文提供30个安卓APP毕业设计选题,涵盖校园、社区、健康、环保等领域。每个选题包含背景说明、基础功能模块及创新点。例如:校园智能失物招领系统(地图标记+智能提醒)、社区共享健身APP(动作识别+社区挑战)、智慧校园二手书平台(OCR识别+智能定价)、城市垃圾分类APP(图像识别+积分兑换)、心理健康陪伴APP(心理测评+匿名树洞)等。这些选题注重技术

#android
2026计算机专业毕业设计选题推荐【Python方向】

文章摘要(150字以内): 本文为计算机专业学生提供15个Python毕业设计选题,涵盖智慧校园、心理健康、智能家居、财务管理等热门领域。每个选题包含背景说明、基础功能模块及技术亮点,如人脸识别考勤系统、心理健康测评平台、智能家居语音控制等,涉及SpringBoot、Django、机器学习等技术栈。系统均支持数据可视化、移动端适配及AI功能,助力学生完成高质量毕设。附源码获取方式及专业指导,适合不

#python#开发语言#spring boot
OSS监控体系搭建:Prometheus+Grafana实时监控流量、错误码、存储量(开源方案替代云监控自定义视图)

本文介绍了基于Prometheus和Grafana的开源监控方案在OSS对象存储中的实践应用。主要内容包括:1)对比分析主流监控方案,选择开源生态架构;2)设计OSS指标采集规范与自定义Exporter开发;3)Prometheus的高级配置优化与存储调优;4)Grafana仪表盘的分层设计与变量联动;5)构建多级告警体系与通知策略;6)提出查询加速等性能优化方案。该系统可实现每秒15万样本处理能

#prometheus#grafana#开源
Kubernetes集群中GPU共享调度与拓扑感知优化实战

本文探讨了GPU资源管理的关键技术,主要包括:1)GPU资源碎片化问题分析,指出物理卡级分配和调度策略导致利用率不足30%;2)提出拓扑感知调度模型,通过量化NVLink与PCIe的性能差异优化分布式训练效率;3)实现GPU共享架构,包括设备插件核心状态机和拓扑感知调度算法;4)显存隔离技术,通过内核级cgroup机制实现资源限额控制。实验数据显示,优化后拓扑损失率从40%降至5%以下,显著提升G

#kubernetes#wpf#容器
AI大模型×音视频:2025年开发者的实战指南

AI大模型×音视频:2025年开发者的实战指南

文章图片
#人工智能#音视频
    共 23 条
  • 1
  • 2
  • 3
  • 请选择