logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Loki+Promtail:收集 K8s 容器日志 + Grafana 可视化

通过K8s服务发现机制自动识别容器日志路径,为日志流添加等标签:以DaemonSet形式部署于每个节点,避免单点故障:默认配置仅需100m CPU和100Mi内存。

#kubernetes#grafana#容器
K8s 部署常见问题及解决方法

二者均属顶级工具,VS Code 以功能全面见长,Sublime Text 以性能取胜。根据项目规模和个人偏好,选择能最大化生产力的编辑器。

#kubernetes#容器#云原生
从昇腾NPU到Llama 2:大模型部署的完整指南与实战经验

在国产AI芯片生态中,昇腾NPU凭借其达芬奇架构和自主可控特性,已成为大模型部署的重要选择。本文基于昇腾910B NPU实测经验,系统梳理Llama 2模型从环境搭建到性能调优的全流程,为开发者提供实战参考。

#人工智能#深度学习
从昇腾NPU到Llama 2:大模型部署的完整指南与实战经验

在国产AI芯片生态中,昇腾NPU凭借其达芬奇架构和自主可控特性,已成为大模型部署的重要选择。本文基于昇腾910B NPU实测经验,系统梳理Llama 2模型从环境搭建到性能调优的全流程,为开发者提供实战参考。

#人工智能#深度学习
从昇腾NPU到Llama 2:大模型部署的完整指南与实战经验

在国产AI芯片生态中,昇腾NPU凭借其达芬奇架构和自主可控特性,已成为大模型部署的重要选择。本文基于昇腾910B NPU实测经验,系统梳理Llama 2模型从环境搭建到性能调优的全流程,为开发者提供实战参考。

#人工智能#深度学习
Seedream 4.0的工业级速度:DiT架构带来的10倍推理跃升

引入误差补偿机制的三阶段量化: $$ \mathbf{\hat{W}} = \mathcal{Q}(\mathbf{W} + \Delta), \quad \Delta = \mathcal{D}(\mathbf{W} - \mathcal{Q}^{-1}(\mathbf{\hat{W}})) $$ 在INT8精度下保持FP32级别模型准确率。{compute} \right) $$ 其中$\ma

#架构
‌Tailwind CSS 原子化设计:从零搭建主题系统

从零搭建 Tailwind 主题系统,本质是通过原子化设计将样式控制权交还给开发者。通过配置预设变量、扩展响应式断点及动态切换机制,可构建出高效、一致且易于维护的界面系统。2025 年的前端开发中,这一范式已成为提升开发效率与设计质量的核心路径。

#css#前端
从昇腾NPU到Llama 2:大模型部署的完整指南与实战经验

在国产AI芯片生态中,昇腾NPU凭借其达芬奇架构和自主可控特性,已成为大模型部署的重要选择。本文基于昇腾910B NPU实测经验,系统梳理Llama 2模型从环境搭建到性能调优的全流程,为开发者提供实战参考。

#人工智能#深度学习
从昇腾NPU到Llama 2:大模型部署的完整指南与实战经验

在国产AI芯片生态中,昇腾NPU凭借其达芬奇架构和自主可控特性,已成为大模型部署的重要选择。本文基于昇腾910B NPU实测经验,系统梳理Llama 2模型从环境搭建到性能调优的全流程,为开发者提供实战参考。

#人工智能#深度学习
到底了