Day-u 个人主页

@m0_73266749

Day-u

2022-12-08 10:04:15 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

025、AI应用后端开发：FastAPI框架与RESTful API设计

现在Python后端框架选择不少，Flask轻量但生态散，Django重但自带全家桶。FastAPI站在中间那个微妙的位置——它不像Flask那样需要自己拼装各种插件，又比Django更适配现代异步编程。最关键的是，它天生为AI应用设计：自动生成OpenAPI文档、内置数据验证、原生支持async/await。你部署个模型服务，总不能每次改接口都手动更新API文档吧？app = FastAPI(t

#人工智能 #fastapi #restful

028、边缘AI与嵌入式部署：TensorFlow Lite/PyTorch Mobile实战手记

模型部署不是流水线终点，而是产品化的起点。把AI塞进小小的嵌入式设备，就像给战斗机装上一颗智慧的大脑——空间有限、环境严苛，但一旦成功，就能在真实战场释放价值。这份在资源限制中寻找最优解的挑战，正是边缘AI最迷人的地方。（本篇基于TensorFlow 2.8+、PyTorch 1.10+环境验证。实际部署请务必测试目标设备的具体环境，ARMv7和ARMv8的优化策略都可能不同。

#人工智能 #tensorflow #pytorch

029、模型监控、日志与性能评估：别让模型在线上裸奔

上周深夜收到告警，线上推荐服务的响应延迟突然从50ms飙到800ms。登录服务器一看，CPU使用率正常，内存也没溢出，模型推理的batch size配置也没变。最后在监控面板的角落里发现：输入特征的长度分布最近一周悄悄从平均256维涨到了1024维——某个上游特征工程服务改了参数没同步通知。。

#fastapi #restful #人工智能 +1

027、模型服务化：深夜调不通的TorchServe和那个救场的Triton

凌晨两点，屏幕上的日志还在疯狂滚动。第37次尝试启动TorchServe服务，依然卡在“Loading model…”然后超时。同事发来的微信还在闪烁：“客户明天要看演示，模型部署必须搞定。”这场景太熟悉了——模型在本地跑得好好的，一到生产环境就各种水土不服。

#服务器 #前端

018、图像分割：语义分割与实例分割模型

昨天深夜调一个分割模型，输入尺寸改到512x512后，mIoU直接从0.78掉到0.62。盯着输出张量看了半小时才发现，原来是卷积层padding没跟着调整，特征图尺寸对不上，最后上采样时边缘信息全乱了。这种细节问题在分割任务里太常见了，今天就来聊聊语义分割和实例分割那些实战中的门道。

#深度学习 #transformer #人工智能

026、模型部署入门：ONNX格式与模型优化

昨天深夜调试一个模型部署问题，模型在训练时精度明明有95%，一到推理端直接掉到30%以下。盯着屏幕看了半小时，突然意识到问题所在：训练时用了自动混合精度，但导出模型时忘记设置的参数，导致某些算子转换失败，模型结构都变了样。这种问题在模型部署中太常见了，今天我们就聊聊ONNX这个部署领域的“普通话”标准。

#人工智能 #自然语言处理 #语言模型

032、MLOps理念与工具链简介：从一次模型部署事故说起

上周团队里出了个事故：训练集上一个准确率98%的模型，在生产环境里掉到了72%。排查了两天，发现训练时用的数据版本和推理服务加载的数据预处理代码对不上——有人改了预处理逻辑但没更新版本标记，另一个同事用老标记重新训练了模型。这种问题在传统软件工程里早就有成熟方案，但在AI项目里却反复出现。今天我们就聊聊怎么用MLOps的思路和工具链解决这类问题。

#前端

032、MLOps理念与工具链简介：从一次模型部署事故说起

#前端

029、模型监控、日志与性能评估：别让模型在线上裸奔

#fastapi #restful #人工智能 +1

028、边缘AI与嵌入式部署：TensorFlow Lite/PyTorch Mobile实战手记

#人工智能 #tensorflow #pytorch

共 23 条

请选择