logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

025、AI应用后端开发:FastAPI框架与RESTful API设计

现在Python后端框架选择不少,Flask轻量但生态散,Django重但自带全家桶。FastAPI站在中间那个微妙的位置——它不像Flask那样需要自己拼装各种插件,又比Django更适配现代异步编程。最关键的是,它天生为AI应用设计:自动生成OpenAPI文档、内置数据验证、原生支持async/await。你部署个模型服务,总不能每次改接口都手动更新API文档吧?app = FastAPI(t

#人工智能#fastapi#restful
028、边缘AI与嵌入式部署:TensorFlow Lite/PyTorch Mobile实战手记

模型部署不是流水线终点,而是产品化的起点。把AI塞进小小的嵌入式设备,就像给战斗机装上一颗智慧的大脑——空间有限、环境严苛,但一旦成功,就能在真实战场释放价值。这份在资源限制中寻找最优解的挑战,正是边缘AI最迷人的地方。(本篇基于TensorFlow 2.8+、PyTorch 1.10+环境验证。实际部署请务必测试目标设备的具体环境,ARMv7和ARMv8的优化策略都可能不同。

#人工智能#tensorflow#pytorch
029、模型监控、日志与性能评估:别让模型在线上裸奔

上周深夜收到告警,线上推荐服务的响应延迟突然从50ms飙到800ms。登录服务器一看,CPU使用率正常,内存也没溢出,模型推理的batch size配置也没变。最后在监控面板的角落里发现:输入特征的长度分布最近一周悄悄从平均256维涨到了1024维——某个上游特征工程服务改了参数没同步通知。。

#fastapi#restful#人工智能 +1
027、模型服务化:深夜调不通的TorchServe和那个救场的Triton

凌晨两点,屏幕上的日志还在疯狂滚动。第37次尝试启动TorchServe服务,依然卡在“Loading model…”然后超时。同事发来的微信还在闪烁:“客户明天要看演示,模型部署必须搞定。”这场景太熟悉了——模型在本地跑得好好的,一到生产环境就各种水土不服。

#服务器#前端
018、图像分割:语义分割与实例分割模型

昨天深夜调一个分割模型,输入尺寸改到512x512后,mIoU直接从0.78掉到0.62。盯着输出张量看了半小时才发现,原来是卷积层padding没跟着调整,特征图尺寸对不上,最后上采样时边缘信息全乱了。这种细节问题在分割任务里太常见了,今天就来聊聊语义分割和实例分割那些实战中的门道。

#深度学习#transformer#人工智能
026、模型部署入门:ONNX格式与模型优化

昨天深夜调试一个模型部署问题,模型在训练时精度明明有95%,一到推理端直接掉到30%以下。盯着屏幕看了半小时,突然意识到问题所在:训练时用了自动混合精度,但导出模型时忘记设置的参数,导致某些算子转换失败,模型结构都变了样。这种问题在模型部署中太常见了,今天我们就聊聊ONNX这个部署领域的“普通话”标准。

#人工智能#自然语言处理#语言模型
032、MLOps理念与工具链简介:从一次模型部署事故说起

上周团队里出了个事故:训练集上一个准确率98%的模型,在生产环境里掉到了72%。排查了两天,发现训练时用的数据版本和推理服务加载的数据预处理代码对不上——有人改了预处理逻辑但没更新版本标记,另一个同事用老标记重新训练了模型。这种问题在传统软件工程里早就有成熟方案,但在AI项目里却反复出现。今天我们就聊聊怎么用MLOps的思路和工具链解决这类问题。

#前端
032、MLOps理念与工具链简介:从一次模型部署事故说起

上周团队里出了个事故:训练集上一个准确率98%的模型,在生产环境里掉到了72%。排查了两天,发现训练时用的数据版本和推理服务加载的数据预处理代码对不上——有人改了预处理逻辑但没更新版本标记,另一个同事用老标记重新训练了模型。这种问题在传统软件工程里早就有成熟方案,但在AI项目里却反复出现。今天我们就聊聊怎么用MLOps的思路和工具链解决这类问题。

#前端
029、模型监控、日志与性能评估:别让模型在线上裸奔

上周深夜收到告警,线上推荐服务的响应延迟突然从50ms飙到800ms。登录服务器一看,CPU使用率正常,内存也没溢出,模型推理的batch size配置也没变。最后在监控面板的角落里发现:输入特征的长度分布最近一周悄悄从平均256维涨到了1024维——某个上游特征工程服务改了参数没同步通知。。

#fastapi#restful#人工智能 +1
028、边缘AI与嵌入式部署:TensorFlow Lite/PyTorch Mobile实战手记

模型部署不是流水线终点,而是产品化的起点。把AI塞进小小的嵌入式设备,就像给战斗机装上一颗智慧的大脑——空间有限、环境严苛,但一旦成功,就能在真实战场释放价值。这份在资源限制中寻找最优解的挑战,正是边缘AI最迷人的地方。(本篇基于TensorFlow 2.8+、PyTorch 1.10+环境验证。实际部署请务必测试目标设备的具体环境,ARMv7和ARMv8的优化策略都可能不同。

#人工智能#tensorflow#pytorch
    共 23 条
  • 1
  • 2
  • 3
  • 请选择