logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

电子厂PCB板焊点缺陷检测(卷积神经网络CNN)

图像预处理(去噪/裁剪)、数据增强(旋转/翻转)、CNN模型构建(ResNet迁移学习)、模型训练与评估、模型存储(MinIO):API网关、缺陷检测服务(调用CNN模型)、质检系统集成(缺陷标注/统计分析)、分拣控制系统(PLC联动)、监控告警CNN(卷积神经网络)是专为图像设计的深度学习模型,通过局部感知(卷积核提取局部特征)、权值共享(减少参数)、层次化特征提取(浅层边缘→中层纹理→深层语义

#cnn#人工智能#神经网络
电商客服工单自动分类(SVM支持向量机)

监控系统(Grafana)实时展示分类准确率、PSI(特征分布漂移)、API错误率,若PSI>0.25(数据分布变化),自动触发模型重训(Airflow调度算法团队重训流程)feature_store/feature_repo/features.py(定义实体、特征视图、在线/离线特征,业务团队通过此调用)(2)算法团队:SVM-RBF核模型训练(model_training/svm/train_

#分类#支持向量机#数据挖掘
大模型部署方式(本地化部署+云端部署+混合部署+边缘段部署)

GPU类型:g5.xlarge(NVIDIA A10G,24GB显存)或p3.2xlarge(V100,16GB显存),根据模型大小调整(如13B模型需g5.2xlarge)CPU≥16核,内存≥64GB(用于加载模型和缓存)可选优化:使用量化工具(如bitsandbytes)将模型从FP32转为4/8位整数(INT4/INT8),降低显存占用(7B模型INT4仅需约6GB显存)编写推理脚本(in

#语言模型
LLM大模型评估攻略

评估目标:评估模型在预训练阶段获得的基本语言能力、知识表示和通用推理能力,确保模型具备良好的基础性能。评估方法:基准测试:使用多个标准基准数据集进行零样本(zero-shot)或少样本(few-shot)评估,例如:困惑度计算:在保留的验证集上计算模型的困惑度(perplexity),以衡量语言建模质量。损失曲线分析:监控训练损失和验证损失曲线,检查过拟合或欠拟合现象。定性分析:手动检查模型在开放

文章图片
#python#开发语言
如何选择大模型(不同业务场景选择相应的大模型)

任务类型:是文本生成、对话、代码编写、信息抽取、复杂推理还是多模态理解?性能要求:需要“最好”的效果,还是“足够好”即可?对响应速度(延迟)和吞吐量有何要求?成本预算:是按调用次数付费(API)还是一次性投入(私有化部署)?预算是多少?数据敏感性:处理的数据是否涉及商业秘密、个人隐私?是否需要私有化部署?技术能力:团队是否有能力进行模型的微调、部署和运维?

    共 50 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择