logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

企业级大模型创建与部署全流程(数据集—>创建模型—>训练模型—>评估模型—>部署模型)

前向传播是数据流动的过程,全连接层和激活函数是构建模型的基础,输出层和任务头决定任务类型,学习率和损失函数驱动训练,反向传播和优化器调整权重,而过拟合是需要避免的陷阱。②、模型架构(任务头+反向传播+):在预训练模型的基础上,添加任务特定的输出层。①、使用测试集评估模型性能。大模型预训练后,针对不同的下游任务添加的“专用输出层”(后面接不同的任务头来做具体任务,预训练模型通常不包括任务特定的输出层

大模型部署方式(本地化部署+云端部署+混合部署+边缘段部署)

GPU类型:g5.xlarge(NVIDIA A10G,24GB显存)或p3.2xlarge(V100,16GB显存),根据模型大小调整(如13B模型需g5.2xlarge)CPU≥16核,内存≥64GB(用于加载模型和缓存)可选优化:使用量化工具(如bitsandbytes)将模型从FP32转为4/8位整数(INT4/INT8),降低显存占用(7B模型INT4仅需约6GB显存)编写推理脚本(in

#语言模型
SpringAI整合DeepSeek生成图表

SpringAI整合DeepSeek生成图表

文章图片
大模型基础研发(Python语言)VS 传统业务集成应用(Java/C#/Go等其他语言)

Transformer基于注意力机制的神经网络架构【原始结构是“Encoder-Decoder”(编码器-解码器)】,及其变体【Encoder-only只保留“编码器”(理解输入), Decoder-only​只保留“解码器”(生成输出), Encoder-Decoder​编码器(理解输入)+ 解码器(生成输出)】Common Crawl:通过AWS S3或HTTP接口下载(如https://da

#python#java
传统业务集成应用大模型案例

若需高性能(如实时对话),可将大模型推理引擎(如vLLM、TGI)封装为Java可调用的SDK(通过JNI或gRPC);通过HTTP API调用第三方大模型(如OpenAI API、阿里通义千问),或在本地部署开源模型(如LLaMA系列),封装为RESTful服务供Java系统调用。开发模型网关服务(Spring Boot应用),接收Java业务系统请求,转发至第三方API(如OpenAI),处理

SDK:gRPC+JNI

高性能、开源的远程过程调用(RPC)框架,由Google开发,基于Protocol Buffers(Protobuf)​ 序列化协议,支持多语言、流式通信、负载均衡。将复杂系统(如大模型推理引擎)的能力,通过标准化接口、工具集、文档封装成易用的软件开发包(SDK),供上层业务系统直接调用。Java提供的跨语言调用接口,允许Java代码与C/C++等“原生代码”直接交互(如调用本地动态库.so/.d

#python#开发语言
SpringBoot配置文件与代码读取机制(Spring自动+自定义+第三方,独立文件)

ai:execution://推荐使用:@ConfigurationProperties@Data@Data//其他配置类……略@Service@Autowired自定义业务配置app:payment:new-checkout-enabled: true # 功能开关//使用JSR-303校验配置@Validated@NotBlank@Min(1000)

#spring#spring boot#后端
Python数据持久层:数据库与ORM

ORM: 用Python对象操作数据库,无需直接编写SQL。数据库驱动:database.pymodels.py使用Python类定义数据表结构Pydantic模式定义请求/响应数据的序列化和验证crud.pymain.pyDjango ORM 案例models.pyserializers.pyviews.pyadmin.pyFlask + SQLAlchemy 案例config.py显式配置管理

#python#数据库#开发语言
LLM大模型评估攻略

评估目标:评估模型在预训练阶段获得的基本语言能力、知识表示和通用推理能力,确保模型具备良好的基础性能。评估方法:基准测试:使用多个标准基准数据集进行零样本(zero-shot)或少样本(few-shot)评估,例如:困惑度计算:在保留的验证集上计算模型的困惑度(perplexity),以衡量语言建模质量。损失曲线分析:监控训练损失和验证损失曲线,检查过拟合或欠拟合现象。定性分析:手动检查模型在开放

文章图片
#python#开发语言
如何选择大模型(不同业务场景选择相应的大模型)

任务类型:是文本生成、对话、代码编写、信息抽取、复杂推理还是多模态理解?性能要求:需要“最好”的效果,还是“足够好”即可?对响应速度(延迟)和吞吐量有何要求?成本预算:是按调用次数付费(API)还是一次性投入(私有化部署)?预算是多少?数据敏感性:处理的数据是否涉及商业秘密、个人隐私?是否需要私有化部署?技术能力:团队是否有能力进行模型的微调、部署和运维?

    共 61 条
  • 1
  • 2
  • 3
  • 7
  • 请选择