logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Python数据持久层:数据库与ORM

ORM: 用Python对象操作数据库,无需直接编写SQL。数据库驱动:database.pymodels.py使用Python类定义数据表结构Pydantic模式定义请求/响应数据的序列化和验证crud.pymain.pyDjango ORM 案例models.pyserializers.pyviews.pyadmin.pyFlask + SQLAlchemy 案例config.py显式配置管理

#python#数据库#开发语言
LLM大模型评估攻略

评估目标:评估模型在预训练阶段获得的基本语言能力、知识表示和通用推理能力,确保模型具备良好的基础性能。评估方法:基准测试:使用多个标准基准数据集进行零样本(zero-shot)或少样本(few-shot)评估,例如:困惑度计算:在保留的验证集上计算模型的困惑度(perplexity),以衡量语言建模质量。损失曲线分析:监控训练损失和验证损失曲线,检查过拟合或欠拟合现象。定性分析:手动检查模型在开放

文章图片
#python#开发语言
LLM大模型评估攻略

评估目标:评估模型在预训练阶段获得的基本语言能力、知识表示和通用推理能力,确保模型具备良好的基础性能。评估方法:基准测试:使用多个标准基准数据集进行零样本(zero-shot)或少样本(few-shot)评估,例如:困惑度计算:在保留的验证集上计算模型的困惑度(perplexity),以衡量语言建模质量。损失曲线分析:监控训练损失和验证损失曲线,检查过拟合或欠拟合现象。定性分析:手动检查模型在开放

文章图片
#python#开发语言
如何选择大模型(不同业务场景选择相应的大模型)

任务类型:是文本生成、对话、代码编写、信息抽取、复杂推理还是多模态理解?性能要求:需要“最好”的效果,还是“足够好”即可?对响应速度(延迟)和吞吐量有何要求?成本预算:是按调用次数付费(API)还是一次性投入(私有化部署)?预算是多少?数据敏感性:处理的数据是否涉及商业秘密、个人隐私?是否需要私有化部署?技术能力:团队是否有能力进行模型的微调、部署和运维?

如何选择大模型(不同业务场景选择相应的大模型)

任务类型:是文本生成、对话、代码编写、信息抽取、复杂推理还是多模态理解?性能要求:需要“最好”的效果,还是“足够好”即可?对响应速度(延迟)和吞吐量有何要求?成本预算:是按调用次数付费(API)还是一次性投入(私有化部署)?预算是多少?数据敏感性:处理的数据是否涉及商业秘密、个人隐私?是否需要私有化部署?技术能力:团队是否有能力进行模型的微调、部署和运维?

AI实战项目案例设计与实施

选品Agent:工具:网页爬虫(竞争对手数据)、市场趋势API。客服Agent:工具:RAG知识库、多语言翻译API。定价Agent:工具:竞品价格监控、成本计算器。多任务学习:同时进行意图分类(200+类别)和关键实体抽取(如地址、人名、事件)。关系抽取:基于预定义Schema,提取"药物治疗疾病"、"基因表达蛋白"等关系。版面分析:使用LayoutLMv3识别文档结构(标题、段落、表格、公式)

AI实战项目案例设计与实施

选品Agent:工具:网页爬虫(竞争对手数据)、市场趋势API。客服Agent:工具:RAG知识库、多语言翻译API。定价Agent:工具:竞品价格监控、成本计算器。多任务学习:同时进行意图分类(200+类别)和关键实体抽取(如地址、人名、事件)。关系抽取:基于预定义Schema,提取"药物治疗疾病"、"基因表达蛋白"等关系。版面分析:使用LayoutLMv3识别文档结构(标题、段落、表格、公式)

项目九:领域LLM高效微调(法律行业专用LLM微调与合同审查平台)

参数配置核心代码实现===================================业务场景:律师事务所微调专用法律大模型进行合同智能审查

#深度学习#人工智能
    共 65 条
  • 1
  • 2
  • 3
  • 7
  • 请选择