logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

知识体系篇-人工智能基础知识(05)大语言模型(LLM)原理与应用:从 GPT 到 ChatGPT,一篇彻底搞懂

本文系统梳理了大语言模型(LLM)的核心原理与发展历程。主要内容包括: LLM定义与特征:参数量达数十亿至数万亿,训练数据达万亿级Token,具备语言理解、生成、推理等综合能力。 发展历程:从2018年GPT-1到2023年GPT-4,模型规模与能力持续突破,ChatGPT引爆应用热潮。 训练流程三阶段: 预训练:通过海量文本学习语言规律 监督微调(SFT):使用高质量指令数据优化对话能力 强化学

文章图片
#人工智能#语言模型#AI +3
知识体系篇-数据标注与处理(05)文本标注方法:数据质量评估标准与检查方法:保障标注数据“物有所值“

数据质量评估摘要 数据质量是AI模型训练的核心基础,遵循"垃圾进,垃圾出"原则。评估数据质量需考察六个维度:准确性(标注与真实一致)、完整性(无缺失标注)、一致性(标注标准统一)、时效性(数据适用性)、唯一性(无重复数据)和合规性(符合法规)。主要评估指标包括:标注准确率(样本正确率)、标注一致性(不同标注员间一致程度)、完整率(已完成标注比例)和标注效率(单位时间标注量)。不

文章图片
#人工智能#语言模型#AI +1
知识体系篇-数据标注与处理(04)语音标注方法:ASR转写、TTS语料、说话人与情感标注全解析

本文系统解析语音标注的四大核心任务:ASR转写标注、TTS语料标注、说话人识别标注和语音质量评测。重点介绍了ASR转写标注的规范要点,包括逐字转写、方言处理、非言语声音标记等文字转写规范,以及句段切分的时间控制和语义完整性原则。同时对比了TextGrid、ELAN、WebVTT等不同语音标注格式的特点和适用场景,为智能语音产品开发提供高质量数据标注指导。

文章图片
#语音识别#xcode#人工智能 +2
知识体系篇-数据标注与处理(01)模型训练与调优:模型训练基本流程,从原始数据到可用模型的完整路径

模型训练流程与核心概念摘要 模型训练是通过调整参数使预测误差最小化的过程,完整流程包括数据收集、预处理、特征工程、模型选择、前向传播、损失计算、反向传播和迭代优化等10个步骤。核心概念包括: 损失函数:量化预测误差(如交叉熵、MSE) 优化器:决定权重更新方式(如Adam、SGD) 学习率:控制参数更新幅度,需合理调度 训练机制:前向传播计算输出,反向传播通过链式法则更新权重 正则化:防止过拟合的

文章图片
#人工智能#语音识别#xcode +1
知识体系篇-数据标注与处理(06)模型训练与调优:模型微调(Fine-tuning)技术详解

模型微调技术概述 模型微调(Fine-tuning)是迁移学习的关键技术,通过调整预训练模型参数使其适应特定任务。相比从零训练,微调能大幅降低计算成本(如GPT-3微调仅需数千条数据和几十美元)。微调方法主要包括: 全量微调:解冻所有层参数,适合数据量大的场景 部分微调:仅解冻顶层网络层,平衡效果与计算开销 参数高效微调(PEFT):如LoRA、Adapter等方法,仅训练少量参数(0.1%-5%

文章图片
#人工智能#数据挖掘#分类 +2
知识体系篇-数据标注与处理(07)模型训练与调优:Prompt Engineering(提示工程)基础

Prompt Engineering(提示工程)基础摘要 提示工程是通过优化输入文本(Prompt)来提升大语言模型输出质量的技术。核心方法包括四种范式:Zero-shot(无示例)、One-shot(单示例)、Few-shot(多示例),其中Few-shot效果最佳但消耗更多计算资源。思维链(CoT)技术通过引导模型逐步推理,显著提升复杂任务准确率。角色提示通过设定专业身份(如"资深数

文章图片
#大数据#人工智能#机器学习 +2
毕业设计——基于深度学习的医学图像处理分析平台,AI全自动疾病诊断

编码器模块:分为图像编码器(Images encoder)与文本编码器(Text encoder)模块,图像编码器将输入图像编码成一个包含语义信息的高维向量,同理文本编码器将病人的病历文本信息进行特征提取并将其编码成包含病历语义信息的高维向量。基于强化学习的交互模块:该模块基于价值网络的DDQN算法,提供整个系统强化学习环境,模块接收来自病人反馈的评分并根据这些反馈生成相应的奖赏指导智能体agen

文章图片
#人工智能#深度学习
知识体系篇-智能系统运维(01)智能系统部署基础

文章摘要:模型部署的关键技术与实践 本文系统介绍了AI模型部署的核心概念和方法。主要内容包括: 模型部署本质:将训练好的模型从实验环境迁移到生产环境,面临环境一致性、性能、可用性等挑战。 三大部署范式: 单机部署:数据安全但运维成本高 云端部署:弹性扩展,适合互联网产品 边缘部署:低延迟,适用于IoT场景 模型格式转换: 对比了.pkl、.pt、ONNX等格式特性 详细演示了PyTorch转ONN

文章图片
#neo4j#人工智能#数据挖掘 +3
知识体系篇-智能系统运维(02)模型上线流程与监控

AI系统上线并非简单部署,而是需要严谨的发布策略和持续监控。文章对比了四种发布方式:蓝绿部署(快速切换但资源翻倍)、金丝雀发布(逐步验证风险低,AI模型首选)、影子测试(零风险验证)和滚动更新(无停机但回滚慢)。重点展示了金丝雀发布的Python实现代码,包含流量路由、错误率监控和自动回滚机制,通过5%-100%的渐进式流量切换确保安全上线。上线后需持续监控业务指标(准确率)、系统指标(延迟)和数

文章图片
#python#开发语言#数据挖掘 +2
知识体系篇-智能系统运维(01)智能系统部署基础

文章摘要:模型部署的关键技术与实践 本文系统介绍了AI模型部署的核心概念和方法。主要内容包括: 模型部署本质:将训练好的模型从实验环境迁移到生产环境,面临环境一致性、性能、可用性等挑战。 三大部署范式: 单机部署:数据安全但运维成本高 云端部署:弹性扩展,适合互联网产品 边缘部署:低延迟,适用于IoT场景 模型格式转换: 对比了.pkl、.pt、ONNX等格式特性 详细演示了PyTorch转ONN

文章图片
#neo4j#人工智能#数据挖掘 +3
    共 134 条
  • 1
  • 2
  • 3
  • 14
  • 请选择