logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLM大模型-大模型 API 集成使用、部署本地大模型(huggingface、modelscope)、实现Qwen和Deepseek本地部署

人工智能中的大模型(Large Model / Foundation Model),是指参数规模通常在数十亿甚至千亿以上的深度神经网络。它们依靠大规模数据和高算力平台训练而成,具备强泛化能力和跨任务迁移能力,能够在自然语言处理、计算机视觉、语音、多模态等多个领域展现出较强的性能。参数规模巨大:例如 GPT-3 拥有 1750 亿参数。预训练 + 微调:先在海量通用数据上进行预训练,再通过少量标注数

文章图片
#人工智能
LLM大模型基础-自注意力机制:QKV和工作原理、多头自注意力机制、位置关联、层归一化

自注意力机制(Self-Attention)是现代深度学习尤其是NLP和CV领域的核心技术,最早由Transformer模型提出并应用于BERT、GPT等先进模型。其核心思想是让输入序列中的每个元素根据与其他元素的关系动态调整自身表示,从而有效捕捉长距离依赖,克服传统RNN/LSTM的局限性。该机制通过查询(Query)、键(Key)、值(Value)三个向量实现:Query用于查询其他元素信息,

文章图片
#人工智能#语言模型
YOLO 目标检测:YOLOv3网络结构、特征输出、FPN、多尺度预测

YOLOv3是目标检测领域的经典模型,通过Darknet53主干网络实现高效特征提取,并引入残差连接缓解梯度消失。其核心创新在于多尺度检测机制,利用13×13、26×26、52×52三个不同分辨率的特征图分别检测大、中、小物体。通过FPN特征金字塔网络实现特征融合,结合自上而下的上采样和自下而上的卷积路径,将深层语义信息与浅层细节特征相结合,显著提升多尺度目标检测能力。模型采用CBL模块(卷积+批

文章图片
#人工智能#目标检测
06 基于sklearn的机器学习-欠拟合、过拟合、正则化、逻辑回归、k-means算法

摘要:本文系统介绍了机器学习中的欠拟合、过拟合问题及其解决方案。欠拟合源于模型过于简单或特征不足,而过拟合则因模型复杂度过高或数据噪声导致。正则化是解决过拟合的关键技术,包括L2正则化的岭回归(保持所有特征但降低权重)和L1正则化的拉索回归(自动特征选择)。逻辑回归部分重点阐述了Sigmoid函数和交叉熵损失函数的应用,并通过泰坦尼克号数据集示例展示了分类实践。全文通过数学公式和代码实例(skle

文章图片
#深度学习#人工智能#计算机视觉 +4
YOLO 目标检测:数据集构建(LabelImg 实操)、评估指标(mAP/IOU)、 NMS 后处理

计算机视觉中的目标检测技术主要涉及三大任务:图像分类、目标检测和图像分割。目标检测算法YOLO(You Only Look Once)因其速度快、精度高而广受欢迎,其核心特点是单阶段检测,直接从图像同时预测目标类别和位置。训练过程需严格区分训练、验证和测试集,并使用标注工具(如labelimg)对数据进行边界框标注。评估指标包括交并比(IOU)、置信度、混淆矩阵、精确度、召回率以及PR曲线,其中m

文章图片
#目标检测#目标跟踪
YOLO 目标检测:YOLOv2基本框架、多尺度训练、锚框、维度聚类、位置预测、passthrough

YOLOv2是YOLO系列第二代目标检测算法,在YOLOv1基础上进行了多项改进。其核心思想是将目标检测转化为单次回归任务,通过卷积神经网络直接预测边界框和类别概率。主要优化包括:引入锚框机制提升小目标检测能力,采用多尺度训练增强模型鲁棒性,使用K-Means聚类选择更优先验框,以及细粒度特征融合提升检测效果。网络结构由轻量级主干Darknet-19和检测头组成,输出13×13特征图,每个网格预测

文章图片
#目标检测#聚类
2深度学习Pytorch-自动微分--梯度计算、梯度上下文控制(累计梯度、梯度清零)

本文介绍了自动微分的核心概念与实现方法。主要内容包括:1)计算图构建,通过张量运算动态记录依赖关系;2)关键属性如requires_grad控制梯度跟踪,grad存储梯度值;3)反向传播机制,使用backward()计算梯度并应用链式法则;4)梯度计算类型,涵盖标量/向量/矩阵对向量的梯度计算;5)梯度上下文控制,包括no_grad()禁用梯度、梯度累加与清零操作;6)实际应用示例,如雅可比矩阵计

文章图片
#深度学习#pytorch#人工智能
6深度学习Pytorch-神经网络--过拟合欠拟合问题解决(Dropout、正则化、早停法、数据增强)、批量标准化

在机器学习和深度学习中,过拟合(Overfitting)和欠拟合(Underfitting)是模型训练过程中常见的两种问题,直接影响模型的泛化能力(即对未见过的数据的预测能力)。

文章图片
#深度学习#pytorch#神经网络 +1
3深度学习Pytorch-神经网络--全连接神经网络、数据准备(构建数据类Dataset、TensorDataset 和数据加载器DataLoader)

深度学习是机器学习的一个分支,核心是通过多层非线性神经网络自动学习数据的抽象特征,无需人工设计特征。与传统机器学习相比,它能处理更复杂的数据(如图像、文本、语音),且随着数据量和计算能力的提升,性能会显著提高。端到端学习:直接从原始数据学习目标输出层次化特征提取:底层学简单特征(边缘),高层学复杂特征(物体部件)大数据驱动:需要海量训练数据表示学习:自动发现数据的内在表示。

文章图片
#深度学习#pytorch#神经网络 +1
01 conda环境配置及IDE开发环境配置

摘要:本文介绍了Python开发环境的完整配置流程,包括:1)使用Anaconda创建和管理Conda环境(安装、路径配置、环境创建与包管理);2)VSCode配置(安装Python扩展、解释器选择、运行调试及推荐插件);3)PyCharm配置(项目创建、解释器设置、中文插件安装);4)Jupyter环境搭建(安装Jupyter Notebook/Lab及启动方法)。涵盖了从基础环境搭建到IDE配

文章图片
#conda#ide#pycharm +2
    共 23 条
  • 1
  • 2
  • 3
  • 请选择