logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI基石 | 微调黑科技:LoRA 与 PEFT —— 让大模型在你的显卡里“翩翩起舞”

LoRA通过训练少量低秩矩阵高效微调大模型,配合QLoRA量化技术,实现在消费级显卡上微调大模型。

文章图片
#人工智能#python
AI基石 | 大模型训练三部曲:预训练、SFT 与 RLHF —— ChatGPT 是如何炼成的?

文章摘要: 大模型训练分为三个阶段: 预训练:通过海量文本学习通识知识,但仅会文字接龙(如预测“床前明月光”的下一个词); 监督微调(SFT):用人工编写的问答数据教会模型遵循指令(如将“你好”翻译成英文),使其从续写转为对话; RLHF:通过人类反馈(如DPO算法)对齐价值观,避免胡说或有害内容。 实际应用中,普通人可通过LoRA技术微调开源模型(如Llama-3),仅调整1%参数即可适配特定任

文章图片
#人工智能#python
AI基石 | 大模型基石:Transformer 架构 —— GPT 是如何“读懂”你的?

Transformer是GPT等大模型的核心架构,通过自注意力机制并行理解上下文,实现智能。

文章图片
#人工智能#transformer
AI基石 | 机器学习基础(二):不以成败论英雄 —— 准确率、F1 分数与 ROC/AUC,谁才是真正的评判标准?

评估机器学习模型需超越准确率,掌握混淆矩阵、精确率、召回率、F1分数及ROC/AUC等多维度指标。

文章图片
#人工智能#机器学习#python
AI基石 | Python工具链(三):PyTorch入门 —— 炼丹炉已开,把 NumPy 扔进显卡里!

PyTorch利用GPU加速计算和自动微分,实现高效神经网络训练,是AI开发的核心框架。

文章图片
#人工智能#python#pytorch
AI基石 | Python工具链(二):NumPy与Pandas —— 拒绝循环,像数学家一样操作矩阵

NumPy向量化运算加速计算,Pandas处理真实数据,共同构建AI数据流水线。

文章图片
#人工智能#python#numpy
AI基石 | 概率统计三剑客:从“神箭手”到“老侦探”,AI 如何看透不确定的世界?

本文深入探讨了AI处理不确定性的三大概率统计工具:分布模型、极大似然估计(MLE)和贝叶斯推理。首先,高斯分布作为核心分布模型,通过μ和σ描述数据的集中趋势与离散程度。MLE通过"眼见为实"原则,选择使观测数据概率最大的参数(如神经网络的损失函数)。

文章图片
#人工智能#傅立叶分析#python
AI基石 | 特征值分解:它是矩阵的“灵魂”,更是大模型 LoRA 微调的基石

特征值分解是矩阵的核心数学工具,揭示了数据的内在结构。通过提取矩阵的特征向量和特征值,可以识别数据变换中的主要方向与能量分布。这一原理在AI领域广泛应用:PCA降维利用协方差矩阵的特征值分解保留关键信息;大模型微调技术LoRA则基于矩阵的低秩特性(源于特征值分布),将巨大参数矩阵分解为小型矩阵乘积,实现高效参数更新。特征值分解从数学理论演变为支撑现代AI技术的重要基石,其"提取主成分"的思想贯穿了

文章图片
#人工智能#机器学习#python
AI基石|力扣48题:Python双解“旋转图像”,解密矩阵背后的智能世界

本文通过力扣48题"旋转图像"探讨了矩阵旋转在AI领域的基础作用。文章介绍了两种解法:辅助矩阵法(O(n²)空间)和原地旋转法(O(1)空间),后者通过转置+水平翻转实现高效旋转。这些技术在计算机视觉、自动驾驶(如特斯拉、Waymo用于图像校正)和医疗影像处理中有广泛应用,是AI系统实现数据增强、提高模型准确性的关键技术。两种方法各具优势,可根据实际场景需求选择,体现了数学基础算法在现代智能系统中

文章图片
#人工智能#leetcode#python
    共 11 条
  • 1
  • 2
  • 请选择