logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI大模型40年发展历程与未来统一趋势研究

本文系统梳理了1986-2026年AI大模型40年的发展历程。研究以反向传播算法为起点,划分为早期探索(1986-2005)、深度学习复兴(2006-2016)和大模型时代(2017-2026)三个阶段,详细分析了各时期的关键技术突破(如AlexNet、GAN、Transformer)和应用场景拓展。研究发现模型架构经历了从感知机到Transformer的九次认知跃迁,呈现出参数规模扩大、多模态融

#人工智能#深度学习
零基础大模型微调实战教程(2)微调的三种常见“培训方案“

全参数微调(Full Fine-tuning)就像是让已经大学毕业的学霸重新上一次大学,但这次只学习特定专业的知识。专业术语解释术语解释来源类比参数(Parameters)模型中可调整的数值,决定模型如何处理输入和生成输出源自数学中的"参数"概念,在机器学习中特指模型内部的权重值人类大脑中的"神经连接强度"全参数微调调整模型中的所有参数,让整个模型适应新任务深度学习中的标准微调方法让员工接受全方位

#机器学习#人工智能
GeLU:连接高斯世界与深度学习的“丝滑”激活函数

GeLU激活函数将高斯分布与神经网络巧妙融合,通过概率性激活机制解决了ReLU的硬截断问题。其核心思想是利用输入值的概率来软性调节激活强度,数学上表现为输入值与高斯CDF的乘积。GeLU具有四大优势:1)结合ReLU与Dropout思想;2)处处可导的平滑性;3)零均值激活分布;4)在Transformer架构中表现出色。相比ReLU,GeLU能更好地保留负值信息,缓解神经元死亡问题,同时保持训练

#深度学习#人工智能
Sigmoid函数:神经元的“激活”密码与百年浮沉,一条S型曲线背后的智能演化史

Sigmoid函数:从人口模型到深度学习的演变与局限 摘要:Sigmoid函数起源于1838年韦吕勒的人口增长模型,后在1943年成为MCP神经元的基础。其S型曲线特性(平滑、可微、有界)使其成为神经网络理想的激活函数,尤其适合二分类问题的概率输出。然而在深度学习中,Sigmoid的导数上限(0.25)导致梯度连乘时出现指数级衰减,造成训练停滞。现代神经网络多采用ReLU等替代方案,但Sigmoi

文章图片
#人工智能
详解感知机(Perceptron)模型:机器学习的第一个里程碑

罗森布拉特在1958年写道:“感知机不是机器智能的最终答案,而是理解脑功能的起点。感知机的出现在冷战时期引起轰动,《纽约时报》报道称其为“海军研制的电子大脑雏形,能够行走、说话、观看、书写并自我复制”。感知机模型告诉我们:真正的创新往往不是一蹴而就的完美解决方案,而是开启新探索的第一把钥匙。1969年,马文·明斯基和西摩·帕普特在《感知机》一书中严格证明了单层感知机无法解决线性不可分问题,最著名的

文章图片
#机器学习#人工智能
神经网络的时序建模分支发展脉络(1960s-至今)

摘要 神经网络时序建模经历了从静态到动态、从简单到复杂的演进过程。1960年代,带延迟的感知机首次引入时序信息,但依赖人工设定步长;1980年代,霍普菲尔德网络和玻尔兹曼机分别通过反馈结构和概率建模为RNN奠定基础;1986年Elman/Jordan网络正式提出循环连接结构,实现动态时序建模;1997年双向RNN解决上下文依赖问题,LSTM通过门控机制攻克梯度消失难题;2014年GRU进一步简化结

#神经网络#人工智能#深度学习
机器学习在预测性分析中的应用实践:聚焦设备剩余寿命预测

机器学习,尤其是深度学习,已成为驱动预测性分析发展的核心引擎。在设备剩余寿命预测等关键工业场景中,它通过端到端学习复杂退化模式,提供了超越传统方法的精度与适用性。成功实践离不开对业务逻辑的深刻理解、对数据质量的严格把控、对模型选型与优化的科学决策,以及最终形成的**“预测-决策-执行-反馈”业务闭环**。小样本与零样本学习:利用迁移学习、元学习、领域自适应(如专利中提到的机理-数据域自适应对抗神经

#机器学习#人工智能
零基础也能懂的机器学习核心概念解读

本文用通俗易懂的类比系统讲解了机器学习核心概念:1)机器学习是让计算机从数据中自主学习的学科;2)监督/无监督/半监督/强化学习对应不同的学习模式;3)训练/验证/测试集类比备考练习册/模拟卷/高考卷;4)特征维度与标签的关系;5)模型、参数与超参数的区别;6)过拟合与欠拟合现象;7)损失函数与优化器的配合机制;8)梯度下降的工作原理。全文通过生活化的比喻(如训练小狗、学生备考、空调调温等),帮助

#机器学习#人工智能
项目1-F:手写体识别系统handwriting_ocr_system的深度学习系统_基于CRNN与TrOCR的文本识别模型训练

在完成了文本检测之后,识别每个文本框内的手写文字是中小学试卷自动批改系统的第二个核心环节。与印刷体OCR不同,手写体识别面临三大独特挑战:考虑到中小学试卷场景中需要平衡准确率、速度和部署成本,我们采用渐进式策略:本文重点介绍CRNN和TrOCR的完整训练流程。我们已经通过DBNet检测获得了文本框坐标,现在需要构建用于识别的文本行图像数据集。2.2 文本行图像标准化处理为了提升模型训练效果,需要对

#深度学习#人工智能#opencv +1
《低压配电数字化转型实战指南》9:数字配电多场景转型案例库

三个案例折射出转型共性——工业场景拼“精准度”,乡村场景讲“性价比”,城市场景重“系统级”。未来3年,“AI+数字孪生”将成为跨场景标配,而“数据资产化”(如碳排数据交易、负荷预测服务)会催生新商业模式,单纯卖设备的企业迟早被淘汰。“转型没有‘万能模板’——车间的故障定位、乡村的产业赋能、城市的碳排管控,得靠场景化方案‘对症下药’。2023年的广州面临双重压力:作为人口近两千万的超大城市,新能源汽

    共 273 条
  • 1
  • 2
  • 3
  • 28
  • 请选择