logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

GeLU:连接高斯世界与深度学习的“丝滑”激活函数

GeLU激活函数将高斯分布与神经网络巧妙融合,通过概率性激活机制解决了ReLU的硬截断问题。其核心思想是利用输入值的概率来软性调节激活强度,数学上表现为输入值与高斯CDF的乘积。GeLU具有四大优势:1)结合ReLU与Dropout思想;2)处处可导的平滑性;3)零均值激活分布;4)在Transformer架构中表现出色。相比ReLU,GeLU能更好地保留负值信息,缓解神经元死亡问题,同时保持训练

#深度学习#人工智能
机器学习053:深度学习【经典神经网络】Transformer -- BERT、GPT与ViT

Transformer架构及其衍生模型(如BERT、GPT和ViT)正在推动人工智能的革命性发展。这些模型通过自注意力机制实现了对文本和图像的深度理解与生成,打破了传统序列处理的限制。BERT擅长上下文理解,GPT专注于文本生成,ViT则将Transformer应用于视觉领域。尽管这些模型在搜索、翻译、医疗等领域表现出色,但仍面临计算资源消耗大、数据需求高和可解释性差等挑战。随着技术进步,Tran

文章图片
#机器学习#深度学习#神经网络 +3
机器学习061:深度学习【模型训练】手把手教你三道“炼丹”必备技巧:梯度裁剪(解决梯度爆炸),迁移学习(预训练模型微调 ), 多任务学习

梯度裁剪是训练的稳定器,防止学习过程因“冲动”而崩溃。迁移学习是知识的接力棒,让AI能够继承前人的智慧,快速适应新领域。多任务学习是能力的催化剂,通过关联任务塑造AI更强大、更通用的理解力。对于初学者,理解这些技巧背后的“为什么”(解决什么问题)和“是什么”(核心思想),远比记忆数学公式和代码细节更重要。当你未来真正开始构建自己的AI项目时,你会知道,在训练遇到瓶颈时,工具箱里有哪些趁手的“法宝”

#机器学习#深度学习#迁移学习
机器学习048:深度学习【经典神经网络】门控循环单元(GRU)-- 像人类一样学会“忘记”与“记住”的智能网络

摘要: 门控循环单元(GRU)是循环神经网络(RNN)的高效改进版,擅长处理时序数据(如语音、文本)。它通过更新门和重置门动态管理记忆,选择性地保留重要信息,解决了传统RNN的长程依赖问题。GRU结构比LSTM更简洁,训练更快,适用于机器翻译、语音识别、股票预测等任务,但在超长序列和并行计算上仍有局限。实际应用中,GRU已用于智能输入法、同声传译和视频分析等领域。示例代码展示了如何用PyTorch

文章图片
#机器学习#深度学习#神经网络
机器学习056:深度学习【数据预处理】归一化/标准化, 数据增强(图像:裁剪/旋转;文本:分词/掩码),数据集划分:训练集/验证集/测试集

数据预处理是AI模型训练前的关键步骤,如同烹饪前的备菜过程。本文系统介绍了数据预处理的三大核心技法:1)归一化与标准化,解决不同特征量纲差异问题;2)数据增强,通过变换扩充训练样本;3)数据集划分,合理分配训练集、验证集和测试集。文章还分析了预处理的局限性,指出其无法解决数据本质质量差等问题,并列举了手机相册分类、智能客服等实际应用案例。最后通过Python代码示例展示了房价预测数据的预处理流程。

#机器学习#深度学习#人工智能
XGW-9000系列高端新能源电站边缘网关软件架构设计

XGW-9000系列新能源电站边缘网关是电站智能化的核心设备,具备"采集-计算-控制-协同"一体化功能。该产品支持200+设备节点接入,100次/秒高速采集,50+工业协议转换,集成6TOPS AI算力实现功率预测和故障诊断。关键性能包括:AGC响应≤100ms,5G通信时延≤10ms,本地数据处理率≥90%,支持断网自治和云边协同。网关采用RK3588处理器,配置8GB内存和

文章图片
#人工智能#物联网
碳化硅为啥能成“功率芯片新贵”?

碳和硅原子交替成键,搭出金刚石级的坚固骨架,让它耐高温、抗高压;大禁带宽度和高电子迁移率,让电子“越狱难、跑得快”,导电效率高、能耗低;从天然矿物到芯片材料,它用100多年的沉淀,证明了“互补合作”和“慢工细活”的价值。碳化硅的崛起,不仅是材料科学的进步,更是对“合作”与“坚持”的最好诠释——就像碳和硅的携手,平凡的元素也能创造出改变世界的力量;就像它的生长过程,默默沉淀,终会绽放光芒。

MQTT教训(二)MQTT物联网中Keep Alive值的那些坑

Keep Alive值的设置,本质上是物联网系统"可用性"与"经济性"的平衡艺术。过小的取值会让设备"累死"(功耗过高),过大的取值会让系统"变瞎"(离线检测滞后)。记住:没有放之四海而皆准的配置,只有贴合业务场景的权衡。在实际工程中,建议从"网络特性"和"设备角色"两个维度出发,结合本文的配置方案进行测试调优,必要时甚至可以实现动态调整(如设备根据信号强度实时修改Keep Alive值)。最后,

#物联网
机器学习030:无监督学习【聚类算法】-- 四种聚类算法的生活化指南

K-means:像高效的城市规划师,快速把城市分成几个区,但要求区是圆形的,且你要提前告诉他分几个区。DBSCAN:像流行病调查员,从核心病例出发,通过密度扩散找到所有关联者,还能识别出孤立的异常病例。层次聚类:像族谱编纂者,帮你理清从个人到家族的多层关系,可以看到完整的演化路径。谱聚类:像社交关系分析师,通过计算人与人之间的连接强度,发现真正的朋友圈,即使他们在物理位置上不靠近。一句话概括:聚类

文章图片
#机器学习#算法#学习 +1
机器学习059:深度学习【学习率策略】学习率衰减与余弦退火

学习率衰减是“稳健的匀速减速”,余弦退火是“灵活的冲刺-休息循环”。

#机器学习#深度学习#学习 +1
    共 246 条
  • 1
  • 2
  • 3
  • 25
  • 请选择