logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

深度学习优化器详解:指数加权平均EWA、动量梯度下降Momentum、均方根传递RMSprop、Adam 从原理到实操

在深度学习模型训练中,“优化器”是决定模型能否快速收敛、避免过拟合、达到最优性能的核心组件。而**指数加权平均(EWA)、动量梯度下降(Momentum)、RMSprop、Adam** 这四个算法,更是贯穿了优化器的发展历程——EWA是基础工具,Momentum解决梯度震荡,RMSprop解决学习率适配,Adam则融合三者优势成为工业界标配。

#深度学习#人工智能
ollama本地化部署deepseek/大模型及其api流式调用

Ollama 是一个轻量级本地大模型运行环境,可以在 Windows / macOS / Linux 上运行主流开源模型。它支持:前往官网:🔗 https://ollama.com/download选择 Windows Installer (.exe) 下载。安装完成后,Ollama 会自动在系统中注册命令行工具 。打开 PowerShell 或 CMD,执行:如果输出版本号(例如 ),说明安装

#语言模型
机器学习周志华学习笔记-第16章<强化学习>

机器学习周志华学习笔记-第16章<强化学习>

文章图片
#机器学习#学习
深度学习RNN详解:原理、变体、应用

在深度学习领域,卷积神经网络(CNN)凭借强大的空间特征提取能力,成为图像、视频等网格结构数据处理的首选;而针对**序列数据**——比如文本、语音、时间序列(股票价格、气象数据),循环神经网络(Recurrent Neural Network, RNN)则占据了核心地位。与CNN的“静态特征提取”不同,RNN最大的优势的是“**记忆性**”,它能利用历史序列信息,捕捉数据中的**时序依赖关系**,

#深度学习#rnn#人工智能
解码AI大模型:从神经网络到落地应用的全景探索

近年来,大语言模型(LLM)以前所未有的速度进入公众视野。从 ChatGPT 到 DeepSeek,从“能聊天”到“能干活”,模型的能力边界不断被刷新。但与此同时,**模型参数**、**Token**、**Embedding**、**自注意力**、**RAG**、**Agent** 等概念,也让不少人产生了一种“看不懂但很厉害”的距离感。

#人工智能#神经网络#深度学习
机器学习与深度学习的分类

机器学习和深度学习各有分类和算法,各自适用于不同的问题。机器学习在特定任务上相对简单、易于解释,但在处理复杂模式时可能表现不佳;而深度学习通过复杂的模型能够处理高维数据,但训练成本高且需要大量数据。选择适当的算法和方法,基于具体的应用场景和数据特点,可以更好地实现问题的解决。

文章图片
#机器学习#深度学习#分类 +1
机器学习周志华学习笔记-第16章<强化学习>

机器学习周志华学习笔记-第16章<强化学习>

文章图片
#机器学习#学习
go语言的日志实现(打印日志、日志写入文件、日志切割)

Go语言内置的log包实现了简单的日志服务。log包定义了Logger类型,该类型提供了一些格式化输出的方法。本包也提供了一个预定义的“标准”logger,可以通过调用函数Print系列(Print|Printf|Println)、Fatal系列(Fatal|Fatalf|Fatalln)、和Panic系列(Panic|Panicf|Panicln)来使用,比自行创建一个logger对象更容易使用

#golang#后端#开发语言
golang软件中的go.mod文件中require内依赖报红

勾选 Enable Go modules integration.在Environment,点击右侧的目录。到此go.mod中的依赖就不会报错了。

#golang
机器学习周志华学习笔记-第16章<强化学习>

机器学习周志华学习笔记-第16章<强化学习>

文章图片
#机器学习#学习
    共 30 条
  • 1
  • 2
  • 3
  • 请选择