logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

强化学习:贝尔曼方程

在推导之前,我们要把刚才的直觉翻译成数学语言。StS_tSt​ttt时刻的状态。AtA_tAt​: 在状态StS_tSt​采取的动作。Rt1R_{t+1}Rt1​: 执行动作后,环境给的即时奖励(注意下标通常是 t+1,因为是动作发生后得到的)。γ\gammaγ: 折扣因子,范围01[0, 1]01,防止未来无限收益导致数值爆炸。GtG_tGt​回报(Return)。这是最重要的概念,代表从ttt

#人工智能
强化学习:贝尔曼方程

在推导之前,我们要把刚才的直觉翻译成数学语言。StS_tSt​ttt时刻的状态。AtA_tAt​: 在状态StS_tSt​采取的动作。Rt1R_{t+1}Rt1​: 执行动作后,环境给的即时奖励(注意下标通常是 t+1,因为是动作发生后得到的)。γ\gammaγ: 折扣因子,范围01[0, 1]01,防止未来无限收益导致数值爆炸。GtG_tGt​回报(Return)。这是最重要的概念,代表从ttt

#人工智能
RTX 4090、A100与H100 GPU三款热门显卡性能深度剖析

对于动辄数百亿参数的大型模型而言,显存带宽和容量是比峰值算力更为关键的瓶颈。:出人意料的是,在 16 位非稀疏算力上,RTX 4090(330 TFLOPS)凭借更新的 Tensor Core 架构和更高的频率,其原始计算能力甚至略微超过了 A100(312 TFLOPS)。具体而言,在一个由 4 个权重构成的细粒度向量中,如果其中 2 个被置零,Tensor Core 硬件就能动态识别此模式,并

#人工智能
强化学习:贝尔曼方程

在推导之前,我们要把刚才的直觉翻译成数学语言。StS_tSt​ttt时刻的状态。AtA_tAt​: 在状态StS_tSt​采取的动作。Rt1R_{t+1}Rt1​: 执行动作后,环境给的即时奖励(注意下标通常是 t+1,因为是动作发生后得到的)。γ\gammaγ: 折扣因子,范围01[0, 1]01,防止未来无限收益导致数值爆炸。GtG_tGt​回报(Return)。这是最重要的概念,代表从ttt

#人工智能
markdown中的花写字母公式表达

markdown中的花写字母公式表达\mathcal{A}

人类交互1 大脑视觉的处理过程

视觉是人类和动物通过眼睛感知外界环境中的光线信息的过程。这包括接收、处理和解释光线信息,以便理解周围世界中的物体、颜色、形状和运动等。视觉是我们最重要的感觉之一,为我们提供了丰富的信息,帮助我们导航环境、识别物体、沟通和享受美感。视觉的意义在于它是我们感知世界的主要方式之一。通过视觉,我们能够看到物体的形状、颜色和大小,感知物体之间的相对位置和距离,识别人脸、表情和动作,以及观察周围环境中的变化。

文章图片
#人工智能
Kimi K2 系列大模型:1万亿参数 MoE 架构的技术演进与版本解析

月之暗面(Moonshot AI)发布的 Kimi K2 系列模型,代表了当前国产大模型在混合专家模型(MoE)架构与强化学习推理领域的最新进展。该系列通过 Kimi-k2-instruct 与 Kimi-k2-thinking 两个版本,实现了高效能通用对话与深度逻辑推理的双重覆盖。

#架构
python 读取csv数据文件 绘画折线图 表格数据处理 输出csv文件 模板套用数据分析

主要功能就是读取csv文件获得一组x,y数据,简单处理后进行画图,然后不断分析,最后输出csv表格。比如,分析某段时间价格波动幅度,可以先用券商或经纪商的接口不断获取数据存储到csv文件,然后利用python读取数据,进行必要的数据分割处理,绘画图像找到需要的特征,图像得到结果后,改代码输出csv数据。我写这个代码主要做金融市场流动性分析,就是某时段某价格区间能够承受的资金量统计分析以及卖价买价差

文章图片
#python#数据分析#开发语言
Pytorch-03 数据集与数据加载器

在 PyTorch 中,数据集和数据加载器是用于有效加载和处理数据的重要组件,特别是在训练深度学习模型时。

文章图片
#pytorch#人工智能#python
大型模型运行过程概述

和。这两个过程有着不同的目标、资源需求和技术挑战。大模型的训练是一个复杂且资源密集的过程,它首先需要收集和准备大量的高质量数据,这些数据经过清洗和预处理后将被用来指导模型学习。在模型设计阶段,工程师们会选择或开发适合任务需求的神经网络架构,对于大型语言模型来说,这通常意味着采用深度多层的解码器结构如Transformer。初始化之后,模型开始接受数据输入,在前向传播过程中生成预测输出,并通过损失函

文章图片
#人工智能
    共 34 条
  • 1
  • 2
  • 3
  • 4
  • 请选择