roman_日积跬步-终至千里个人主页

@hiliang521

roman_日积跬步-终至千里

2022-11-15 14:58:47 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

【人工智能基础】生成模型：让数据“无中生有”的神奇魔法

#人工智能

【AI Engineering】什么是Agent？如何构建和评估AI Agent？

#人工智能

【强化学习基础（2）】被动强化学习：学习价值函数

被动强化学习（Passive Reinforcement Learning）是指智能体有一个固定的策略π(s)，它按照这个策略行动，学习状态的价值函数U(s)。价值函数表示"从状态s开始，按照策略π，期望能获得多少累积奖励"。在被动学习中，智能体不知道环境的转移模型P(s’|s, a)和奖励函数R(s, a, s’)。它只能通过观察来学习：执行动作，观察结果状态和奖励，然后更新对状态价值的估计。这

#学习

【计算机算法与设计（7）】Dijkstra/Bellman-Ford 等最短路算法，理解其特性

【计算机算法与设计】Dijkstra/Bellman-Ford 等最短路算法，理解其特性

#算法

【大模型应用开发极简入门】提示工程一：1. 通过context、task、role文本结构设计有效的提示词、 2. OpenAI的提示词任务示例

【大模型应用开发极简入门】提示工程一：通过上下文、任务、角色的结构设计有效的提示词与OpenAI的任务示例

【大模型应用开发极简入门】提示工程二：零样本学习、少样本学习与改善提示效果

#学习 #人工智能

【AI for Energy】论文分析：ChatBattery——LLM引导的电池材料发现方法

决策树

反向传播算法（英：Backpropagation algoritmm，简称：BP算法）是一种监督学习算法，常被用来训练多层感知机。于1974年，**Paul Werbos首次给出了如何训练一般网络的学习算法，**而人工神经网络只是其中的特例。不巧的是，在当时整个人工神经网络社群中却无人知晓Paul所提出的学习算法。直到80年代中期，David Rumelhart、Geoffrey Hinton、R

#人工智能

共 54 条

请选择