留白^_^ 个人主页

@qq_46106826

留白^_^

2022-11-30 21:17:48 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Python数据分析 --- Numpy库

本文系统介绍了NumPy数组的核心操作，主要涵盖以下内容：1）数组创建方法，包括从列表/元组转换、使用arange/linspace生成序列、随机数生成以及文件读写；2）数组属性统计，包括尺寸、最值、分位数等计算；3）形状变换操作，如reshape、转置、升维降维等；4）数组分解与组合，包括切片索引、拼接拆分等；5）条件筛选与抽样；6）矩阵运算与广播机制；7）通用函数(ufunc)及其方法；8）N

#python #数据分析 #numpy

大模型强化学习总结

本文介绍了如何将强化学习应用于基础语言模型以提升其推理能力。首先定义了关键概念：策略（语言模型生成token的概率分布）、状态（当前文本前缀）、动作（下一个token）和轨迹（状态-动作序列）。在数学推理等任务中，奖励通常仅在最终步骤赋值（1表示正确，0错误）。策略梯度算法（如REINFORCE）通过最大化期望回报来优化模型参数，利用轨迹回报调整动作概率。进一步引入Actor-Critic算法，通

#人工智能 #nlp

强化学习（长篇）一窥

强化学习核心概念与算法概述强化学习(RL)是智能体通过与环境交互学习最优策略以最大化累计奖励的机器学习方法。本文介绍了RL的基本框架和关键概念：核心要素：智能体在未知环境中通过状态(s)、动作(a)、奖励(r)和转移概率(P)进行交互，目标是学习最优策略π和价值函数V/Q。马尔可夫决策过程：RL问题通常建模为MDP，具有马尔可夫性质（未来仅依赖当前状态）。关键概念：包括模型（环境描述）、策

#深度学习

意图识别的重要性

意图识别是对话系统的核心技术，旨在从用户输入中判断其目的。它能有效引导对话流程、提升交流效率并优化用户体验。单轮意图识别主要有5种方案：基于规则匹配、向量检索、深度学习模型、大语言模型（采用零样本或微调方法）以及多种方案的融合技术。多轮意图识别则需结合对话上下文，通过语义分割和大模型优化来处理意图转变问题。实际应用中往往需要综合运用多种技术，平衡准确率、业务需求和实施效率。

#python

CLIP学习总结

作者使用Prompt Template的方法，作者将ImageNet的一千个类，通过 Prompt Template（A photo of a {label}）变为一千个句子，通过预训练的文本编码器抽取文本的特征，一张图片通过图像编码器获得图像的特征，然后与文本特征使用余弦相似度计算相似性。CLIP的输入是图片和与之配对的文本对，如果有N张图片，经过图像编码器，获得N个图像特征向量，同样地，文本经

#学习 #机器学习 #人工智能

大模型强化学习总结

#人工智能 #nlp

到底了