logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

强化学习入门笔记

智能体通过​​试错​​和​​奖励反馈​​不断优化决策策略,以追求​​最大化累积回报​​的方法-RL

文章图片
#人工智能#深度学习
Reinforcement Learning for VLA(强化学习+VLA)

本文探讨了强化学习(RL)与视觉-语言-动作(VLA)模型结合的机器人操控系统。

文章图片
#人工智能#python#机器人 +2
强化学习入门笔记

智能体通过​​试错​​和​​奖励反馈​​不断优化决策策略,以追求​​最大化累积回报​​的方法-RL

文章图片
#人工智能#深度学习
【记录】为ubuntu系统安装显卡驱动后掉网卡驱动

分析解决Ubuntu系统安装NVIDIA显卡驱动后可能出现网卡驱动丢失问题

文章图片
#ubuntu#linux#运维
大模型的分词器——算法及示例

分词是自然语言处理的基础技术,将文本分割为离散单元(如单词、子词或字符)。主流方法包括词级、字符级和子词分词,其中子词分词(如BPE、WordPiece)通过拆分单词平衡了词汇表大小与序列长度。BPE通过频次合并字符对构建词汇表,WordPiece则基于互信息分数优化合并策略。这些方法解决了未知词汇问题,提升了模型效率,广泛应用于GPT、BERT等大型语言模型。分词器的选择需考虑任务需求(单语言/

文章图片
#算法#人工智能#python +1
Reinforcement Learning for VLA(强化学习+VLA)

本文探讨了强化学习(RL)与视觉-语言-动作(VLA)模型结合的机器人操控系统。

文章图片
#人工智能#python#机器人 +2
机器人学导论速览

帮助读者快速浏览机器人学导论内容。

文章图片
#美食#线性代数#科技
到底了