木本863 个人主页

@weixin_74181752

木本863

2023-05-12 10:46:11 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

强化学习入门笔记

智能体通过试错和奖励反馈不断优化决策策略，以追求最大化累积回报的方法-RL

#人工智能 #深度学习

Reinforcement Learning for VLA(强化学习+VLA)

本文探讨了强化学习（RL）与视觉-语言-动作（VLA）模型结合的机器人操控系统。

#人工智能 #python #机器人 +2

强化学习入门笔记

智能体通过试错和奖励反馈不断优化决策策略，以追求最大化累积回报的方法-RL

#人工智能 #深度学习

联邦学习研究方向及论文推荐（二）

第二篇联邦学习论文推荐。

#人工智能 #深度学习 #分布式 +3

【记录】为ubuntu系统安装显卡驱动后掉网卡驱动

分析解决Ubuntu系统安装NVIDIA显卡驱动后可能出现网卡驱动丢失问题

#ubuntu #linux #运维

大模型的分词器——算法及示例

分词是自然语言处理的基础技术，将文本分割为离散单元（如单词、子词或字符）。主流方法包括词级、字符级和子词分词，其中子词分词（如BPE、WordPiece）通过拆分单词平衡了词汇表大小与序列长度。BPE通过频次合并字符对构建词汇表，WordPiece则基于互信息分数优化合并策略。这些方法解决了未知词汇问题，提升了模型效率，广泛应用于GPT、BERT等大型语言模型。分词器的选择需考虑任务需求（单语言/

#算法 #人工智能 #python +1

Reinforcement Learning for VLA(强化学习+VLA)

本文探讨了强化学习（RL）与视觉-语言-动作（VLA）模型结合的机器人操控系统。

#人工智能 #python #机器人 +2

机器人学导论速览

帮助读者快速浏览机器人学导论内容。

#美食 #线性代数 #科技

到底了