thomas20 个人主页

@thomas20

thomas20

2023-10-12 15:32:49 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

聊一个有趣的 Unicode 编码和 LLM Tokenization 问题

本次技术分享聚焦于大语言模型（LLM）输入输出中 Unicode 编码不一致的有趣现象。我们深入探讨了 Unicode 规范化（Normalization）的概念，解释了预组合字符和基本字符+组合字符的不同表示方式，以及常见的 NFC、NFD、NFKC 和 NFKD 等规范化形式。随后，我们阐述了为何不同 Unicode 编码的字符串在经过 LLM tokenizer 处理后可能得到相同的结果，关

#人工智能 #python #计算机视觉

大语言模型推理的强化学习现状

本文以深入浅出的方式，介绍了大语言模型推理中强化学习的最新发展，涵盖推理模型概念定义、RLHF、PPO、GRPO、RLVR 等核心算法与基础概念，分析当前强化学习在推理模型中的应用现状，并对后续研发方向提出推荐与展望，极具参考价值。

#语言模型 #人工智能 #自然语言处理

LLM基础课: 跟着大神 Andrej Karpathy 学习 Byte Pair Encoding

探索Tokenization的神秘世界：了解它如何塑造大型语言模型的理解力，特别是在处理多样化语言时的挑战与策略，揭示了为何LLM处理非英语文本时会遇到困难，以及如何优化这一过程。

#学习 #人工智能 #语言模型 +2

到底了