logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

聊一个有趣的 Unicode 编码和 LLM Tokenization 问题

本次技术分享聚焦于大语言模型(LLM)输入输出中 Unicode 编码不一致的有趣现象。我们深入探讨了 Unicode 规范化(Normalization)的概念,解释了预组合字符和基本字符+组合字符的不同表示方式,以及常见的 NFC、NFD、NFKC 和 NFKD 等规范化形式。随后,我们阐述了为何不同 Unicode 编码的字符串在经过 LLM tokenizer 处理后可能得到相同的结果,关

文章图片
#人工智能#python#计算机视觉
大语言模型推理的强化学习现状

本文以深入浅出的方式,介绍了大语言模型推理中强化学习的最新发展,涵盖推理模型概念定义、RLHF、PPO、GRPO、RLVR 等核心算法与基础概念,分析当前强化学习在推理模型中的应用现状,并对后续研发方向提出推荐与展望,极具参考价值。

文章图片
#语言模型#人工智能#自然语言处理
LLM基础课: 跟着大神 Andrej Karpathy 学习 Byte Pair Encoding

探索Tokenization的神秘世界:了解它如何塑造大型语言模型的理解力,特别是在处理多样化语言时的挑战与策略,揭示了为何LLM处理非英语文本时会遇到困难,以及如何优化这一过程。

文章图片
#学习#人工智能#语言模型 +2
到底了