蓦然回首却已人去楼空个人主页

@jsdoulaoula

蓦然回首却已人去楼空

2022-11-27 14:48:49 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Scientific Computing in Python: Introduction to NumPy and Matplotlib

操作类型能否用offset + 固定 strides描述？结果切片ary[:, 2]✅ 等间距，可以视图(共享内存)❌ 间距不规则，做不到副本(独立内存)根本原因：视图必须依赖"连续内存 + 规则的 strides"来定位元素；而 fancy indexing 用任意的索引列表选取元素，这些元素在内存中通常非连续、非等间距，无法用统一规则表达，因此 NumPy 必须复制数据到一块新内存中。tran

#python #numpy #matplotlib

深度学习进阶：自然语言处理｜4.2.3 QA｜交叉熵、激活函数与 y − t：一套数学框架的三个侧面

本文揭示了神经网络输出层与损失函数设计的统计学本质：它们都是基于最大似然估计（MLE）原理的自然选择。文章首先区分了回归（输出连续值）和分类（输出概率）问题，指出分类任务需要将原始输出转换为概率形式。通过抛硬币案例阐释了MLE的核心思想——寻找使观测结果概率最大的参数。在推导过程中，取对数和负号是为了数值稳定和适配梯度下降优化。最终证明交叉熵损失函数（多分类和二分类）都是从MLE推导而来，其本质是

#深度学习 #自然语言处理 #人工智能

深度学习进阶：自然语言处理｜6.1.4 QA｜L2 范数、梯度裁剪与 L1/L2 正则化详解

L2范数（欧几里得范数）表示向量的直线距离，计算公式为各分量平方和的平方根。例如点(3,4)的L2范数为5（勾股定理）。Lp范数家族包含L1（曼哈顿距离）和L2等不同形式，其中L1为各分量绝对值之和。范数必须使用绝对值，以防止正负分量相互抵消（如x1=100和x2=-100时，不加绝对值会导致总距离计算错误）。图示通过坐标系和数轴直观展示了不同范数的计算方式和几何意义。

#深度学习 #自然语言处理 #人工智能

如何让大语言模型输出JSON格式？

到这里，你已经看到了几种更硬的方案：受限解码、JSON Mode、JSON Schema、function calling。它们能把格式成功率拉得很高，但线上系统里仍然要留一层安全网。原因很简单：输出可能被截断，API可能返回空内容，模型可能拒答，网络可能超时，字段的值也可能不符合业务约束。这层安全网不用写得很玄，核心就是四步：先解析，再校验，失败就重试，最后记录日志。解析负责判断这段文本能不能作

#语言模型 #json #人工智能

【分词：中文分词】BPE字节级分词算法实现汉字表达！

本文深入解析UTF-8编码机制与GPT中文分词原理： UTF-8编码规则详解通过二进制实例解析四种字节类型：0开头（单字节ASCII）、10开头（后续字节）、110开头（双字节前导）、1110开头（三字节前导）完整演示字节流解析过程：01000001→A、11001110 10110001→α、11100100 10111101 10100000→"你" 解释UTF-8天然兼容ASCII的原因

#中文分词 #算法 #java

【分词：BPE算法】白板手推吃透LLM基石原理！

本文详细介绍了NLP中分词（Tokenization）的核心步骤和BPE（Byte Pair Encoding）算法原理。主要内容包括：分词必要性：通过子词分解可大幅压缩词汇量（英语从60万缩减至17-22万），并解决未登录词问题。 BPE算法：通过迭代合并高频相邻字符对构建词汇表。详细演示了3次迭代过程：初始12个单字符词典依次合并最高频对（un→go→fi）最终生成15个元素的词典关

#算法

【转载】RNN模型与NLP应用(1/9)：数据处理基础

本文介绍了机器学习中类别特征的数据处理方法，重点讲解了one-hot编码的原理和应用。首先，文章通过年龄、性别、国籍的例子说明类别特征（如国籍）不能直接用数字表示，因为数字之间的大小比较无意义。正确的做法是使用one-hot编码，将每个类别转换为一个全零向量，并在对应位置设为1。接着，文章以自然语言处理中的文本数据为例，展示了如何通过分词、统计词频和建立字典将单词转换为数值特征，并最终使用one-

#rnn #自然语言处理 #人工智能

【转载】2026，我比较推荐的大模型算法方向

大模型算法方向选择指南：2026年热门赛道解析当前大模型算法领域呈现多元化发展趋势，11个主要方向可分为两个梯队：第一梯队（高需求高增长）：推理能力训练：聚焦开放域奖励设计、长链路稳定性等核心问题，重点关注推理预算分配和对抗奖励破解 Agentic Search：搜索能力内化为模型推理部分，强调检索质量奖励和事实核查 Agent/Tool Use：从单工具调用发展到工具链编排，注重真实环境任

#算法

【转载】如何在不触碰模型权重的情况下超越GRPO

摘要： GEPA提出了一种高效优化复合智能体系统的方法，通过LLM反思完整轨迹而非压缩为标量奖励，显著减少计算量。相比GRPO需数万次rollout，GEPA让反思模型分析失败模式并生成改进提示词，在10-50倍更低计算成本下达到相当或更优效果。其核心是将结构化轨迹反馈转化为自然语言修正，结合帕累托选择保持策略多样性。实验显示，在多跳问答等任务中，GEPA通过优化模块提示词（如第二跳查询策略）使性

#数据库

【转载】如何在不触碰模型权重的情况下超越GRPO

#数据库

共 17 条

请选择