路人与大师个人主页

@weixin_41046245

路人与大师

2022-11-25 17:35:15 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

位置编码显微镜：Sinusoidal、Learned、Relative、RoPE、ALiBi 到底改了哪一步

最早：位置是输入的附加标签后来：位置变成 token pair 的关系项再后来：位置直接变成 q/k 的几何变换或者：位置直接变成 score 的显式 bias所以真正的问题不是：哪个位置编码“更高级”而是：你希望位置信息在模型中的哪个层级起作用。输入级属性，用 Sinusoidal / Learned关系级变量，用 Relative Position内核级几何，用 RoPElogit 级先验，用

#人工智能

[深度架构] 拒绝 Prompt 爆炸：LLM Skills 的数学本质与“上下文压缩”工程论

在 LLM（大语言模型）应用落地的深水区，开发者往往会陷入“上下文陷阱”：试图通过超长 Context Window 解决所有数据检索问题。本文从 Transformer 的注意力机制瓶颈出发，结合实际的 Excel 数据处理场景，深度剖析了Skills（技能/工具）机制的本质。文章论证了 Skills 并非高级的 Prompt 技巧，而是一种将“数据空间”映射为“语义空间”的降维手段。通过和语义

#架构 #android

拆解 Moltbot：一个”本地优先”的 AI 助手，到底是怎么跑起来的？

返回一个 runId，不阻塞 - 之后通过事件流推送：stream:assistant（文字增量）、stream:tool（工具调用过程） - 最后必须收敛到 lifecycle:end 或 lifecycle:error——不会”悬挂”一个反直觉的事实：sandbox 下 skill 虽然”可见”（通过了 gating），但如果容器里没有对应的二进制，执行还是会失败。gating 只管”暴露”，

#人工智能

Sub-agent（子智能体）和 Skills（技能/工具）的界限可以通过“自主性”和“上下文管理”这两个核心维度来清晰区分

Skills (技能/Tools): 是“工具箱里的锤子”它是被调用的原子能力，通常是确定性的或者是单步的。它本身没有“脑子”（推理能力），不知道为什么要用自己，只负责接受输入，产出输出。ReadFile()。Agent 觉得需要搜索 -> 调用 Search Skill -> 获得结果。Sub-agent (子智能体): 是“外包团队的专员”它是一个具有独立推理能力的实体，负责处理一个完整的子任

#人工智能

[特殊字符] 专题白皮书：《认知重构：大模型智能体驱动下的下一代网安攻防》

— 为什么你越学越焦虑？—— 传统网安学习模式的数学性崩溃—— 从蒙特卡洛搜索看渗透测试的本质—— LLM、ReAct 范式与 Agent 架构详解—— CTEM、SOAR 与 SOC 的智能化重塑—— 从 Prompt 到 Function Calling 的代码实战—— 网安人的职业终局：从“做题家”到“架构师”

#重构

llama factory lora 微调 qwen2.5 7B Instruct模型

项目背景甲方提供一台三卡4080显卡需要进行qwen2.5 7b Instruct模型进行微调。以下为整体设计。要使用对进行，流程与之前提到的模型类似。LoRA 微调是一种高效的微调方法，通过低秩适配器层来调整预训练模型的权重，而不是全量训练整个模型。

2025年 6月面试经验总结生成式语言模型岗位

本文摘要： PyTorch Dataset深度解析：从基础到高级实践设计哲学核心价值在于数据加载与模型训练的解耦支持懒加载机制，节省内存资源为PyTorch生态系统提供标准化接口 Map-Style实现详细演示图像分类任务的数据集构建重点讲解__init__索引设计、__getitem__懒加载机制强调transform参数化设计和异常处理机制 Iterable-Style应用对比

#面试

for albert tiny 训练最快速高精准度的语言模型albert工程化实现

首先感谢实在智能提供的ALbert tiny的预训练语言模型，本实验包含四种albert模型的表现，以及四种bert模型在分类任务中的表现。brightmart/albert_zh下面是roberta的语言模型。brightmart/roberta_zh之前的文章因为个人加了推广信息，所以被知乎封掉了。但是这确实是因为我知识分享的时候做了不应该做的事情，向知乎道歉。个人分享知识的初...

#自然语言处理

热门大型语言模型（LLM）应用开发框架

这些框架各有侧重，但目标都是为了让开发者更高效地利用 LLM 的强大能力。

#语言模型 #人工智能 #自然语言处理

paddle nlp taskflow 全家桶包括代码生成与AIGC图片生成一起探索paddle nlp 开包即用的能力吧

paddle nlp开箱即用的能力大全。可以进行代码生成与AIGC文本生成图片的能力。大家赶紧来试试吧！！！

#自然语言处理 #paddle #AIGC

共 86 条

请选择