logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

位置编码显微镜:Sinusoidal、Learned、Relative、RoPE、ALiBi 到底改了哪一步

最早:位置是输入的附加标签后来:位置变成 token pair 的关系项再后来:位置直接变成 q/k 的几何变换或者:位置直接变成 score 的显式 bias所以真正的问题不是:哪个位置编码“更高级”而是:你希望位置信息在模型中的哪个层级起作用。输入级属性,用 Sinusoidal / Learned关系级变量,用 Relative Position内核级几何,用 RoPElogit 级先验,用

#人工智能
[深度架构] 拒绝 Prompt 爆炸:LLM Skills 的数学本质与“上下文压缩”工程论

在 LLM(大语言模型)应用落地的深水区,开发者往往会陷入“上下文陷阱”:试图通过超长 Context Window 解决所有数据检索问题。本文从 Transformer 的注意力机制瓶颈出发,结合实际的 Excel 数据处理场景,深度剖析了Skills(技能/工具)机制的本质。文章论证了 Skills 并非高级的 Prompt 技巧,而是一种将“数据空间”映射为“语义空间”的降维手段。通过和语义

#架构#android
拆解 Moltbot:一个”本地优先”的 AI 助手,到底是怎么跑起来的?

返回一个 runId,不阻塞 - 之后通过事件流推送:stream:assistant(文字增量)、stream:tool(工具调用过程) - 最后必须收敛到 lifecycle:end 或 lifecycle:error——不会”悬挂”一个反直觉的事实:sandbox 下 skill 虽然”可见”(通过了 gating),但如果容器里没有对应的二进制,执行还是会失败。gating 只管”暴露”,

文章图片
#人工智能
Sub-agent(子智能体) 和 Skills(技能/工具) 的界限可以通过“自主性”和“上下文管理”这两个核心维度来清晰区分

Skills (技能/Tools): 是“工具箱里的锤子”它是被调用的原子能力,通常是确定性的或者是单步的。它本身没有“脑子”(推理能力),不知道为什么要用自己,只负责接受输入,产出输出。ReadFile()。Agent 觉得需要搜索 -> 调用 Search Skill -> 获得结果。Sub-agent (子智能体): 是“外包团队的专员”它是一个具有独立推理能力的实体,负责处理一个完整的子任

#人工智能
[特殊字符] 专题白皮书:《认知重构:大模型智能体驱动下的下一代网安攻防》

— 为什么你越学越焦虑?—— 传统网安学习模式的数学性崩溃—— 从蒙特卡洛搜索看渗透测试的本质—— LLM、ReAct 范式与 Agent 架构详解—— CTEM、SOAR 与 SOC 的智能化重塑—— 从 Prompt 到 Function Calling 的代码实战—— 网安人的职业终局:从“做题家”到“架构师”

#重构
llama factory lora 微调 qwen2.5 7B Instruct模型

项目背景 甲方提供一台三卡4080显卡 需要进行qwen2.5 7b Instruct模型进行微调。以下为整体设计。要使用对进行,流程与之前提到的模型类似。LoRA 微调是一种高效的微调方法,通过低秩适配器层来调整预训练模型的权重,而不是全量训练整个模型。

文章图片
2025年 6月面试 经验总结 生成式语言模型岗位

本文摘要: PyTorch Dataset深度解析:从基础到高级实践 设计哲学 核心价值在于数据加载与模型训练的解耦 支持懒加载机制,节省内存资源 为PyTorch生态系统提供标准化接口 Map-Style实现 详细演示图像分类任务的数据集构建 重点讲解__init__索引设计、__getitem__懒加载机制 强调transform参数化设计和异常处理机制 Iterable-Style应用 对比

#面试
for albert tiny 训练最快速高精准度的语言模型albert工程化实现

首先感谢实在智能提供的ALbert tiny的预训练语言模型,本实验包含四种albert模型的表现,以及四种bert模型在分类任务中的表现。brightmart/albert_zh下面是roberta的语言模型。brightmart/roberta_zh之前的文章因为个人加了推广信息,所以被知乎封掉了。但是这确实是因为我知识分享的时候做了不应该做的事情,向知乎道歉。个人分享知识的初...

#自然语言处理
热门大型语言模型(LLM)应用开发框架

这些框架各有侧重,但目标都是为了让开发者更高效地利用 LLM 的强大能力。

#语言模型#人工智能#自然语言处理
paddle nlp taskflow 全家桶 包括代码生成与AIGC图片生成 一起探索paddle nlp 开包即用的能力吧

paddle nlp开箱即用的能力大全。可以进行代码生成与AIGC文本生成图片的能力。大家赶紧来试试吧!!!

文章图片
#自然语言处理#paddle#AIGC
    共 86 条
  • 1
  • 2
  • 3
  • 9
  • 请选择