logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Function Calling(工具调用)深入到工程落地中的极端边界情况(Corner Cases)。资深的实战经验。

Function Calling 是大语言模型(LLM)从“被动知识库”进化为“主动执行引擎”的决定性能力。它允许模型在生成文本的过程中,智能地识别出“我什么时候不知道答案”或者“我什么时候需要采取行动”,从而暂停文本生成,转而严格按照开发者预先定义的接口规范(Schema),输出可以直接被代码解析、执行的结构化参数(通常是 JSON 格式)。打个比方:如果 LLM 是一个被关在小黑屋里的超级大脑

文章图片
大模型与 Agent 智能体工程师面试指南:Prompt Engineering 核心解析

作为算法工程师或 AI 应用开发者,在实际的工业落地(如边缘设备部署、复杂机器人协同、Agent 架构设计)中,Prompt 绝不仅仅是“和 AI 聊天”,它是用自然语言进行系统编程的过程。在传统的认知中,Prompt Engineering(提示词工程)往往被简单理解为“如何高情商地和 AI 聊天”🗣️。但对于大模型算法工程师和 AI 应用开发者而言,它本质上是一种面向非确定性系统(LLM)的

文章图片
大模型算法工程师、Agent智能体工程师、AI应用架构师的求职者准备的系统设计深度指南

工业级的会议总结系统绝不仅仅是“调个大模型 API”。它是一条横跨数字信号处理(DSP)、语音识别(ASR)、聚类算法到大模型长文本处理的极长链路。代码段fill:#333;important;important;fill:none;color:#333;color:#333;important;fill:none;fill:#333;height:1em;🎤 原始会议音频 (长达3小时)✂️

文章图片
面向大模型算法与 AI 智能体(Agent)应用工程师岗位的 Python 基础与工程实践面试指南

数据结构核心查询 x in obj尾部追加 Add/Append内存开销级别线程安全 (GIL下)ListONO(N)ON(需线性遍历)O1O(1)O1(均摊)中等 (存在超额分配)非绝对安全TupleONO(N)ON(需线性遍历)不支持极低(大小固定)读操作绝对安全DictO1O(1)O1(哈希计算)O1O(1)O1(均摊)较高 (哈希表空间换时间)非绝对安全SetO1O(1)O1(哈希计算)O

文章图片
撕裂大模型的“记忆短视”:深度拆解 COS-PLAY 协同演化 Agent 架构

高级的智能不仅需要聪明的脑子去执行,更需要理性的机制去复盘。无论是将它与 PPO 和课程学习结合去挑战物理极限,还是将其拆分部署到 RK3588 与 ROS 生态中打造真实的机器人大脑,亦或是让它自动生成精美的学术拓扑图,读懂并吃透这种 Manager-Worker(管理者-打工人)的系统架构,你就能真正站在 Agent OS 时代的最前沿,掌握从学术界走向工业级落地的破局密码。

文章图片
彻底驯服小模型!SOD 步级蒸馏算法深度解析:让 7B 模型拥有顶级 Agent 智商的“动态调教术”

对于研究生或硬核开发者,我们必须深入到 Loss 函数。传统的蒸馏损失函数在整条轨迹上的权重是相等的(即权重wt1w_t = 1wt​1LSOD∑t1Twt⋅DKLπteacherat∣st∣∣πstudentat∣stLSOD​t1∑T​wt​⋅DKL​πteacher​at​∣st​∣∣πstudent​at​∣。

文章图片
告别暴力拉长上下文!揭秘 δ-mem:用 8×8 矩阵让大模型拥有“永动记忆”

δ-mem》用极其克制的工程哲学告诉我们,大模型时代的终极赢家,不一定属于那些有无限预算去“堆算力、卷上下文”的巨头。在百亿参数的钢铁丛林中,精巧的数据结构(如O1O(1)O1的状态矩阵)和经典的计算机科学算法(如在线学习、进程隔离),依然能打出四两拨千斤的降维打击。告别盲目的显存焦虑,抛弃低效的“全文背诵”。作为新时代的 AI 工程师与研究者,是时候去拥抱这种更聪明、更轻量、更具极客精神的“动态

文章图片
经典深度学习核心常识到大模型时代的底层原理面试指南

交叉熵(Cross-Entropy)*用于衡量两个概率分布之间的差异。在分类任务中,它负责测量模型的*预测概率分布 ppp 与真实标签分布 yyy** 之间的“距离”。其本质源自信息论:交叉熵越小,模型对世界的预测就越精准。对于多分类任务,单个样本的交叉熵损失公式为:L=−∑c=1Myclog⁡(pc)L = -\sum_{c=1}^{M} y_c \log(p_c)L=−c=1∑M​yc​log

文章图片
#机器学习#深度学习
大模型算法工程师、Agent智能体工程师、AI应用架构师的求职者准备的系统设计深度指南

工业级的会议总结系统绝不仅仅是“调个大模型 API”。它是一条横跨数字信号处理(DSP)、语音识别(ASR)、聚类算法到大模型长文本处理的极长链路。代码段fill:#333;important;important;fill:none;color:#333;color:#333;important;fill:none;fill:#333;height:1em;🎤 原始会议音频 (长达3小时)✂️

文章图片
    共 141 条
  • 1
  • 2
  • 3
  • 15
  • 请选择