logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Imbalanced Learning

类别不平衡(Class Imbalance):数据集中各类别样本数量差距悬殊。常见于欺诈检测、医疗诊断、异常检测等场景。准确率(Accuracy)失效——多数类占 99%,全猜多数类也有 99% 准确率模型偏向多数类,少数类(正类)几乎学不到信号交叉熵损失被多数类主导,梯度更新忽略少数类。

文章图片
#机器学习#人工智能
ChatGPT、Claude 和 Gemini 的网页端聊天历史是怎么处理的?

AI 会话上下文管理机制解析 大模型产品处理长对话时并非简单存储全部历史记录,而是采用动态上下文管理策略。核心机制包括: 模型本身是无状态的,每次请求需重新构造上下文输入 上下文窗口有限,需平衡系统指令、工具结果、历史对话等内容 短对话通常保留完整上下文,长对话则采用多种优化策略: 裁剪早期内容 摘要压缩关键信息 检索相关历史片段 挂载长期记忆 要求开启新会话 主流产品实现差异: ChatGPT:

文章图片
AI Agent 核心技术:Context Engineering 基本概念解说

本文深入探讨了大语言模型(LLM)发展中的关键技术——上下文工程(Context Engineering)。文章指出,AI Agent作为语言模型与现实世界的桥梁,需要解决两大核心挑战:模型缺乏长期记忆和上下文窗口受限问题。通过四种核心操作(上下文压缩、记忆系统、子代理机制和源头控制),AI Agent能够智能管理输入信息,防止上下文爆炸。文章特别提出"Agentic Context E

文章图片
#人工智能
Langchain学习笔记一 -基础模块以及架构概览

LangChain总体架构分为5层:模型层(L1)对接各类LLM模型;提示层(L2)处理Prompt模板化;运行层(L3)通过Runnable实现流程编排;智能层(L4)提供Agent/Tools实现工具调用;记忆层(L5)管理长期记忆和上下文。核心模块包括ChatPromptTemplate(L2)、RunnableSequence(L3)、Tool Calling Agent(L4)等,支持从

文章图片
#学习
ChatGPT、Claude 和 Gemini 的网页端聊天历史是怎么处理的?

AI 会话上下文管理机制解析 大模型产品处理长对话时并非简单存储全部历史记录,而是采用动态上下文管理策略。核心机制包括: 模型本身是无状态的,每次请求需重新构造上下文输入 上下文窗口有限,需平衡系统指令、工具结果、历史对话等内容 短对话通常保留完整上下文,长对话则采用多种优化策略: 裁剪早期内容 摘要压缩关键信息 检索相关历史片段 挂载长期记忆 要求开启新会话 主流产品实现差异: ChatGPT:

文章图片
ChatGPT、Claude 和 Gemini 的网页端聊天历史是怎么处理的?

AI 会话上下文管理机制解析 大模型产品处理长对话时并非简单存储全部历史记录,而是采用动态上下文管理策略。核心机制包括: 模型本身是无状态的,每次请求需重新构造上下文输入 上下文窗口有限,需平衡系统指令、工具结果、历史对话等内容 短对话通常保留完整上下文,长对话则采用多种优化策略: 裁剪早期内容 摘要压缩关键信息 检索相关历史片段 挂载长期记忆 要求开启新会话 主流产品实现差异: ChatGPT:

文章图片
ChatGPT、Claude 和 Gemini 的网页端聊天历史是怎么处理的?

AI 会话上下文管理机制解析 大模型产品处理长对话时并非简单存储全部历史记录,而是采用动态上下文管理策略。核心机制包括: 模型本身是无状态的,每次请求需重新构造上下文输入 上下文窗口有限,需平衡系统指令、工具结果、历史对话等内容 短对话通常保留完整上下文,长对话则采用多种优化策略: 裁剪早期内容 摘要压缩关键信息 检索相关历史片段 挂载长期记忆 要求开启新会话 主流产品实现差异: ChatGPT:

文章图片
除了Post-Train,我们还能对大模型做什么

开源大模型微调面临"灾难性遗忘"问题,李宏毅教授提出三大前沿解决方案:1)模型编辑(Model Editing),通过精准手术式修改特定参数,实现知识更新和隐私遗忘;2)模型融合(Model Merging),无需训练直接合并多个模型参数,快速获得多功能模型但存在逻辑冲突风险;3)测试时训练(Test-Time Training),在推理时动态更新参数,采用快慢更新机制和自动重置保障稳定性。这些方

文章图片
#人工智能
Claude Code使用:如何写一个好的 CLAUDE.md

CLAUDE.md是用于规范Claude行为的核心文档,应聚焦于项目关键信息:构建测试流程、架构边界、编码规范和安全限制。避免放入背景介绍或可推断的内容。建议采用模块化结构,包含构建指令、架构约束、编码规范、禁止事项和验证要求。通过让Claude自行更新文档来持续优化,并定期review过时条目。项目实践中可配合环境检查工具和按文件类型触发的hooks,建立包含全局约束、路径约束和工作流的多层级规

文章图片
#开发语言#人工智能
Anthropic Agent最佳实践系列一: Agent 架构入门

文章摘要:本文探讨了构建高效LLM智能体的关键原则与实践经验。研究表明,简单可组合的模式比复杂框架更有效。文章区分了工作流(预定义流程)与智能体(自主决策系统)的适用场景,建议仅在需要高度灵活性时采用智能体。介绍了多种工作流模式(提示链、任务路由、并行处理等)和智能体的核心架构,强调工具设计清晰性和模型友好性的重要性。最佳实践包括优先使用简单方案、理解底层机制、设置防护措施等,并以代码智能体为例展

文章图片
#架构#人工智能
    共 20 条
  • 1
  • 2
  • 请选择