ASKED_2019 个人主页

@weixin_42223090

ASKED_2019

2023-03-16 15:50:41 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Imbalanced Learning

类别不平衡（Class Imbalance）：数据集中各类别样本数量差距悬殊。常见于欺诈检测、医疗诊断、异常检测等场景。准确率（Accuracy）失效——多数类占 99%，全猜多数类也有 99% 准确率模型偏向多数类，少数类（正类）几乎学不到信号交叉熵损失被多数类主导，梯度更新忽略少数类。

#机器学习 #人工智能

ChatGPT、Claude 和 Gemini 的网页端聊天历史是怎么处理的？

AI 会话上下文管理机制解析大模型产品处理长对话时并非简单存储全部历史记录，而是采用动态上下文管理策略。核心机制包括：模型本身是无状态的，每次请求需重新构造上下文输入上下文窗口有限，需平衡系统指令、工具结果、历史对话等内容短对话通常保留完整上下文，长对话则采用多种优化策略：裁剪早期内容摘要压缩关键信息检索相关历史片段挂载长期记忆要求开启新会话主流产品实现差异： ChatGPT：

AI Agent 核心技术：Context Engineering 基本概念解说

本文深入探讨了大语言模型（LLM）发展中的关键技术——上下文工程（Context Engineering）。文章指出，AI Agent作为语言模型与现实世界的桥梁，需要解决两大核心挑战：模型缺乏长期记忆和上下文窗口受限问题。通过四种核心操作（上下文压缩、记忆系统、子代理机制和源头控制），AI Agent能够智能管理输入信息，防止上下文爆炸。文章特别提出"Agentic Context E

#人工智能

Langchain学习笔记一 -基础模块以及架构概览

LangChain总体架构分为5层：模型层(L1)对接各类LLM模型；提示层(L2)处理Prompt模板化；运行层(L3)通过Runnable实现流程编排；智能层(L4)提供Agent/Tools实现工具调用；记忆层(L5)管理长期记忆和上下文。核心模块包括ChatPromptTemplate(L2)、RunnableSequence(L3)、Tool Calling Agent(L4)等，支持从

#学习

ChatGPT、Claude 和 Gemini 的网页端聊天历史是怎么处理的？

除了Post-Train，我们还能对大模型做什么

开源大模型微调面临"灾难性遗忘"问题，李宏毅教授提出三大前沿解决方案：1）模型编辑(Model Editing)，通过精准手术式修改特定参数，实现知识更新和隐私遗忘；2）模型融合(Model Merging)，无需训练直接合并多个模型参数，快速获得多功能模型但存在逻辑冲突风险；3）测试时训练(Test-Time Training)，在推理时动态更新参数，采用快慢更新机制和自动重置保障稳定性。这些方

#人工智能

Claude Code使用：如何写一个好的 CLAUDE.md

CLAUDE.md是用于规范Claude行为的核心文档，应聚焦于项目关键信息：构建测试流程、架构边界、编码规范和安全限制。避免放入背景介绍或可推断的内容。建议采用模块化结构，包含构建指令、架构约束、编码规范、禁止事项和验证要求。通过让Claude自行更新文档来持续优化，并定期review过时条目。项目实践中可配合环境检查工具和按文件类型触发的hooks，建立包含全局约束、路径约束和工作流的多层级规

#开发语言 #人工智能

Anthropic Agent最佳实践系列一: Agent 架构入门

文章摘要：本文探讨了构建高效LLM智能体的关键原则与实践经验。研究表明，简单可组合的模式比复杂框架更有效。文章区分了工作流（预定义流程）与智能体（自主决策系统）的适用场景，建议仅在需要高度灵活性时采用智能体。介绍了多种工作流模式（提示链、任务路由、并行处理等）和智能体的核心架构，强调工具设计清晰性和模型友好性的重要性。最佳实践包括优先使用简单方案、理解底层机制、设置防护措施等，并以代码智能体为例展

#架构 #人工智能

共 20 条

请选择