airol123 个人主页

@airol123

airol123

2023-01-14 15:07:17 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

【学习笔记】机器学习模型指标之召回率（Recall)

公式：TP（真阳性）：模型正确预测的正例FN（假阴性）：模型漏检的正例（实际为真，但预测为假）核心意义：衡量模型“找全正例”的能力（避免漏检）。✅ 漏检成本高的场景：疾病筛查（癌症检测）安全监控（机场安检）法律文档检索（不能遗漏关键证据）权衡关系：↑召回率 → 可能 ↓精确率（模型更激进）↑精确率 → 可能 ↓召回率（模型更保守）调低分类阈值：让模型更“宽松”地标记正例。优化数据：对正例过采样，或

#学习 #机器学习

【学习笔记】大模型之美-本地部署RAG

继承LangChain的LLM基类，集成本地部署的ChatGLM-6B-int4模型需要提前加载模型和分词器支持自定义模型参数和类型标识。

#python

【学习笔记】如何增强AI的记忆力？

文章探讨了在大模型多轮对话中，如何通过记忆增强技术优化成本与用户体验。首先，分析了多轮对话中按字收费的Token费用原理及其导致的资源浪费问题。随后，提出了三种记忆增强解决方案：混合记忆架构、记忆快照和遗忘曲线优化。这些方案通过区分短期、中期和长期记忆，以及智能清理不必要信息，显著减少了Token消耗。最后，文章提供了实施建议，包括信息分级、工具选择和效果监测，并强调了隐私保护和灵活调整的重要性。

#学习 #人工智能

【学习笔记】大模型之美-LangChain 内存机制ConversationChain

本文介绍了LangChain的四种对话记忆管理方法：1）滑动窗口记忆（保留最近K轮对话）；2）摘要记忆（动态生成对话摘要）；3）摘要缓冲记忆（结合近期对话和长期摘要）；4）实体记忆（提取关键信息）。从功能特点、适用场景、关键参数等方面进行了对比分析，并提供了代码示例。建议根据对话长度、细节需求、Token限制等因素选择合适方法，如短对话用滑动窗口，长对话选摘要缓冲记忆，需跟踪关键信息则用实体记忆。

#学习 #人工智能

【学习笔记】Token？向量？Encoding?Embedding？分词？傻傻分不清楚

在自然语言处理（NLP）中，Token、向量、Encoding和Embedding是核心概念。Token是文本分词后的最小单元，如单词或符号。Encoding将文本分割为Token，而Embedding则将Token转换为向量，这些向量是多维数组，用于表示Token的语义和语法特征。向量作为模型可处理的连续数值表示，编码了语义信息。

#人工智能 #学习 #自然语言处理

【学习笔记】OpenAI API 文本生成控制技术

每个 token 有唯一 ID（如。

#人工智能 #自然语言处理

【学习笔记】AI Agent智能体学习—ReAct框架

的智能体架构，可以通过动态环境感知、多步决策和反馈调整，实现复杂任务的自动化解决。：长程任务可能导致提示（Prompt）过长，需结合检索增强（RAG）或记忆压缩技术。每一步思考（Thought）均基于之前的所有观察（Observation）生成。”，并重置为初始状态（如打开浏览器）。：LLM定位到词条中的“早年生活”部分，找到出生地信息。动作，环境返回搜索爱因斯坦后的页面加载成功的观察结果。：确保

#学习 #python

【学习笔记】AI Agent智能体学习—ReAct框架

#学习 #python

到底了