logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【学习笔记】机器学习模型指标之召回率(Recall)

公式:TP(真阳性):模型正确预测的正例FN(假阴性):模型漏检的正例(实际为真,但预测为假)核心意义:衡量模型“找全正例”的能力(避免漏检)。✅ 漏检成本高的场景:疾病筛查(癌症检测)安全监控(机场安检)法律文档检索(不能遗漏关键证据)权衡关系:↑召回率 → 可能 ↓精确率(模型更激进)↑精确率 → 可能 ↓召回率(模型更保守)调低分类阈值:让模型更“宽松”地标记正例。优化数据:对正例过采样,或

#学习#机器学习
【学习笔记】大模型之美-本地部署RAG

继承LangChain的LLM基类,集成本地部署的ChatGLM-6B-int4模型需要提前加载模型和分词器支持自定义模型参数和类型标识。

#python
【学习笔记】如何增强AI的记忆力?

文章探讨了在大模型多轮对话中,如何通过记忆增强技术优化成本与用户体验。首先,分析了多轮对话中按字收费的Token费用原理及其导致的资源浪费问题。随后,提出了三种记忆增强解决方案:混合记忆架构、记忆快照和遗忘曲线优化。这些方案通过区分短期、中期和长期记忆,以及智能清理不必要信息,显著减少了Token消耗。最后,文章提供了实施建议,包括信息分级、工具选择和效果监测,并强调了隐私保护和灵活调整的重要性。

#学习#人工智能
【学习笔记】大模型之美-LangChain 内存机制ConversationChain

本文介绍了LangChain的四种对话记忆管理方法:1)滑动窗口记忆(保留最近K轮对话);2)摘要记忆(动态生成对话摘要);3)摘要缓冲记忆(结合近期对话和长期摘要);4)实体记忆(提取关键信息)。从功能特点、适用场景、关键参数等方面进行了对比分析,并提供了代码示例。建议根据对话长度、细节需求、Token限制等因素选择合适方法,如短对话用滑动窗口,长对话选摘要缓冲记忆,需跟踪关键信息则用实体记忆。

#学习#人工智能
【学习笔记】Token?向量?Encoding?Embedding?分词?傻傻分不清楚

在自然语言处理(NLP)中,Token、向量、Encoding和Embedding是核心概念。Token是文本分词后的最小单元,如单词或符号。Encoding将文本分割为Token,而Embedding则将Token转换为向量,这些向量是多维数组,用于表示Token的语义和语法特征。向量作为模型可处理的连续数值表示,编码了语义信息。

#人工智能#学习#自然语言处理
【学习笔记】AI Agent智能体学习—ReAct框架

的智能体架构,可以通过动态环境感知、多步决策和反馈调整,实现复杂任务的自动化解决。:长程任务可能导致提示(Prompt)过长,需结合检索增强(RAG)或记忆压缩技术。每一步思考(Thought)均基于之前的所有观察(Observation)生成。”,并重置为初始状态(如打开浏览器)。:LLM定位到词条中的“早年生活”部分,找到出生地信息。动作,环境返回搜索爱因斯坦后的页面加载成功的观察结果。:确保

文章图片
#学习#python
【学习笔记】AI Agent智能体学习—ReAct框架

的智能体架构,可以通过动态环境感知、多步决策和反馈调整,实现复杂任务的自动化解决。:长程任务可能导致提示(Prompt)过长,需结合检索增强(RAG)或记忆压缩技术。每一步思考(Thought)均基于之前的所有观察(Observation)生成。”,并重置为初始状态(如打开浏览器)。:LLM定位到词条中的“早年生活”部分,找到出生地信息。动作,环境返回搜索爱因斯坦后的页面加载成功的观察结果。:确保

文章图片
#学习#python
到底了