logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型的记忆Mem0

Mem0是一个面向生产环境的AI记忆系统,旨在解决大型语言模型在长期记忆和多轮对话中的局限性。它通过提取关键信息、混合存储结构(向量、键值、图数据库)和智能检索机制,将记忆功能从prompt中解耦,从而降低token成本和提高响应效率。Mem0支持托管平台和开源自托管两种模式,提供Python和JavaScript SDK,并已集成到AutoGen等框架中。实验表明,Mem0在准确率和效率上优于传

#人工智能
【人工智能】人在回路Human-in-the-Loop

人在回路”(HITL)是一种协作式人工智能方法,它利用。

文章图片
#人工智能
无状态设计哲学与Claude Code技术选择

摘要: Claude Code采用50年前的grep技术而非主流代码索引,体现了“无状态设计”的核心价值。无状态(输出仅依赖当前输入)相比有状态(依赖历史)具备四大优势:可组合性、并行性、简单性、可测试性。其历史可追溯至Unix管道、函数式编程及REST架构,并在Serverless时代得到强化。现实场景需权衡:关键业务(如游戏、支付)需有状态,而计算密集型任务(如日志分析)适合无状态。AI编程助

文章图片
#python
无状态设计哲学与Claude Code技术选择

摘要: Claude Code采用50年前的grep技术而非主流代码索引,体现了“无状态设计”的核心价值。无状态(输出仅依赖当前输入)相比有状态(依赖历史)具备四大优势:可组合性、并行性、简单性、可测试性。其历史可追溯至Unix管道、函数式编程及REST架构,并在Serverless时代得到强化。现实场景需权衡:关键业务(如游戏、支付)需有状态,而计算密集型任务(如日志分析)适合无状态。AI编程助

文章图片
#python
记录豆包的系统提示词

摘要:本文介绍了豆包AI系统的互动规则与能力说明,包含七大类规范要求:1)知识类问题需详尽回答并规范排版;2)文案创作需满足用户潜在需求;3)翻译任务遵循"准确简洁场景化"原则;4)医学问题需严格遵循医疗规范;5)用户投诉处理需保持中立合规;6)系统具备文档处理、绘图、搜索和计算等核心功能;7)知识库截止至2024年5月,后续信息不作确认。全文采用Markdown格式,突出关键

文章图片
#python
大模型推理革命

提示工程演进概述 提示工程经历了从基础探索到复杂推理的快速发展过程。2018-2020年是起源阶段,随着GPT系列模型问世,研究者发现通过精心设计的文本提示可直接驱动模型执行任务。2022年思维链(CoT)技术的提出实现重大突破,引导模型展示推理步骤而非直接输出答案,显著提升了复杂任务的准确性。2022年末出现的ReAct技术将推理与工具调用相结合,使模型具备事实核查和动态调整能力。2023年更发

文章图片
#python
大模型推理革命

提示工程演进概述 提示工程经历了从基础探索到复杂推理的快速发展过程。2018-2020年是起源阶段,随着GPT系列模型问世,研究者发现通过精心设计的文本提示可直接驱动模型执行任务。2022年思维链(CoT)技术的提出实现重大突破,引导模型展示推理步骤而非直接输出答案,显著提升了复杂任务的准确性。2022年末出现的ReAct技术将推理与工具调用相结合,使模型具备事实核查和动态调整能力。2023年更发

文章图片
#python
TCP 拥塞控制设计空间课程要点总结

本文介绍了TCP拥塞控制的设计空间与评估方法。首先分析了拥塞控制的四大实现选择:集中式/分布式、路由器/主机中心、基于窗口/速率、基于控制/回避,并指出各自适用场景。其次阐述了有效性(吞吐量与延迟平衡)和公平性(Jain指数)两大评估标准。文中还讨论了实验方法,包括真实测量与模拟工具、不同网络拓扑测试场景,强调没有单一最优算法,需结合具体应用场景选择。最后补充了AQM算法、TCP控制阶段等扩展知识

文章图片
#tcp/ip#网络协议#网络
Django REST Framework 中 @action 装饰器详解

摘要 Django REST Framework 的 @action 装饰器用于扩展 ViewSet 功能,支持创建自定义 API 端点。核心参数包括: methods:定义支持的 HTTP 方法 detail:区分集合/单个对象操作 url_path/url_name:自定义 URL 路径和反向解析名称 额外配置参数可覆盖视图设置 典型应用场景包括:密码重置、批量操作、统计查询等。装饰器自动生成

#sqlite#数据库
大模型的思考方式

本文解析了大语言模型的思考机制,重点探讨了其生物进化式学习过程(通过预测token形成中间目标)、概念抽象与泛化能力等核心特征,以及"忠实性"和幻觉两大关键问题。研究对比显示,大模型比神经科学更易操控,可通过数据优化、强化学习等技术手段提升可靠性。文章还提供了从模块化编程到RLHF应用的实践指导,并附有分阶面试题库,为技术人员深入理解模型内在机制提供了系统框架。未来研究方向包括

文章图片
#python
    共 33 条
  • 1
  • 2
  • 3
  • 4
  • 请选择