logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Claude Code源码解析学习

Agent 的核心骨架(如所示)极其简单,可以概括为一个公式:Agent =while循环 + 工具调用 +状态检查,历史记录只增不减,导致模型注意力稀释,质量下降。会话结束即失忆,无法跨任务或跨时间延续。仅靠简单的字符串黑名单(如rm -rf)拦截风险,极易被绕过。每一轮都发送全量历史,Token 消耗呈线性甚至指数级增长为了解决上述问题,Claude Code 引入了Harness Engin

Claude Code源码解析学习

Agent 的核心骨架(如所示)极其简单,可以概括为一个公式:Agent =while循环 + 工具调用 +状态检查,历史记录只增不减,导致模型注意力稀释,质量下降。会话结束即失忆,无法跨任务或跨时间延续。仅靠简单的字符串黑名单(如rm -rf)拦截风险,极易被绕过。每一轮都发送全量历史,Token 消耗呈线性甚至指数级增长为了解决上述问题,Claude Code 引入了Harness Engin

Claude Code源码解析学习

Agent 的核心骨架(如所示)极其简单,可以概括为一个公式:Agent =while循环 + 工具调用 +状态检查,历史记录只增不减,导致模型注意力稀释,质量下降。会话结束即失忆,无法跨任务或跨时间延续。仅靠简单的字符串黑名单(如rm -rf)拦截风险,极易被绕过。每一轮都发送全量历史,Token 消耗呈线性甚至指数级增长为了解决上述问题,Claude Code 引入了Harness Engin

消息队列削峰和分发

消息队列削峰,一般解决的是突发流量激增额情况。如果是流量持续增大,并且单机性能优化达到极致,那么只能水平扩容。削峰,也可以理解为在解耦的基础上,进一步考虑了流量激增的情况;而解耦更侧重考虑整体的相应时间。

#kafka
消息队列发送消息场景分析

由于开启了幂等生产,在同一分区中,同一生产者消息的编号需要是连续的,也就意味着中间不能丢消息,所以通常情况下,开启幂等性也会启用 acks=all和retries 设置,来尽可能确保消息是可以连续的,不然如果中间出现空洞,整个流程就会卡住,需要有专门的程序或者人工介入。这种方式有一个缺点,增减节点会对原有的路由分布会造成冲击,比如原来9个分区,用户id是10,那算出来就是10%9=1号分区,假设增

#kafka
Kafka高可用

Kafka受欢迎有一个很大的原因是因为他提供了天然的容灾解决方案,可以应对机器故障等各种异常。

#kafka
消息队列简介及安装

比如发送短信场景,假设服务SvrA发送消息给SvrB,SvrB发送短信给客户,很多时候业务是允许SvrA不需要得到SvrB发送完成的回应,只需要消息发送到SvrB就行了,这种情况下,如果还让SvrA等待SvrB的返回,显然会导致性能变低,同时还要去关注SvrB的运行结果。还有更常见的,比如一个业务流程,过了10多个微服务,单个也许不长,加起来就很难接受。以上的情况下,用户很难通过同步接口长时间等待

#kafka
消息队列解耦及基本使用

消息队列的解耦,就是上下游服务相互依赖,但上游服务不关心下游服务结果,同时需要降低整体响应时间,且下游即便出现问题也不需要上游来解决的场景。

#kafka
springai Alibaba(下)

那么我们可以通过一个案例来告诉大家什么是RAG。假设我们现在有一个需求,就是AI智能运维助手,通过提供的错误编码,给出异常解释来辅助运维人员更好的定位问题和维护系统。比如我们现在提供的错误代码中,00000代表success,A0001代表网络故障,A0002代表系统限流。但是传统的LLM是有缺陷的,比如LLM的知识不是实时的,不具备知识更新;LLM可能不知道你私有的领域/业务知识;LLM有时会在

springai Alibaba(中)

向量是用于表示具有大小和方向的量;向量又可以描述为矢量。

    共 15 条
  • 1
  • 2
  • 请选择