logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从Agent到CrewAI,一口气读懂

本文介绍了从Agent到CrewAI框架的演进过程。首先解释LLM应用与传统应用的区别,指出LLM应用的输入、过程和输出更具不确定性。接着阐述LLM Agent的概念,即具备感知、推理、行动能力的自动化LLM系统,并分析构建优秀Agent的六大特征。文章重点讨论Multi-Agent系统,提出任务设计应遵循8/2法则(80%精力用于任务设计,20%用于代理定义),强调动态任务驱动的重要性。最后介绍

文章图片
LoRA微调实战:万字深度解析

本文介绍了参数高效微调(PEFT)技术及其在自然语言处理中的应用。文章首先探讨了如何选择适合的预训练模型,以文本风格润色任务为例,推荐了Qwen2.5系列模型。随后详细阐述了微调方案的选择标准,包括QLoRA、Flash Attention-2等技术组合。文章重点展示了PEFT实战过程,特别是数据准备阶段的数据增强技术,通过教师模型自动生成高质量的指令数据集,包括总结扩写、提问回答和风格迁移三种模

文章图片
#pytorch#人工智能#python +1
[IDEA]使用idea比较两个jar包的差异

把需要比对的jar包放到任意目录下,然后选中两个需要比较的jar包,右键,选择Compare Archives,然后就可以比较了。这次疏忽了,每次打包前需要commit界面看一下当前代码和仓库的差异,哪怕几千个也要排序看一下,出错真的很难过。除了一些小工具外,idea自带了jar包比较的功能。

文章图片
#intellij-idea#jar#pycharm
[杂症]idea 无法识别已存在类

尽管正确添加了Maven依赖,且依赖存JAR包存在被加载的类,但是IDEA仍无法识别,同时刷新Maven也没有效果。如果以上方法都无效,可以尝试重新下载依赖的jar包,或者手动将jar包添加到项目中。尝试重新导入maven项目:右键项目 -> Maven -> Reimport。确认依赖的jar包是否存在于本地仓库中,可以在maven仓库目录下确认。确认依赖是否正确添加到了项目的pom.xml文件

文章图片
#intellij-idea#java#maven
AI对话接口入参解析

文章摘要 本文解析了AI对话接口的入参和响应设计,以通义千问(QW)和DeepSeek(DS)为例。核心参数包括session_id和parent_msg_id,用于标识对话链路和消息顺序。两者在参数获取流程和设计理念上存在差异:QW采用冗余设计确保数据独立性,而DS追求极简传输效率。响应方面,QW采用全量快照式结构,DS则为增量补丁式。文章还对比了Header设计的认证机制和流式传输实现,最后提

文章图片
LangChain快速筑基(带代码)P6-文本转向量存储

摘要 本文介绍了LangChain中文本转向量存储的关键步骤,主要包含两部分:嵌入模型(Embeddings)和向量数据库(Vector Stores)。嵌入模型(如HuggingFaceEmbeddings)将文本转换为语义向量,向量数据库(如Chroma)则高效存储和检索这些向量。文章通过代码示例展示了如何使用RecursiveCharacterTextSplitter分割文本、Hugging

文章图片
提升表达-架构图绘制

本文介绍了软件架构图的设计原则与绘制方法。首先提出4+1架构范式作为理论参考,随后重点解析实用的4R模型(Rank分层、Role角色、Relation关系、Rule规则),并说明其在业务架构、应用架构等不同场景的应用。文章还介绍了C4架构模型,从多层次展示系统设计。最后从业务架构、客户端架构、系统架构等维度给出具体绘图技巧,强调通过颜色标识、分组管理、明确关系等方式提升架构图的清晰度与专业性。核心

文章图片
#后端#架构
vLLM轻松通

vLLM主要是解决大模型推理服务化问题,专于与推理、优化GPU使用、提供吞吐量,提供简单易用的API接口,支持Hugging Face模型无缝接入。本篇,让我们一起了解vLLM。

文章图片
MCP轻松入门

摘要: MCP(Model-Context-Protocol)是一种标准化协议,旨在解决AI应用与外部工具/数据交互时的NxM集成复杂性问题。其核心架构包括MCP Host(AI应用)、MCP Client(协议请求方)和MCP Server(协议执行方),通过中间层实现解耦与统一管理。MCP提供安全网关、降低厂商锁定风险,并支持灵活扩展。实际应用中需关注Server设计、安全授权、服务发现及性能

文章图片
提示词Token控制

本文介绍了优化大型语言模型(LLM)Prompt token的实用策略。主要内容包括:精简Prompt内容(清晰指令、限制示例、结构化输出);管理上下文窗口(截断、输入输出平衡、内容总结);高级技术(RAG检索增强、思维骨架提示、批处理);API参数微调(最大长度、停止序列等)。还提出落地应用建议:自适应RAG系统、任务分解让LLM专注自然语言处理部分,结合传统API提高效率。这些方法可在保证输出

文章图片
#人工智能
    共 23 条
  • 1
  • 2
  • 3
  • 请选择