登录社区云,与社区用户共同成长
邀请您加入社区
两个项目都用"图"来描述代码和项目。codegraphsynapse一个节点一个代码符号(函数、类、方法、接口)一个工程知识单元(模块进度、接口契约、设计决策、待办)一条边编译器级别的事实:calls / imports / inherits语义级别的依赖:“这个模块坏了那个功能也会炸”图的来源tree-sitter 全自动解析,100% 客观自动扫描骨架 + AI 建议 + 人确认(Markdo
本文探讨了全栈独立开发者面临的"多项目记忆管理"挑战,提出了一种基于图拓扑的工程记忆系统Synapse Graph Skills。作者指出,现有记忆工具(如AI个人记忆、向量知识库等)无法满足独立开发者同时维护多个技术栈不同项目的需求,因为它们要么设计给团队使用,要么侧重对话连续性而非工程依赖关系。 Synapse的创新在于: 将每个项目建模为依赖关系图,模块/功能作为独立节点,通过显式边连接 采
本文介绍了LangChain框架及其在大模型应用开发中的重要性。LangChain是一个开源框架,提供模型、工具、检索器等模块的抽象接口,帮助开发者快速搭建复杂的大模型应用链路,如RAG系统、Agent工具调用等。文章从工程实践角度出发,阐述了LangChain的核心概念、系统设计思路和关键实现细节,包括Prompt模板、输出解析等核心组件。同时指出LangChain应与LangGraph、Lan
今天系统梳理了一遍 Transformer 的核心思路,重点不放在公式推导,而是先弄清它到底解决了什么问题、Attention 在做什么、QKV 为什么要这样设计,以及 GPT、BERT 这些常见模型和 Transformer 的关系。对刚入门的人来说,先建立直觉,再回头看公式,会更容易把整套东西串起来。
极性分类:最基础的任务,将文本情感分为积极(正面)、消极(负面)、中性三类,也是本文重点实现的任务;情感强度分析:对情感极性进行量化,如 “非常满意”“比较满意”“不满意”“非常不满意”;细粒度情感分析:针对文本中特定实体或属性的情感分析,如 “手机续航很棒,但屏幕分辨率太低” 中,“续航” 为正面情感,“屏幕分辨率” 为负面情感。
在大规模模型的推理过程中,通信效率成为性能瓶颈之一。本文面向 vLLM + 昇腾 NPU 场景下的推理工程师、性能优化人员与运维人员,系统梳理了 `vllm-ascend` 中的三套递进式通信优化方案:**SP(Sequence Parallelism)**、**FlashComm1(FC1)** 与 **FlashComm2(FC2)**。本文将详细介绍这些方案的设计思路、数学等价性、代码实现以
本文以阿里巴巴开源的 Qwen2.5-0.5B-Instruct 为基础模型,手把手演示如何使用 LoRA(Low-Rank Adaptation)完成一次完整的大模型微调实验,将模型的回答风格调整为专业、礼貌的客服话术。文章首先从原理层面介绍 LoRA 的核心思想——冻结原模型权重,仅训练两个低秩旁路矩阵,使可训练参数量降至原模型的约 0.1%,从而大幅降低显存与算力开销。随后按照"环境准备、数
本文深入解析了nano-vllm中decode阶段KV缓存管理的核心机制。重点分析了三个关键问题:1)通过can_append函数判断何时需要新块,其巧妙利用布尔表达式仅在块边界(每256个token)时检查空闲块;2)当缓存不足时,系统采用"抢队尾"或"抢自己"的抢占策略,通过while-else控制流确保被抢占序列不进入本轮调度;3)被抢占序列会被放入waiting队列前端,利用L05的pre
本文提出了一种名为ReAct的新型智能体范式,通过将推理(Reasoning)和行动(Acting)有机结合,使大语言模型能够更有效地完成复杂任务。ReAct的核心思想是让模型在任务执行过程中交替进行推理和行动:推理用于拆解问题、制定计划和跟踪状态,行动则用于调用外部工具、检索知识和执行操作。这种循环机制(Thought→Action→Observation)克服了纯推理方法容易产生幻觉的缺点,也
企业级RAG系统不能仅依赖文档向量化,需要构建完整知识问答体系。文章指出简单向量检索方案在企业场景存在召回不稳定、证据排序不当、模型幻觉等问题。核心解决方案包括:1)采用混合检索(向量+关键词+结构化);2)引入重排机制提升证据质量;3)严格约束模型基于证据生成;4)建立评估体系持续优化。系统设计需涵盖文档处理、多模态检索、智能排序、可信生成等模块,通过工程化方法确保答案的可信度和可追溯性。
本文排查了Dify`/v1/chat-messages` 的一个流式延时问题:`message_end` 已经返回,但 SSE 连接仍会额外等待几秒才关闭。根因并不在 SSE,而是新会话首问时默认开启了 `auto_generate_name`,会额外触发一次会话标题生成。由于标题生成同样需要调用大模型,因此短回答场景下延时尤其明显。文章同时记录了通过对比 `/v1/chat-messages`
摘要: 多智能体协作系统(Multi-Agent Systems)通过角色分工与协同机制,高效解决企业复杂业务场景中的多线程、高耦合任务。核心包括:任务拆解与智能体角色分配、跨部门流程自动化、通信协议与冲突仲裁、动态工作流编排及异常处理。系统整合企业知识库,支持多轮对话状态管理,并通过性能指标持续优化。典型应用如客服矩阵与研发自动化,显著提升效率与准确性。部署需注重微服务架构与权限安全,未来将向自
nano-vllm通过120行代码实现vLLM核心的BlockManager组件,高效管理KV Cache物理块分配。该系统采用四个核心数据结构:块元数据池、空闲队列、占用集合和哈希反查表,通过五个关键API实现块的分配、追加和释放。BlockManager不直接操作显存,而是维护序列的block_table整数列表,与ModelRunner协同工作。设计亮点包括:用deque实现LRU策略,通过
RAGGym框架的提出是为了优化RAG在multi-hop question answer中的表现。主要使用的方法是将查询和回答视为查询代理的过程,然后通过基于马尔科夫链的奖励机制,通过微调等方法优化这个步骤。
本文是一篇关于从零构建大语言模型的实战指南。文章首先指出,虽然大模型看似复杂,但其核心由几个清晰的数学模块组成。通过亲手搭建微型模型,开发者能更深入理解智能如何从数据中涌现。 文章分为三个主要部分:数据预处理与分词器构建、注意力机制实现、以及前馈神经网络搭建。在数据预处理环节,重点介绍了文本清洗和BPE分词算法;注意力机制部分详细解析了多头注意力的代码实现;前馈网络部分则强调了残差连接和层归一化的
以一个人名为输入, 使用模型帮助我们判断它最有可能是来自哪一个国家的人名
摘要: Synapse v0.4 是一个轻量级工程记忆图系统,旨在解决一人公司在项目开发中面临的上下文记忆问题。通过自然语言记录工程状态,系统自动抽取模块依赖关系,生成可解释、可维护的记忆图。核心创新是自动建议依赖边(auto_linked),避免人工维护依赖关系,同时保留人工确认边(depends_on)。该系统采用Markdown文件存储节点信息,JSON格式存储图结构,支持Coding Ag
ChatGPT红得发紫,强得让人类心悸。但在它的背后,还隐藏着一位真正的大佬。它的名字叫做——Transformer!在大数据和人工智能时代,机器学习 (Machine Learning,ML) 和 深 度 学 习 (DeepLeamning,DL) 已经成为各行各业解决问题的有效方法,自然语言处理 (Natural Language Processing,NLP) 是深度学习的重要应用领域之一。
自然语言处理(NLP)借助大语言模型实现突破性发展,涵盖文本生成、机器翻译等应用。其核心技术包括数据预处理、特征提取和建模,涉及传统方法与深度学习模型(如Transformers)。重要模型如BERT、GPT-3推动了语义理解和文本生成能力。开发工具包括NLTK、spaCy等库,支持多种语言任务。NLP正广泛应用于情感分析、信息检索等领域,成为AI研究的核心方向。
第14周项目目标:本项目旨在开发一款基于人工智能的文档审阅工具,解决当前在文档审阅过程中人工检查效率低、遗漏错误和格式不规范等问题。
本文介绍了基于PyTorch框架的深度学习方法论,重点探讨了Transformer模型的结构与实现。Transformer模型由编码器和解码器组成,采用自注意力机制,避免了传统卷积神经网络(CNN)和循环神经网络(RNN)的局限性。文章详细解析了Transformer的各个组件,包括多头自注意力、基于位置的前馈网络、残差连接和层规范化等,并提供了代码实现。此外,文章还展示了如何在机器翻译任务中训练
2025年最新最全面的LLM Agent综述!多位IEEE Fellow坐镇!来自北大加州大学哈佛等的26位研究者联合发布!
在本项目中,我们选择了Spacy作为主要的自然语言处理工具。Spacy是一个开源的NLP库,旨在提供高效、准确的文本处理功能。它以其简洁的API和强大的功能而闻名,特别适合处理大规模文本数据。Spacy是一个专为生产环境设计的工业级NLP库,提供了多种语言的支持。高效性:Spacy使用了最新的深度学习技术,能够快速处理文本。准确性:提供了预训练的模型,能够准确地进行词性标注、命名实体识别等任务。易
大家好啊,我是BigNorthBear。今天依旧是不聊代码实战,今天想和大家探讨一个更基础的问题:搜索引擎的推荐算法究竟如何影响你的搜索结果?上一篇文章中我提到 现在有一种推荐算法可以把你的网页优化,让用户在搜索时第一个就是你的网页,但是你的网页却并不是用户需要的。这就是推荐算法的强大之处。 很多人以为搜索引擎只是个“关键词匹配工具”,但它的运作机制远比想象中复杂。
循环神经网络(RNN,Recurrent Neural Network)是一类能够处理序列数据的神经网络结构。与传统的前馈神经网络不同,RNN可以通过隐藏层的循环连接,在时间步骤之间传递信息。这使得RNN能够处理具有时序性质的任务,如语言建模、序列生成、情感分析等。RNN的主要特点是:其网络的隐藏层不仅接受当前时刻的输入,还接受前一时刻的隐藏状态,从而实现对时间序列的建模。
AI人工智能、LLM、Transformer、NLP、MOE
对中小企业而言,AI外呼系统的选型本质是“技术能力与业务目标的精准对齐”。建议以“场景化需求+渐进式投入”为核心策略,通过POC验证关键指标,并持续关注生成式AI、多智能体协同等技术演进。
摘要:本文探讨了自然语言处理(NLP)项目中探索性数据分析(EDA)的五个关键步骤。首先通过标签分布分析确保数据平衡性;其次分析句子长度分布以指导文本序列处理;然后通过异常点检测提高数据质量;接着统计词汇量评估语料复杂度;最后利用词云可视化快速把握文本特征。文章详细介绍了每个步骤的分析方法和实践技巧,包括使用Seaborn库进行可视化、计算统计指标等,旨在帮助读者从数据层面优化NLP模型性能,为后
本文系统介绍了自然语言处理中的文本向量化核心技术,包括One-Hot编码、Word2Vec、FastText和Embedding层。One-Hot编码简单直观但存在语义割裂和维度爆炸问题;Word2Vec通过CBOW和Skip-gram模型生成低维稠密词向量,能捕捉语义关系;FastText引入子词概念,有效解决未登录词问题;Embedding层则是深度学习模型中处理文本的标准模块,支持预训练和从
文本特征处理:我们将学习如何通过添加N-gram特征来捕捉词序信息,以及为什么文本长度规范化是深度学习模型不可或缺的预处理步骤。文本数据增强:我们将揭秘目前效果最佳的文本增强方法之一——回译(Back-Translation),并探讨其背后的原理和实现途径。我们通常的分词操作,得到的是一个个独立的词(称为1-gram或unigram),这种表示方式忽略了词与词之间的顺序关系,即所谓的“词袋模型”。
本文介绍了深度学习中的计算图概念及其在反向传播中的应用。计算图通过节点和边将数学运算可视化,其中前向传播计算输出结果,反向传播则通过局部梯度和链式法则传递梯度。文章通过具体数值案例展示了梯度计算过程,并强调统一反向传播的高效性。最后指出现代深度学习框架通过自动微分简化了开发,同时建议使用数值梯度检查验证自定义算子实现。更多计算机知识可访问博客网站rn.berlinlian.cn。
本文介绍了自然语言处理中两种主流句法分析方法:成分句法分析和依存句法分析。成分句法分析通过嵌套结构组织词语,而依存句法分析则直接描述词间二元关系。文章详细阐述了依存句法的形式化定义、约束条件和关系类型标注,并探讨了如何利用依存结构消除句法歧义(如介词短语附件歧义和协调范围歧义)以及提取语义信息。最后介绍了从传统转移算法到神经网络解析器的技术演进,以及评价解析器的UAS和LAS指标。文章来自作者博客
本文探讨了NLP分类任务的核心挑战与解决方案。文章首先分析语言的离散符号特性与连续语义之间的矛盾,介绍了从独热编码到分布式表示的演进过程。针对多义词处理难题,提出了线性叠加假说和多原型模型两种解决方案。随后详细阐述了从逻辑回归到深层感知器的分类器演进,包括神经单元、多层架构和目标函数的设计原理。最后以命名实体识别(NER)任务为例,展示了深度神经网络如何通过上下文窗口和特征拼接解决多义性问题。文章
这篇文章通过将多智能体系统的拓扑设计重构为条件自回归生成任务,成功解决了现有方法僵化和冗余的问题。ARG-DESIGNER 不仅能根据任务“量身定制”团队,还能在保证高准确率的同时大幅降低大模型的调用成本(Token消耗),具有很高的实用价值。
摘要:邻域重叠率是衡量网络节点结构相似性的核心指标,通过计算节点共同邻居与全部邻居的比例(范围0-1)来量化相似程度。该指标计算简单、解释性强,适用于链接预测、社交网络分析等场景,但存在局部性限制和对稀疏图敏感等缺点。主流框架中,NetworkX原生支持该指标,igraph需手动实现,PyG则需结合其他库使用。实际应用中,邻域重叠率常作为特征用于图机器学习任务或社交网络分析。
本来想画一条时间线,看“程序员”和“高薪”在过去几年里是更近了还是更远了。结果发现中文互联网没有现成的、按年份切分好的开源词向量。最后跑出来的是四个平台的横向对比,数据挺有意思,但它不是我最初想回答的问题。这件事让我意识到,AI的能力边界不全是由算法决定的——从根儿上说,它被语料的质量和算力的阶级性框住了。英文AI吃的“菜”就是比中文AI好,普通人在技术垄断下能做的最多叫“蒸馏”。在这个前提下,A
摘要:ACL 2025最佳论文《A Theory of Response Sampling in LLMs》提出大语言模型(LLM)采样包含描述性(反映统计常态)和规范性(反映理想状态)两种成分。研究发现LLM采样会偏离统计均值向理想值偏移,这种规范性偏差随模型增大和RLHF训练而增强。论文提出α和归一化指标量化偏移程度,并通过实验验证了偏差普遍存在。工程上建议监控分布、多模型评估,并注意RLHF
nlp
——nlp
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net