logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Differential Transformer: 通过差分注意力机制提升大语言模型性能

DIFF Transformer通过创新的差分注意力机制成功提升了模型性能,特别是在长文本理解、关键信息检索和模型鲁棒性等方面。虽然存在一些计算效率和内存使用的权衡,但考虑到显著的性能提升和更少的参数需求,这是一个非常有价值的改进。这项工作为大语言模型的架构设计提供了新的思路,也为后续研究指明了几个重要的优化方向。论文地址:我在Github上找到了一个实现,有兴趣的可以看看。

文章图片
#transformer#语言模型#深度学习 +1
一文彻底搞懂Bert(代码+手撕)

在不断发展的自然语言处理(NLP)领域中,一项被称为 BERT 的突破性创新已经崭露头角,成为一场变革的推手。BERT代表双向编码器来自 Transformer 的表示,它不仅仅是机器学习术语浩瀚海洋中的又一个缩写。它代表了机器理解语言方式的转变,使它们能够理解使人类沟通丰富而有意义的复杂细微差异和上下文依赖关系。

文章图片
#bert#人工智能#深度学习 +2
NLP实战三:Pytorch实现FastText文本分类

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;一共10个类别,每类2万条。第七阶段

文章图片
#自然语言处理#pytorch#分类 +2
NLP实战二:Pytorch实现TextRNN文本分类

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模

文章图片
#自然语言处理#pytorch#分类 +1
速搭建专业AI知识库的开源工具Ragflow,零基础入门到精通,看这篇就够了!赶紧收藏!

摘要:RAGFlow是一款基于深度文档理解的开源RAG引擎,旨在解决当前检索增强生成技术存在的幻觉、拒答等问题。它支持处理多种文档格式(Word、PDF、图片等),采用模板化分块技术提高文本处理的可解释性,并通过多路召回和融合重排序提升回答质量。RAGFlow具备异构数据源兼容性,可构建可视化知识库,实现答案溯源,为企业和个人提供高效的RAG工作流程解决方案。其核心组件DeepDoc结合OCR和布

文章图片
#人工智能#自然语言处理
手把手带你搭建RAGflow,专业AI知识库的开源工具,RAGflow零基础入门到精通,看这一篇就够了!

摘要: RAGFlow是一款基于深度文档理解的开源RAG(检索增强生成)引擎,旨在解决当前RAG技术存在的幻觉、拒答和回答不完整等问题。它支持多种文件格式(如PDF、Word、Excel等),通过智能模板化分块技术实现可控可解释的文本处理,并采用多路召回与融合重排序提升检索精度。RAGFlow的核心能力包括深度文档解析(如OCR、布局识别)、可视化分块调整及精准知识提取,确保生成回答的准确性和可追

文章图片
#人工智能#RAG
AI浪潮!后端程序员转型大模型应用开发的2025黄金机遇,零基础突围路线图!非常详细建议收藏!

大模型时代来临,程序员迎来职业转型黄金期。2025年全球大模型产业规模突破5000亿美元,核心岗位缺口超百万,资深算法工程师年薪近200万。传统开发岗位内卷加剧之际,大模型领域以470%的岗位增速和3.2万平均月薪成为新蓝海。文章分析了四大黄金岗位:AI大模型全栈工程师(转行友好度最高)、算法工程师、应用开发工程师和AI产品经理,并给出三大转型策略:技能嫁接法、高回报技术栈组合和微项目实践。同时警

文章图片
#人工智能
一文吃透 AI 智能体(Agent):从基础到核心,这篇干货总结不容错过

AI Agent(智能体)是一种能自主处理任务的AI系统,基于大语言模型(LLM)构建,具备感知、决策和行动能力。其核心架构包括规划(任务分解与反思)、记忆(感官/短期/长期)和工具调用(API交互)三大模块。AI Agent通过思维链(COT)、多Agent协同等技术实现复杂任务处理,并分为单Agent、多Agent和混合工作模式。相比传统AI,它具备自然交互、持续进化和场景适配优势,但存在可靠

文章图片
#人工智能#自然语言处理#RAG
LLM时代小模型的应用潜力与挑战

近年来,随着人工智能技术的飞速发展,大语言模型在自然语言处理领域取得了显著成就。然而,由于其高昂的成本和资源消耗,其商业化应用仍处于早期阶段。相比之下,小语言模型凭借较低的训练成本和较小的计算资源需求等优势,展现出很大的潜力。基于此,清华大学五道口金融学院财富管理研究中心撰写了《LLM时代小模型的应用潜力与挑战》研究报告(以下简称《报告》)。《报告》通过分析国内外小模型的发展现状与具体案例探讨了小

文章图片
#人工智能#语言模型#自然语言处理
大数据处理,Pandas与SQL高效读写大型数据集

学习如何使用Pandas和SQL高效地从数据库中读取、处理和写入大型数据集,以实现最佳性能和内存管理。处理大型数据集往往是一项挑战,特别是在涉及到从数据库读取和写入数据时。将整个数据集加载到内存中的传统方法可能会导致系统崩溃和处理时间缓慢。。这种技术使我们能够高效地处理大量数据,对于任何与数据库和数据帧一起工作的人来说都是一种宝贵的工具。我们将重点使用流行的数据分析库Pandas来演示如何从数据库

文章图片
#pandas#sql#oracle
    共 376 条
  • 1
  • 2
  • 3
  • 38
  • 请选择