logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从零开始,35岁转职挑战:如何成为AI大模型开发者?

在AI大模型开发的快速发展的行业中,35岁的你完全有能力接受新知识,掌握新技能。• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项

文章图片
#人工智能#语言模型#自然语言处理
揭秘AI智能体持久记忆:LangGraph长短期记忆实现与实战!

文章详细介绍了Agent Memory的核心概念及LangGraph框架下的长短期记忆实现方法。探讨了短期会话与长期知识的存储、管理及语义检索技巧,并通过MCP协议实战案例,展示了如何构建融合长记忆机制的Multi-Agent系统。文章讲解了记忆类型、工作原理、实现方式及记忆管理策略,为构建高级智能体提供了技术指导。

文章图片
#人工智能#microsoft#算法
RAG 全面指南:从原理到实践,一篇搞定大模型应用

RAG技术(检索增强生成)是2020年Facebook提出的一种结合信息检索与大型语言模型的生成方法,旨在解决预训练模型知识局限性问题。相比传统微调,RAG通过实时检索外部知识库增强生成内容,具有更新成本低、可解释性强、减少幻觉等优势。其流程包括数据索引、检索和生成三大步骤,并逐步发展为初级、高级和模块化RAG三种范式。与微调互补,RAG更适合动态数据场景,但需平衡检索质量与计算资源消耗。该技术为

文章图片
#人工智能#RAG
智能体系统深度解析:LangChain、LangGraph与MCP三大框架实战指南!

本文详细拆解了智能体系统的三层架构,深入解析了LangChain、LangGraph和MCP三大框架的功能与落地方法,并介绍了工具层、知识库层、AI IDE层的作用与实施建议。文章提供了从最小智能体到企业级系统的完整落地路线,强调智能体系统是逐步演进的工程,关键在于将智能嵌入业务流程,而非简单接入大模型。

文章图片
#人工智能#剪枝#算法 +3
Hugging Face开源顶级模型:双模式推理+128K上下文,最强3B

Hugging Face开源30亿参数小模型SmolLM3,性能超越同类3B模型,支持6种语言和128K长文本处理。该模型采用双模式推理设计,开放了完整架构和训练细节,包括三阶段预训练策略(11.2万亿tokens数据)和创新的混合推理方法。通过分组查询注意力、NoPE技术等优化,在384块H100 GPU上训练24天完成。模型还进行了长上下文扩展和推理适应训练,最终通过APO对齐和模型合并技术保

文章图片
#人工智能
18种RAG技术大比拼:谁才是检索增强生成的最佳选择?

RAG技术大比拼:从基础到进阶的检索增强生成方案 本文系统比较了6种主流RAG技术,评估其检索增强生成效果。基础Simple RAG采用固定文本块分割,评分为0.4;语义分块尝试按语义划分,但效果反而下降(0.3);上下文增强检索引入邻居文本块,显著提升至0.6;上下文块头添加描述性标题,评分为0.5;文档增强技术生成相关问题,表现最佳(0.8);查询转换通过重写和分解查询,获得0.5分。实验表明

文章图片
#人工智能#RAG#语言模型
3步搞定图谱RAG应用:Unstructured+Graph Retriever实战指南

新一代基于图谱的检索增强生成(Graph-based RAG)技术通过结合知识图谱和向量检索,显著提升了AI输出的准确性和上下文相关性。Unstructured工具自动提取文档结构化元数据并存储至Astra DB,简化了知识图谱构建流程;而Graph Retriever库则动态利用这些元数据构建图谱查询,无需专用图数据库。这种方案克服了传统语义检索的局限性,通过显式捕捉文档间关系实现更精准的上下文

文章图片
#人工智能#自然语言处理#语言模型 +1
OpenAI新Agent套件全解析,以及发布会没说的30+要点

凌晨 1 点的时候,OpenAI 发布了全套 Agent 开发套件,让手搓 Manus 触手可及。套件包含 4 个主要内容Responses API:本次发布会的核心,可视作 Chat API 的上位升级内置工具 (Built-in Tools),有三个: 网页搜索、文件搜索 和 Computer Using Agent(CUA)Agents SDK:这是个开源 Agent 框架(你没看错,Ope

文章图片
#自然语言处理#人工智能
用DeepSeek和AnythingLLM搭建个人知识库,简单又省事,关键还好用

DeepSeek从发布R1版本后,瞬间掀起了全球关注热潮!无论是技术大咖还是普通用户,都迫不及待地在试用这个神器。从一线开发者到三四线城市的网友,大家都在争先恐后地探索如何利用DeepSeek优化自己的工作和生活。你也许已经在朋友圈看到各种关于DeepSeek的讨论和分享,也有些人已经用他提升了自己的工作效率,自媒体也使劲的宣传为自己赢得流量

文章图片
#人工智能#DeepSeek
复旦大学《大规模语言模型:从理论到实践》完整PDF和PPT课件下载

大语言模型(Large Language Models,LLM)是一种由包含数百亿以上权重的深度神经网络构建的语言模型,使用自监督学习方法通过大量无标记文本进行训练。自2018年以来,包含Google、OpenAI、Meta、百度、华为等公司和研究机构都纷纷发布了包括BERT, GPT等在内多种模型,并在几乎所有自然语言处理任务中都表现出色。2021年开始大模型呈现爆发式的增长,特别是2022年1

文章图片
#语言模型#人工智能#自然语言处理
    共 629 条
  • 1
  • 2
  • 3
  • 63
  • 请选择