logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

为什么大模型都离不开SSE?带你搞懂第1章〈SSE技术基础与原理〉

本文摘要: 第一章系统介绍了Server-Sent Events(SSE)技术原理与应用。SSE是一种基于HTTP的单向服务器推送技术,具有自动重连、事件驱动等特性,适用于实时数据推送、大模型对话等场景。通过对比WebSocket、长轮询等技术,分析了SSE的技术优势(简单易用、防火墙友好)与限制(单向通信、浏览器兼容性)。详细解析了SSE协议规范、客户端API实现,并提供了增强型封装方案,包含连

#人工智能#学习#机器学习 +4
大模型蒸馏:如何让小模型“继承”大模型的智慧

大模型蒸馏,简单来说,就是将大型复杂模型(教师模型)的知识迁移到小型轻量模型(学生模型)的过程。就像一位知识渊博的老师把自己的知识精华传授给学生,让学生能够用更简洁的方式掌握关键能力。这一技术的核心目标是在保持模型性能的同时,显著降低模型的计算复杂度和存储需求,使其更适合在资源受限的环境中部署,如手机、物联网设备等。# 定义教师模型teacher.fc = nn.Linear(teacher.fc

文章图片
#人工智能#语言模型#计算机网络 +2
从0到1开发一个MCP Server:让AI助手拥有数据库操作能力

本文介绍了如何开发一个基于MCP协议的MySQL数据库操作服务。文章首先解释了MCP协议的作用,即让AI模型能够通过标准化接口调用外部工具。随后详细阐述了技术选型、安全架构设计(包含SQL验证、参数化查询和连接池管理三层防护)以及模块化实现方案。在具体实现部分,重点讲解了SQL安全验证器、数据库连接管理器和MCP服务器核心代码的设计思路。文章还提供了在Cursor中配置MCPServer的方法,并

文章图片
#数据库#人工智能#学习 +1
浅读deer-flow源代码,梳理流程

本文分析了deer-flow项目的工作流程和关键代码模块。系统采用langgraph构建状态机,主要节点包括:coordinator(问题分发)、background_investigator(初步搜索)、planner(制定研究计划)、research_team(执行研究步骤)和reporter(生成最终报告)。核心流程是:用户输入经coordinator处理后,先进行背景调查,再由planne

文章图片
#人工智能#开发语言#机器学习 +1
关于DeepResearch设计实现的碎碎念

最近我们通过一些新闻博客包括LLMs产品的推出,DeepSearch和这两个词不断的映入我们眼帘。一个有趣的发现是,DeepSearch 和 DeepResearch 不仅限于OpenAI,之前一直听说OpenAI的DeepResearch特别厉害,最近许多公司如 Jina AI、Perplexity 和 Google 也在开发类似工具。

文章图片
#人工智能#深度学习#机器学习 +1
使用LLM 实现一个可编辑PPT Agent

【摘要】本文提出了一种结合LLM生成HTML与PPT转换的创新方法,旨在解决传统PPT制作流程繁琐的问题。通过设计HTML转PPTX工具,实现了从网页内容到PPT的自动转换。系统采用两套方案:1)直接生成OpenXML文档,2)通过Python-pptx库转换HTML元素。文章详细介绍了转换器的实现逻辑,包括元素定位、样式解析、图片处理和文本换行等关键技术点,并提供了完整的Prompt模板和Pyt

#人工智能#算法#机器学习 +1
大模型MCP示例

摘要: MCP协议实现了自然语言到工具调用的闭环流程,包含工具发现、调用和结果整合三阶段。客户端动态获取工具列表(如天气查询),LLM匹配需求并生成参数,通过标准接口调用MCP服务(如高德地图API),返回结构化数据后由LLM转换为自然语言回复。该协议支持动态扩展工具、解耦LLM与工具逻辑,并具备权限控制,适用于私有化部署场景。相比OpenAI Function Calling,MCP强调服务端动

文章图片
#服务器#github#运维 +4
大模型应用开发 langchain和 langgraph 之 RAG 入门

Retrieval Augmented Generation 检索增强生成。简单的说就是大模型,虽然比较全面,但是在一些细节上还是有很多的不同,这个时候我们就可以通过上下文的方式,给大模型一些额外的数据增强大模型的知识库,然后生成内容。索引检索生成retrieve:根据问题进行向量相似搜素,返回检索的上下文generate: 提供问题和上下文,调用大模型生成,然后返回。

文章图片
#人工智能#spring
Dify 1.7.0重磅更新:基于支持OAuth认证功能的插件开发GitHub智能体

Dify v1.7.0发布重大更新,重点增强插件系统的OAuth认证和自动升级功能。新版本支持标准OAuth2.0授权流程,无需暴露用户凭据,并实现token自动续期,大幅提升安全性。文中详细演示了如何基于GitHub插件开发智能体,包括环境配置、OAuth应用注册和智能体开发流程。此外还提供了完整的AI大模型学习资源包,包含学习路线图、视频教程、技术文档和面试题集,帮助开发者掌握大模型应用开发全

文章图片
#github#架构#人工智能 +2
    共 681 条
  • 1
  • 2
  • 3
  • 69
  • 请选择