logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLM-02垂直领域大模型之微调框架LLaMA-Factory

本文详细介绍了大模型微调框架的选择与LLaMA-Factory环境配置。首先对比分析了三大主流框架(LLaMA-Factory、Hugging Face PEFT、DeepSpeed)的核心优势、技术特点和适用场景,并提供了选择决策矩阵。重点讲解了LLaMA-Factory的环境准备步骤,包括系统要求、安装流程、配置文件设置、WebUI使用和数据集准备方法。最后给出了环境优化建议,包括内存优化和速

本地大模型应用实战:Dify + Ollama + Qwen2

本指南介绍如何使用 Dify、Ollama 和 Qwen2 构建本地大语言模型应用。这套技术栈具有以下优势:完全本地化:数据不出本地,隐私安全成本低廉:无需付费 API 调用灵活可控:可自定义模型和应用易于扩展:支持多种模型和应用场景

#Ollama#AI
Spring集成DeepSeek方法2:使用Spring AI OpenAI模块

本文介绍如何使用Spring AI的OpenAI模块来集成DeepSeek API。DeepSeek提供了与OpenAI兼容的API接口,因此我们可以直接使用Spring AI的spring-ai-openai模块,只需修改API基础URL即可。这种方法简化了开发,利用了Spring AI的成熟功能。

#spring#java
Spring集成DeepSeek方法1:自定义Client集成

本文介绍如何通过自定义HTTP客户端的方式,在Spring Boot应用中集成DeepSeek API。这种方法提供了最大的灵活性和控制力,适合需要深度定制或特殊需求的场景。

#spring#java
Spring集成DeepSeek方法3:Ollama本地部署 + Spring AI Ollama

本文介绍如何使用Ollama在本地部署DeepSeek模型,并通过Spring AI的Ollama模块进行访问。这种方法实现了完全的本地化部署,数据无需上传到云端,适合对数据隐私有严格要求的场景。

#spring#java#Ollama
DeepSeek之MoE与MLA技术详解

DeepSeek作为领先的大语言模型开发团队,在模型架构创新方面取得了显著进展。其中,混合专家系统(Mixture of Experts, MoE)和多头潜在注意力(Multi-Head Latent Attention, MLA)是两项核心技术,它们通过不同的方式提升了模型的能力和效率。MoE技术通过专家网络的稀疏激活,实现了模型容量的有效扩展;而MLA技术通过潜在空间表示和分组注意力,提升了注

#DeepSeek
MCP协议

MCP (Model Context Protocol) 是一个开放标准协议,旨在为AI模型与外部工具、数据源和服务之间提供标准化的通信接口。该协议由Anthropic公司开发,旨在解决AI系统与外部世界交互时的互操作性和标准化问题。

#MCP
MCP架构设计指南

Model Context Protocol (MCP) 是一种开放协议,旨在为AI应用程序提供安全、标准化的方式来连接外部数据源和工具。MCP的核心遵循客户端-服务器(client-server)架构,允许Host应用程序连接到多个Server,从而实现灵活的扩展和集成。核心架构MCP架构包含三个主要组件:Host、Client和Server,它们协同工作以提供完整的AI交互环境。

#MCP
AG-UI协议

AG-UI (Agent-User Interface) 协议是一个专门用于AI智能体与用户界面之间通信和交互的开放标准协议。该协议旨在解决AI系统与用户界面之间的互操作性、用户体验和标准化问题,为构建智能化的用户界面提供技术基础。

A2A协议

A2A (Agent-to-Agent) 协议是一个专门用于AI智能体之间通信和协作的开放标准协议。该协议旨在解决多个AI智能体之间的互操作性、协作效率和标准化问题,为构建复杂的AI生态系统提供技术基础。

    共 251 条
  • 1
  • 2
  • 3
  • 26
  • 请选择