logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

PyTorch DDP 实战指南:分布式训练底层原理与工程落地(附代码)

本文深入解析PyTorch分布式训练方案DistributedDataParallel(DDP),从原理到实践全面讲解多卡/多机训练方法。首先介绍DDP的核心机制,包括数据并行、梯度同步等关键技术;然后提供单机多卡训练完整示例代码,涵盖环境配置、模型包装、数据采样等关键步骤;接着讲解多机扩展方案及性能优化技巧;最后分析常见问题解决方案。文章指出DDP凭借高效通信机制和简洁API,已成为突破算力瓶颈

文章图片
#pytorch#分布式#人工智能
Context Engineering 实战:Weaviate 构建智能体系统完整指南(附代码)

本文介绍了如何利用Weaviate向量数据库构建智能体系统的上下文管理系统。通过ContextEngineering理念,将上下文管理分为采集、存储、检索和更新四个环节,借助Weaviate的语义检索和向量存储能力,为智能体提供精准的信息支撑。文章详细演示了从环境搭建、数据导入到智能体交互的全流程实现,包括Weaviate初始化、上下文数据嵌入、语义检索以及与LLM的集成方法。同时提供了避坑指南和

文章图片
#开发语言#java
SpringBoot 整合 LangChain4j 实战:轻量 RAG 检索增强生成落地指南

本文介绍了一种基于SpringBoot和LangChain4j的轻量级RAG(检索增强生成)实现方案,用于构建企业知识库问答系统。方案通过整合H2嵌入式向量数据库和通义千问API,实现文档预处理、向量检索和增强生成全流程。文章详细展示了核心组件配置、文档处理服务、RAG检索链构建及HTTP接口实现,并提供了开发到生产环境的优化建议,包括向量库升级、LLM本地部署和检索效果调优。该方案具有轻量化、易

文章图片
#spring boot#后端#java
通俗解析 LLMS、RAG、AIAgent 差异:技术定位与场景适配

摘要: LLMS(大语言模型)、RAG(检索增强生成)、AIAgent(人工智能代理)是生成式AI技术的三个关键层级,分别对应“基础能力—优化方案—系统形态”。LLMS是文本生成的核心引擎,RAG通过外接知识库提升准确性,AIAgent则具备自主任务执行能力。三者协同工作:LLMS提供基础语言处理,RAG补充动态知识,AIAgent整合工具与规划实现复杂目标。应用选型时,简单文本任务用LLMS,精

文章图片
#idea
Spring AI 整合 MCP 实现联网搜索:基于 Tavily 的实战指南

Spring AI 整合 MCP 与 Tavily 的核心价值在于 “让 LLM 具备实时信息获取能力”,通过 MCP 协议标准化工具调用流程,降低了外部工具集成的复杂度。本文提供的方案轻量化、易扩展,适合智能客服、资讯助手、技术查询等需要实时数据的场景。实际应用中,可根据业务需求扩展工具类型、优化 LLM 决策逻辑与搜索参数,平衡响应速度与信息准确性。随着 Spring AI 生态的持续完善,M

文章图片
#人工智能
大模型本地化部署指南:Mac OS 环境下 Dify 搭建实操手册

本文详细介绍了在MacOS系统下本地化部署Dify大模型开发平台的完整流程。首先从环境准备着手,包括系统版本检查、依赖组件安装及资源配置;其次通过Docker Compose实现容器化部署,涵盖数据库、API服务和前端应用的配置;最后提供功能验证与性能优化方案。文章特别针对M系列芯片的兼容性问题给出解决方案,并分享了服务监控脚本,帮助开发者实现稳定高效的本地部署。整个流程包含具体代码示例,为技术人

文章图片
#intellij-idea
爬虫实战:Craw4AI+LLM 语义解析,动态页秒爬不被识别(附代码)

摘要:Craw4AI+LLM智能爬虫方案突破传统动态网页爬取瓶颈,通过"智能渲染+语义解析"实现高效数据采集。该方案利用Craw4AI框架自动处理JavaScript渲染和反爬机制,结合LLM模型实现自然语言数据提取,无需关注DOM结构变化。核心优势包括:1秒内完成动态页渲染、模拟真实用户行为规避反爬、30行代码快速部署。文章详细介绍了环境配置、代码实现、进阶优化及常见问题解决

文章图片
#爬虫
VSCode 远程连接服务器运行 AI 代码:实操指南与环境适配

本文介绍了使用VSCode远程连接服务器运行AI代码的完整流程。主要内容包括:1)本地和服务器端的准备工作,包括插件安装和基础环境配置;2)详细说明SSH远程连接服务器的操作步骤;3)提供AI代码运行与调试的实践示例,涵盖模型推理和训练场景;4)分享远程调试技巧和常见问题解决方案;5)针对大模型训练提出显存优化建议。该方法可实现"本地编写-服务器运行"的高效开发模式,解决本地设

文章图片
#vscode#服务器#人工智能
Java 实操:WebSocket 实时推送数据到数据大屏(附前后端代码)

本文介绍如何使用Java(SpringBoot)和WebSocket实现数据大屏实时更新系统。通过WebSocket全双工通信替代传统轮询方式,显著降低延迟和服务器压力。内容包括:1)核心原理与SpringBoot集成方案;2)后端实现(配置类、处理器、定时推送);3)前端大屏页面(数字卡片+ECharts图表);4)生产环境优化建议(心跳检测、安全验证等);5)常见问题解决方案。该方案代码精简高

文章图片
#java#websocket#开发语言
3 步入门:Cursor 与 MCP 服务初次对接实战教程(附代码)

本文介绍了AI编程工具Cursor与微服务管控平台MCP的快速对接方法。通过3个关键步骤:配置连接参数、编写接口调用代码和验证结果,开发者可在15分钟内完成对接。文章提供了完整的Python代码示例,支持服务列表查询功能,并包含常见问题解决方案。这种"AI辅助+服务化"模式能显著提升开发效率,适用于微服务架构下的日常开发工作。对接后还可扩展更多MCP接口调用和AI代码生成功能。

文章图片
    共 66 条
  • 1
  • 2
  • 3
  • 7
  • 请选择