logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型训练全流程实战指南工具篇(六)——OCR工具实战指南(以DeepSeek-OCR-2为例)

本文以DeepSeek-OCR-2为例,详解其核心特性、本地部署及vLLM推理实战。并延伸后处理策略,涵盖数据清洗、RAG优化到多模态检索,打通从“读出来”到“用起来”的全链路,为高质量数据集构建提供实战指南。

文章图片
#人工智能#python
大模型训练全流程实战指南工具篇(六)——OCR工具实战指南(以DeepSeek-OCR-2为例)

本文以DeepSeek-OCR-2为例,详解其核心特性、本地部署及vLLM推理实战。并延伸后处理策略,涵盖数据清洗、RAG优化到多模态检索,打通从“读出来”到“用起来”的全链路,为高质量数据集构建提供实战指南。

文章图片
#人工智能#python
LangGraph智能体开发设计模式(四)——LangGraph多智能体设计模式:网络架构

本篇重点分享了网络架构及其典型实现Swarm架构的特点,并结合代码示例展示了如何利用langgraph-swarm库构建具备动态移交能力的智能体协作网络。

文章图片
#设计模式#架构#python +1
大模型训练全流程实战指南(一)——为什么要学习大模型训练?

大模型训练是深入AI核心、从技术使用者迈向创造者的关键一步。它不仅赋能垂直领域创新,更是构建个人长期竞争力的硬核技能。无论是企业智能赋能还是研究生学术界的创新点构思,大模型训练都是大家追逐AI浪潮的必备技能,本合集将系统拆解从数据处理、模型训练到强化学习与智能体开发的全流程,并带你从零实现模型,大家掌握大模型训练的全技能,真正掌握塑造智能的能力!

文章图片
#人工智能#python#pytorch
LangGraph智能体开发设计模式(三)——LangGraph多智能体设计模式:主管架构与分层架构

本篇分享了多智能体系统的两种核心架构。主管架构通过主管智能体管理多个专业智能体,适合结构化任务。分层架构引入了团队与层级概念,由顶层主管协调团队主管,从而分担决策压力,提升系统处理复杂任务的能力。

文章图片
#设计模式#架构#人工智能
从分享AI,到与AI共舞—大模型真好玩的2025总结

从前端工程师转型AI领域,回顾了2025年如何通过撰写102篇技术文章分享学习经验,以及利用AI工具(如Trae)提升工作效率的实践。面对AI时代大家应该拥抱未来,用AI赋能工作,用AI改变生活。

文章图片
#人工智能#数据挖掘#数据库
LangChain不支持AgentSkills?那就从0到1实现一个!

本篇内容是笔者针对LangChain智能体工具过多导致性能下降的问题设计的一种仿Claude Skills的解决方案。其核心是通过双层工具架构(Loader Tools与Content Tools)、状态驱动与中间件拦截机制,实现工具的按需动态加载,从而显著降低Token消耗并提升模型调用工具的准确性与效率。

文章图片
#数据库#python#人工智能
Agent Skills完全指南:核心概念丨设计模式丨实战代码

本篇分享了Agent Skills的核心概念、设计模式。并以Claude Code为例,通过代码实战详细演示了Skills的创建、使用及进阶集成方法,帮助大家快速掌握AgentSkills的开发技巧。

文章图片
#设计模式#人工智能#python
准确率飙升!Graph RAG如何利用知识图谱提升RAG答案质量(四)——微软GraphRAG代码实战

本篇分享介绍了GraphRAG从环境安装再到简单命令行调用和高级Python API调用的全部流程。大家看完本期分享将掌握集成GraphRAG代码到自己项目开发中的能力,大幅提升检索知识增强的性能!

文章图片
#知识图谱#microsoft#人工智能 +1
一文深度解析OpenAI近期发布系列大模型:意欲一统大模型江湖?

本篇分享总结了近期OpenAI发布的GPT-OSS开源模型和GPT-5闭源模型的模型背景、核心特性。并对GPT-5的性能争议进行了分析总结,总而言之GPT系列模型仍然是当前最强的AI大模型。

文章图片
#人工智能#自然语言处理#python
    共 17 条
  • 1
  • 2
  • 请选择