logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

本地大模型私有化部署与推理加速全攻略:从个人玩具到企业级生产落地

大模型私有化部署全流程指南 本文提供一站式大模型私有化部署解决方案,覆盖Llama 3/Qwen/DeepSeek等主流开源模型。内容包含: 硬件选型指南:针对不同场景(个人学习/企业生产)提供最优配置方案 环境搭建:提供Ubuntu系统下一键安装CUDA/PyTorch/Docker的完整脚本 部署方案: 个人快速部署:Ollama一键开箱即用方案 企业级生产部署:Docker容器化方案 关键优

#人工智能
5个免费开源大模型API,完美平替OpenAI,个人开发完全够用了(2026最新保姆级指南)

开源大模型助力个人开发者实现OpenAI自由 随着开源大模型技术突破,个人开发者现可通过完全兼容OpenAI接口的开源模型解决核心痛点: 成本问题:Meta Llama4、DeepSeek V3等顶尖开源模型提供永久免费API服务,部分平台每月提供1000万token免费额度 能力对标:Llama4 70B在通用知识、代码生成等基准测试中超越GPT-3.5,接近GPT-4o水平 接口兼容:无需修改

#个人开发#人工智能
大模型应用开发核心三要素:MCP、Skill、工具 深度拆解与实战指南(2026最新版)

在大模型应用的技术体系中,工具是大模型与外部世界交互的、具备明确输入输出契约的原子化可执行能力单元。知识边界:突破预训练数据的时间、领域限制,获取实时、专属的领域数据;能力边界:突破纯文本推理的限制,实现文件操作、数值计算、API调用、多模态处理等可执行操作;环境边界:突破本地运行环境限制,与数据库、云服务、硬件设备、第三方系统进行交互。

【30天做一个生产级RAG知识库系统】第5篇:Prompt工程与大模型调用封装,解决幻觉问题

摘要: 本文针对RAG(检索增强生成)系统中的大模型幻觉问题,提出了一套商用级解决方案。通过体系化Prompt工程、多模型兼容调用和引用溯源机制,从根源抑制幻觉,实现稳定问答。 核心内容: 幻觉根源分析:总结5大幻觉来源(Prompt约束缺失35%、检索内容无效30%等),强调商用场景需解决多模型兼容、成本控制等痛点。 Prompt工程铁律:提出6项设计原则,如强约束优先、强制引用溯源,并提供可直

#人工智能
零基础从入门到精通 LangChain(保姆级超详细教程)上篇

相信很多刚接触大模型应用开发的同学,都有过这样的困惑:原生的大模型API只能做简单的单轮对话,想做一个能读取自己PDF/文档的专属问答机器人、能联网查数据的智能助手、能自动完成复杂任务的AI Agent,却不知道从何下手?网上的教程要么过于零散,只讲单个功能,不成体系;要么跳步严重,刚入门就被一堆陌生概念搞懵;还有大量教程用的是早已过时的语法,复制代码全是报错,入门直接从入门到放弃。别担心,这篇《

Spring AI 和 FastAPI+LangChain 哪个好?全维度对比与选型建议(后附实战案例)

本文对比了两种企业级AI应用架构:Spring Boot+Vue+Spring AI的全Java技术栈与Spring Boot+Vue+Python(FastAPI+LangChain)的混合架构。前者优势在于技术栈统一、依赖管理简单、部署运维方便,适合轻量级AI需求;后者通过独立AI服务层,充分利用Python在AI领域的生态优势,支持更复杂的RAG、Agent等高级功能,具有更强的定制化能力和

#spring#人工智能#fastapi +2
LangChain vs LlamaIndex,AI 后端开发到底怎么选?场景 / 性能 / 门槛全对比

很多新手一直在纠结“LangChain和LlamaIndex哪个更好”,其实这个问题本身就是错的。LlamaIndex是“数据检索专家”,它把所有的精力都放在了“如何让LLM更好地使用你的私有数据”这件事上,把RAG做到了极致,让新手用最少的代码,就能实现最好的检索效果。LangChain是“流程编排专家”,它把所有的精力都放在了“如何让LLM完成复杂的业务流程”这件事上,把Agent和工作流做到

#人工智能
零基础从入门到精通 LangChain(保姆级超详细教程)附加篇:LangChain 面试八股文全集

本文系统梳理了LangChain核心概念与高频面试题,帮助开发者全面掌握LLM应用开发框架。内容分为基础概念和核心组件两大部分: 基础概念部分(★必考): LangChain定位为大语言模型应用开发框架,提供标准化、组件化的开发套件,解决LLM API的工程化难题 LCEL表达式语言通过管道符组合组件,提供统一接口、生产级能力和极简语法 七大核心组件覆盖LLM开发全流程:模型、提示词、输出解析、文

#面试#职场和发展
零基础从入门到精通MySQL(下篇):精通篇——吃透索引底层、锁机制与性能优化,成为MySQL实战高手

MySQL性能优化与索引原理精要 本文深入解析MySQL性能优化的核心机制,重点剖析InnoDB索引的底层实现原理与优化策略。主要内容包括: 索引本质与B+树结构:索引是减少数据扫描量的数据结构,InnoDB采用B+树实现,其多路平衡特性使亿级数据查询仅需3-4次IO 索引类型: 聚簇索引:按主键构建,叶子节点存储完整数据 二级索引:存储键值与主键,查询需回表操作 联合索引与最左匹配:联合索引按字

#mysql#性能优化#数据库
Cursor 全维度深度使用教程:从入门到精通,解锁AI编码的终极效率范式

《AI编码利器Cursor全指南:从入门到实战》 摘要: 本文全面介绍AI原生代码编辑器Cursor的核心功能与使用技巧。作为专为AI协同设计的开发工具,Cursor通过深度集成大语言模型,提供原生级上下文感知、全流程对话式编码和全代码库智能索引等独特优势。教程从基础安装配置讲起,重点解析两大核心快捷键操作:Ctrl+K快速编辑代码片段和Ctrl+L对话式开发协同。文章还涵盖进阶功能、实战案例、最

#人工智能
    共 45 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择