logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Ollama 自定义大模型实战:从 HuggingFace 到本地部署的完整指南

本文详细介绍了如何从HuggingFace获取开源大模型并自定义部署到Ollama平台的完整流程。通过环境配置、模型转换、量化优化等关键步骤,帮助开发者实现特定领域模型的本地化应用,提升模型运行效率和专业性。重点讲解了GGUF格式转换、量化方法选择以及Modelfile配置等核心技术要点。

#Ollama
云架构师必读:生成式AI技能如何重塑云计算职业能力

云计算作为现代IT基础设施的核心,其核心价值在于提供弹性、可扩展和高可用的资源服务。随着生成式AI技术的爆发式增长,传统稳态工作负载正快速向智能、瞬态范式转移,这从根本上改变了云平台的设计、运维和成本优化逻辑。理解大语言模型(LLM)的基本原理、提示工程和AI应用开发生命周期,已成为云专业人士进行高效架构设计的必备基础。从技术价值看,这种融合能力能直接优化模型推理成本、设计AI原生监控体系,并构建

#生成式AI#云计算
AI代理与MCP协议:构建Claude增强的智能开发工作流实践

在软件开发领域,AI代理(AI Agent)正成为提升研发效能的关键技术。其核心原理是通过大语言模型理解自然语言指令,并调用外部工具执行具体任务,实现从被动工具到主动协作的范式转变。这一技术价值在于将开发者的高阶意图自动转化为可执行操作,显著提升编码、测试与项目管理的自动化水平。在实际应用场景中,AI代理常与Model Context Protocol(MCP)结合,后者作为标准化协议,定义了AI

纯前端ChatGPT-Web部署指南:Nginx/Caddy反代配置与多模型集成

在现代Web开发中,前后端分离架构已成为主流范式,其核心在于将用户界面与业务逻辑解耦,通过API进行数据交互。这种设计模式基于HTTP协议和RESTful原则,允许前端独立演进,并通过反向代理等技术实现安全、高效的请求转发。从技术价值看,它提升了开发效率、应用性能和可维护性。在工程实践中,反向代理服务器(如Nginx、Caddy)扮演着关键角色,不仅能隐藏后端服务细节、实现负载均衡,更是解决跨域问

Claude Sonnet 4 工作流级落地指南:输入净化、分层提示与输出契约

大语言模型在生产环境中的稳定输出,本质是确定性工程问题。Claude Sonnet 4 以高响应一致性著称,但其对输入文本结构极度敏感——零宽字符、Unicode变体、HTML噪声等微小干扰即可导致JSON解析失败。这要求开发者从‘调用API’转向‘构建推理管道’:通过Unicode标准化(NFKC)、分层system prompt设计、强约束JSON Schema验证等手段,建立输入净化→结构锚

DeepSeek R1 在 Databricks 上的生产级部署指南

大语言模型(LLM)推理服务需兼顾高性能、可治理与企业合规性。MoE 架构模型如 DeepSeek R1 凭借稀疏激活与长上下文支持,在数学推理和代码生成任务中表现突出;而 Databricks Model Serving 提供免运维的 GPU 推理底座,结合 Unity Catalog 实现模型血缘追踪、细粒度权限与 SOC2 合规审计。本文聚焦真实生产约束——绕过 Serverless 内存墙

软件工程智能体学术地图:从入门到前沿的论文清单指南

软件工程智能体(AI Agent)正通过大语言模型(LLM)和检索增强生成(RAG)等技术,深刻改变软件开发流程。其核心原理在于将AI的感知、决策与执行能力应用于软件生命周期的各个环节,从需求分析、代码生成到测试运维。这一融合的技术价值在于提升开发效率、自动化复杂任务并辅助工程决策。其应用场景广泛覆盖了智能编程助手、自动化测试、DevOps运维及多智能体协作系统等领域。本文聚焦于一份由复旦大学软件

基于三省六部制设计AI多智能体协作框架:可观测、可审计的工程实践

多智能体系统(Multi-Agent System)是分布式人工智能的重要分支,其核心在于多个自主智能体通过协作完成复杂任务。传统多智能体框架常面临过程不透明、协作混乱、结果不可控等挑战,本质上是缺乏有效的协调与制衡机制。为解决这些问题,工程实践中引入了流程化、制度化的设计思想,通过状态机、权限矩阵和实时监控体系,将任务执行过程从黑盒变为白盒,从而实现可观测、可审计、可干预。这种制度化的协作范式尤

Cradle智能体开发框架:从模块化架构到实战应用全解析

智能体(Agent)作为人工智能领域的重要分支,其核心是让大语言模型(LLM)具备感知、规划与执行能力,从而完成复杂任务。其工作原理通常基于模块化架构,将任务分解为规划、工具调用、状态管理等环节,通过与环境交互实现目标。这一技术价值在于将AI从单纯的对话与生成,升级为能主动操作软件、处理工作流的自动化助手,极大地提升了人机协作效率。在应用场景上,智能体广泛应用于自动化办公、软件测试、游戏AI以及跨

智能体架构深度解析:从ReAct模式到生产级AI应用开发

智能体(Agent)作为AI应用开发的前沿方向,其核心在于实现从被动响应到主动执行的思维范式转变。其工作原理基于经典的“感知-思考-行动”循环(ReAct模式),通过大语言模型(LLM)进行任务规划与决策,并调用外部工具执行具体操作。这一架构的技术价值在于将LLM从对话接口升级为能够理解复杂指令、拆解任务并安全执行的“数字执行者”,是实现自动化客服、数据分析助手和流程自动化等场景的关键。在实际工程

    共 30 条
  • 1
  • 2
  • 3
  • 请选择