logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型本地部署工具有哪些?如何选择?

本文系统梳理了大模型本地部署工具生态,从推理引擎、图形化前端到专用场景工具,提供了全景分类和选型指南。核心选型五步法建议:1)明确隐私/性能/成本等优先级;2)根据硬件选择适配方案(CPU选Ollama/llama.cpp,GPU选vLLM/TGI);3)考虑工程化需求;4)团队规模匹配工具复杂度;5)典型场景组合方案。文章提供了快速上手命令示例,并指出常见避坑要点:格式匹配、显存优化、并发策略及

#语言模型#机器学习#自然语言处理
Agent 强化学习Agentic RL介绍

本文探讨了大语言模型(LLM)在动态环境中作为可学习策略的发展趋势。通过强化学习(RL)框架,LLM正从单纯文本生成转向具备感知、规划、行动和反思能力的智能体。与传统偏好型强化微调(PBRFT)相比,这种"智能体化RL"具有长时域决策、部分可观测状态和多模态动作空间等特点。研究重点包括六大核心能力:规划、工具使用、记忆、推理、自我改进和感知,及其在信息检索、代码工程、GUI操作

#人工智能#自然语言处理#python
MultiVectorRetriever(多向量检索器)介绍

​MultiVectorRetriever 是一种通过为同一信息单元生成并利用多个向量表示来提升检索效果的技术。​​ 它通过多角度、多维度地表达文本内容,增强了系统对复杂查询的理解与匹配能力,是构建高效、精准、智能 RAG 系统的重要组成部分。

#机器学习#人工智能#算法
LangChain解析PDF文件工具:UnstructuredPDFLoader

项目说明​Loader 名称(LangChain)​​​功能​从 PDF 提取文本,支持分页、多元素、OCR,功能强大且灵活​推荐模式​(按页拆分,清晰易用)​输出​List[Document],含和metadata​适用场景​RAG、文档问答、知识库构建、文档分析等​依赖​langchain,如需 OCR 则🔧。

阿里ModelScope 与 DashScope 的区别

ModelScope和DashScope是阿里巴巴达摩院推出的两大AI平台,定位不同但可互补。ModelScope是开源模型社区,提供模型下载、本地推理和微调功能,适合开发者与研究者在本地运行模型;DashScope则是大模型API服务平台,提供即调即用的商用模型服务,适合企业快速集成AI能力。前者侧重模型多样性和开源透明,后者强调高可用和企业级SLA。两者分别满足私有化部署和云端调用需求,形成从

#机器学习#自然语言处理
Cursor发布首个编程大模型!代码生成250tokens/秒,8个AI Agent并行编码

Cursor推出2.0版本,搭载自研编程大模型Composer。该MoE架构模型在内部基准测试中代码生成速度达250tokens/s,交互延迟控制在30秒内,支持并行8个智能体协作开发。产品亮点包括浏览器工具集成、沙盒终端安全隔离及多智能体评审功能。提供免费至200美元/月的订阅方案,但模型预训练细节未完全公开引发透明度争议。需注意多智能体并行可能带来显著成本上升,建议结合评审流程平衡质量与开销。

#python#人工智能#自然语言处理
AI 编程工具Claude Code 介绍

《ClaudeCode:终端级AI编程助手的技术解析》摘要 Anthropic推出的ClaudeCode是深度集成开发环境的AI编程助手,将Claude系列模型能力融入命令行与IDE工作流。核心特性包括:1) 跨文件编辑与大型代码库理解;2) 终端原生交互与主流IDE插件支持;3) Git集成与工程化任务闭环;4) 安全可控的执行机制。支持自定义扩展与MCP协议对接外部工具链,适配macOS/Li

#人工智能#机器学习#python
Google ADK、OpenAI Agents SDK 和 AgentScope的详细对比

Google 官方推出的全栈式多智能体开发平台,专为构建、测试、部署基于 Google 生态(如 Gemini、Vertex AI)的智能体系统设计,强调“多智能体协作”的工程化落地(如企业级客服、复杂任务分解)。OpenAI 提供的轻量级多智能体编排工具包,聚焦简化多智能体的协作逻辑(如工具调用、任务交接、安全护栏),支持跨模型(不限于 OpenAI),适合快速开发灵活的智能体组合。AgentS

#人工智能#机器学习#python
Gemini 3.0 Pro 重磅发布,测评来了。

摘要: 谷歌Gemini3.0Pro作为2025年旗舰多模态模型,在推理、编程、长上下文及智能体任务上表现突出。评测显示其在数学竞赛(AIME2025满分)、多模态理解(MMMU-Pro 81%)和长文档检索(1M上下文77%准确率)领先。真实场景中支持高保真UI开发、跨模态学习辅助及自动化办公。开放通过Gemini应用、GoogleAIStudio及API,但部分功能受地域限制。优势包括前端原型

#人工智能#自然语言处理
LangChain 1.0 中间件详解

LangChain 1.0中间件系统为智能体执行流程提供了可插拔的钩子系统,通过预处理、拦截和修改机制增强可控性与可观测性。该系统支持上下文工程、流程控制、安全合规等核心能力,采用顺序和嵌套执行模型,并允许流程跳转。内置中间件涵盖摘要生成、人工干预、隐私保护等生产需求,开发者也可通过装饰器或类方式自定义中间件。最佳实践建议保持单一职责、优先使用内置组件、注意执行顺序,并配合LangGraph运行时

#中间件
    共 33 条
  • 1
  • 2
  • 3
  • 4
  • 请选择