
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本地客户端具有部分国际化测试文件需要执行翻译,格式示例如下,多层嵌套的 json 格式,value 为string类型。需要利用大模型对整个 json 文件进行翻译,将中文翻译为英文后按原格式返回

Ollama是一款专注于简化大型语言模型本地部署和运行的开源框架,基于Go语言实现,支持跨平台运行,并以“开箱即用”为核心理念,适合个人开发者和轻量化场景。而vLLM是一个高效的大模型推理与服务引擎,基于PyTorch构建,创新性地引入了PagedAttention技术,旨在解决大模型服务中的显存效率与吞吐量瓶颈,支持张量并行和流水线并行,可横向扩展至多机多卡集群。

本教程详细介绍了如何使用 DeepSeek R1 和 Ollama 构建本地化的 RAG 应用系统。我们通过四个主要步骤实现了完整的功能:文档处理:使用 PDFPlumberLoader 加载 PDF 文档,并通过 RecursiveCharacterTextSplitter 将文本切分成适当大小的块。向量存储:利用 Chroma 数据库和 Ollama 的嵌入模型建立向量存储系统,为后续的相似度

本文详细介绍了vLLM框架,它专为高性能推理、批处理、并发和服务器部署而设计。文章对比了vLLM与Ollama的优缺点,介绍了Hugging Face和ModelScope两大模型下载平台的使用方法,并提供了从零开始使用vLLM启动服务的完整教程。文章还针对不同应用场景给出了框架选择建议,帮助开发者根据自身需求选择适合的部署方案,实现大模型服务的高效运行。

本文主要介绍如何安装ollama,并演示2种加载模型的方法:(1)拉取ollama官方已经有的模型,进行LLM服务部署。(2)加载本地模型部署大模型服务。最后,对部署的LLM服务的接口进行测试。为了帮助更多热爱技术、渴望成长的朋友,我特别整理了一份涵盖大模型领域的宝贵资料集。这些资料不仅是我多年积累的心血结晶,也是我在行业一线实战经验的总结。这些学习资料不仅深入浅出,而且非常实用,让大家系统而高效

本文提出大模型推理优化的"分形思考框架",基于分形几何自相似性原理,在全层级遵循"看清楚-避免浪费-提升利用率-节约资源"的统一优化逻辑。以DeepSeek R1/V3大模型为例,详细阐述了四大资源(算力、显存、显存带宽、通信带宽)的计算与分析方法,分享了从宏观到微观的多层级优化实践,为应对大模型推理性能优化复杂性提供了系统性思路。

MCP是Anthropic推出的模型上下文协议,旨在解决大模型与外部工具的安全高效连接问题,具有统一标准、双向通信、上下文理解、可拓展性和内置安全机制五大优势。文章详细介绍了AI大模型应用开发的学习路线,包括大模型基础认知、核心技术模块、开发基础能力、应用场景开发、项目落地流程和面试求职冲刺六大模块,为AI学习者提供了从入门到就业的全面指导。

通过探索AI Agent的学习和研究,让我体会到了人工智能在自动化和效率提升方面的巨大潜力。通过实践,也学会了将AI Agent融入到不同的业务场景中,推动一些实际工作中决策的制定和客户体验。以上就是小智和大家的分享,通过这篇文章想必大家和我一样对智能体有了更全面的认识和体验。

在当前的人工智能浪潮中,我们正经历一场从“语言模型”到“行动智能体”(AI Agent)的深刻范式迁移。大模型(LLM)的出现解决了机器的认知问题,但要让机器真正参与并主导现实世界的复杂任务,我们需要一个更完整、更具备自主性的系统框架。

2025年,AI智能体(AI Agent)正以颠覆性的姿态席卷各行各业。医疗领域中,AI医生能通过患者症状自动生成诊断报告,并推荐个性化治疗方案;金融领域里,智能投顾实时分析市场数据,动态调整投资组合;教育领域中,AI导师根据学生的学习轨迹生成定制化课程,甚至模拟真实教师的互动风格。








