
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
大型语言模型(LLMs)正在改变我们与技术的互动方式,从聊天机器人到代码助手,功能无所不包。但要高效运行这些模型可不是件小事,尤其是在需要速度、可扩展性和高吞吐量应用的稳定性时。如果你一直在用Ollama进行本地LLM实验,现在想转向vLLM以获得生产级性能,这篇文章的主要目的是讲解这两个框架的区别,探讨选择正确框架的重要性,并提供一步步的指导。

Ollama 作为一款备受欢迎的本地大模型部署工具,一直以来主要专注于文本生成能力。虽然在之前的版本中已经初步支持了多模态模型,但由于底层 llama.cpp 实现的局限性,与各大厂商最新多模态模型的兼容进展一直较为缓慢。在这一背景下,Ollama 团队在最新的 0.7 版本中对核心引擎进行了全面重构,彻底解决了多模态模型适配的技术瓶颈。这次重构不仅优化了底层架构,还专门设计了灵活的接口,能够快速

Qwen3是阿里巴巴Qwen团队最新发布的开源大语言模型,提供具有竞争力的性能,高度模块化和工具使用能力。在本指南中,我将向您展示如何通过Ollama在本地运行Qwen3,并启用MCP(模型上下文协议)工具功能,如代码解释器、网络获取和时间查询。到最后,您可以构建由Qwen3驱动的智能助手,完全在您的机器上运行——无需云API密钥!

ollama 是一个开源的本地大语言模型运行框架,它提供了非常简单便捷的使用形式,让用户可以十分方便的在本地机器上部署和运行大型语言模型,从而实现免费离线的方式使用 LLM 能力,并确保私有数据的隐私和安全性。
Docker 容器无法访问 Ollama 服务。localhost 通常指的是容器本身,而不是主机或其他容器。要解决此问题,你要将 Ollama 服务暴露给网络。

各大文章都在讲如何通过ollama运行DeepSeek R1蒸馏版,我也深以为然,但我一直是通过vllm来运行的,想着都是同样的模型,也就觉得没什么不同了。可是今晚在测试ollama时,发现不对啊。
本文提供一站式指南,教你如何在Windows和Ubuntu系统上部署Void编辑器与Ollama,并配置轻量级Qwen3-4B-2507模型构建本地AI辅助开发环境。该模型可在普通硬件(包括千元手机和4060笔记本)上流畅运行。教程详细涵盖四个部分:安装前准备、Void编辑器安装、Ollama安装与配置、模型获取与设置,适合新手逐步操作,无需联网即可享受AI辅助编程体验。

llama毕竟是英文预料训练出来的,中文处理不太好, 没有明确指示的情况下(比如写个 llama3),默认回复语言都是英语,对英语的处理理解能力也更好MaxKG 数据库建议直接把问题和答案整理出来, 现成的 QA 问答对不管在哪个平台上都比直接塞预料让模型自己理解分段效果好

大语言模型(LLM)是基于深度学习的超大规模神经网络,能理解、生成自然语言并执行复杂任务。其核心架构是Transformer,通过自注意力机制捕捉上下文关系。LLM训练包括预训练和微调两个阶段。GPT基于Transformer的解码器,擅长文本生成;BERT基于编码器,侧重语言理解。Token是文本处理的基本单位。预训练成本高昂,但开源模型和微调技术降低了应用门槛,使大模型在特定领域应用成为可能。

本文通过公司实习生的比喻,系统解析了AI领域的五大核心概念:Prompt(指令输入)、Agent(自主执行)、Skill(标准化流程)、MCP(工具连接协议)和Claude Code(集成产品)。这些概念构成从"与AI对话"到"让AI自主工作"的完整体系,各自扮演不同角色:Prompt明确目标,Agent规划执行,Skill提供方法,MCP连接外部,Claude Code是现成解决方案。理解它们的








