logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Ollama 和 vLLM 到底怎么选?大模型推理框架全方位对比

我们将分析 Ollama 和 vLLM 这两个最受欢迎的框架,它们都支持 OpenAI API 兼容性。本分析将涵盖性能、易用性、自定义能力以及其他有助于选择最适合你特定用例的框架的公平比较。

文章图片
#人工智能#自然语言处理#transformer +1
企业级大模型部署指南:Ollama、vLLM 和 LMDeploy,各有千秋!

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

文章图片
#产品经理#深度学习#人工智能 +2
收藏!2026年大模型本地部署不迷路:Ollama与vLLM对比,看完就知道怎么选

文章对比了Ollama与vLLM两大本地部署框架:Ollama以极简体验著称,一行命令即可运行模型,适合个人学习;vLLM凭借PagedAttention技术实现3倍以上吞吐量和更低显存占用,性能卓越,适合企业高并发场景。根据不同需求,个人开发者可选Ollama入门,企业服务应选vLLM,也可采用"先用Ollama验证,后迁移至vLLM"的渐进式策略,平衡成本与性能。

文章图片
#人工智能#语言模型#自然语言处理 +1
大模型本地部署选型指南:Ollama与vLLM对比,2025年最全攻略(建议收藏)

本文对比了Ollama与vLLM两大本地部署框架。Ollama以极简部署著称,"一行命令"即可运行模型,适合个人开发者和小规模应用;vLLM则凭借PagedAttention技术实现3倍以上的吞吐量,支持高并发,更适合企业级服务。2025年,个人学习/低预算场景选Ollama,企业高并发服务选vLLM仍是最佳选择,两者虽有融合趋势但定位依然清晰。

文章图片
#学习#人工智能#语言模型
GraphRAG + Ollama 本地部署全攻略:避坑实战指南

微软开源 GraphRAG 后,热度越来越高,目前 GraphRAG 只支持 OpenAI 的闭源大模型,导致部署后使用范围大大受限,本文通过 GraphRAG 源码的修改,来支持更广泛的 Embedding 模型和开源大模型,从而使得 GraphRAG 的更容易上手使用。需要 Python 3.10-3.12 环境。安装完整后,需要创建一个文件夹,用来存储你的知识数据,目前 GraphRAG 只

文章图片
#python#后端#人工智能 +2
从vLLM到大模型推理的最新进展

大模型推理引擎经过一年多发展,进入了一个关键的调整期。一方面,针对定制集群的分离式架构出现,很多业务方自己定制更复杂的并行和调度方案。另一方面,LLM的用法更加复杂,催生了LLM Programs使用范式。此外,非NVIDIA的NPU如雨后春笋般涌现,它们独特的硬件特性亟待新的系统架构来充分挖掘与利用。在这一背景下,以vLLM为代表的开源LLM推理引擎正面临着前所未有的进化压力。而SGLang此次

文章图片
#人工智能#语言模型#自然语言处理
阿里面试官问:为什么vllm能够加快大模型推理速度?

如果对比过 vllm 进行大模型推理 和 直接调用模型generate 就会知道 vllm可以让推理速度比直接调用模型generate快2-4倍。那问题来了,?

文章图片
#人工智能#学习#产品经理 +2
一文彻底搞懂大模型 - LLaMA-Factory

如何高效地微调和部署大型语言模型(LLM)?什么是LLaMA-Factory?LLaMA-Factory,全称Large Language Model Factory,即大型语言模型工厂。它支持多种预训练模型和微调算法,提供了一套完整的工具和接口,使得用户能够轻松地对预训练的模型进行定制化的训练和调整,以适应特定的应用场景,如智能客服、语音识别、机器翻译等。

文章图片
#人工智能#学习#算法
一文彻底搞懂大模型 - LLaMA-Factory

如何高效地微调和部署大型语言模型(LLM)?什么是LLaMA-Factory?LLaMA-Factory,全称Large Language Model Factory,即大型语言模型工厂。它支持多种预训练模型和微调算法,提供了一套完整的工具和接口,使得用户能够轻松地对预训练的模型进行定制化的训练和调整,以适应特定的应用场景,如智能客服、语音识别、机器翻译等。

文章图片
#transformer#深度学习#人工智能 +2
别再被AI术语忽悠了!用大白话讲透机器学习、神经网络与自注意力,建议收藏

文章用通俗比喻(如小孩认字、工厂流水线)深入浅出地讲解了AI核心概念:机器学习、线性回归、神经网络、深度学习及自注意力机制。通过层层递进的逻辑,揭示了从基础算法到ChatGPT等大模型底层原理的关系,帮助小白快速入门。

文章图片
#人工智能#学习#产品经理
    共 1795 条
  • 1
  • 2
  • 3
  • 180
  • 请选择