
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
文章为AI产品经理提供了55个关键概念,帮助理解和掌握AI产品开发。内容涵盖AI基础认知、Prompt与效果调优、知识与检索、Agent与工程、多模态与垂直能力、产品运营与度量等六大层面。强调了AI产品经理需具备的认知框架和决策能力,以及如何通过数据飞轮构建产品护城河。文章建议新手先从基础概念入手,逐步深入学习和实践。
本文介绍了三款智能软件工具:Ollama、Ollama WebUI和Ollama中文网精选模型。Ollama是一个开源项目,简化了大型语言模型(LLM)的本地部署过程,支持多种硬件配置。文章详细说明了安装流程、硬件要求和使用方法,并推荐了适合不同配置的中文模型。此外,还介绍了如何部署Ollama WebUI图形界面,通过Docker实现更友好的交互体验。这些工具为开发者提供了在本地运行和测试AI模

在大模型发展的浪潮中,模型部署成为了从理论到实践的关键一环。Ollama和vLLM作为当下备受瞩目的大模型部署工具,以其独特的技术优势和便捷的使用方式,吸引了众多开发者和企业的目光。今天,就带大家深入了解这两款工具,掌握大模型部署的核心技术,包括关键的日志调试与常用命令。

在安装docker和ragfllow的过程中遇到了2个问题,主要有:①wsl没有更新,需要根据提示更新wsl后才能完成docker desktop的安装;②docker Engine镜像仓库拉取到一半无法拉取的问题,由于ragfflow比较大,需要较好的网络,如无法拉取,多执行几次命令:

Docker 容器无法访问 Ollama 服务。localhost 通常指的是容器本身,而不是主机或其他容器。要解决此问题,你要将 Ollama 服务暴露给网络。

很多企业或者个人都想在本地部署一套大模型来满足一些特殊场景的需求,在过去,因为deepseek表现出的卓越性能,使得其成为大部分企业或者个人本地化部署的首选。此外,由于deepseek对外完全开源,也就是我们部署到本地无需给deepseek公司支付任何费用,甚至使用deepseek进行任何商业行为,deepseek公司也不会来管你。这就给特别多人带来一个很大的误区,以为可以使用很低的成本就可以部署

Ollama 是一个开源工具,专为在本地计算机上高效运行大型语言模型(LLM,如 deepseek-r1、qwen2.5 等)而设计。它简化了模型的下载、部署和管理流程,让用户无需复杂配置即可在本地体验和开发基于大语言模型的应用。从 ollama 的网站上可以查看所有的模型信息:

将开源的大语言预训练模型部署到用户设备上进行推理应用,特别是结合用户专业领域知识库构建AI应用,让AI在回答时更具有专业性,目前已经有很多成熟的应用方案。其中,支持大模型本地化部署的平台及工具很多,比较出名的有ollama、vLLM、LangChain、Ray Serve等,大大简化了模型的部署工作,并提供模型全生命周期管理。

Triton是NVIDIA推出的模型推理服务器,vLLM是伯克利大学推出的大模型推理引擎。一般而言,Triton主要负责调度策略来提高服务的吞度,比如动态批处理、多实例并发等,配合TensorRT、ONNX等后端来联合使用,后者负责推理内核来降低延迟;而在Triton+vLLM的组合中,Triton不会做任何的调度处理,而是将请求全部打给vLLM,让vLLM根据PagedAttention和异步A

大模型长序列的处理能力已越来越重要,像复杂长文本任务、多帧视频理解任务、以及 OpenAI 近期发布的 o1、o3 系列模型的高计算量模式,需要处理的输入 + 输出总 token 数从几万量级上升到了几百万量级。面对模型日益增长的长序列需求,在预训练(Pre-Training)和后训练(Post-Training)阶段,所用的平台框架都需要支持更长序列数据的训练。不同于预训练阶段基于 Megatr








