logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Python+Ollama+BGE-M3构建本地知识库系统:从零开始打造专属智能问答助手(必学收藏教程)

本文详细介绍了如何使用Python结合Ollama框架和BGE-M3模型构建本地知识库系统。内容涵盖Ollama安装配置、BGE-M3模型下载、多格式文档提取、文本预处理、向量检索及智能问答系统实现。该系统支持PDF、Word等文档格式,提供高效语义搜索和自然语言问答功能,完全本地部署保护数据隐私,适合企业文档管理、个人知识整理等多种场景。

#python#人工智能#学习
从Ollama到vLLM:大模型框架选择指南,小白必学!收藏级性能对比与实战教程

本文详细对比了Ollama和vLLM两大LLM框架,从基础功能、性能差异到适用场景进行全面分析。Ollama适合本地测试、隐私敏感场景和资源受限环境;vLLM凭借PagedAttention和continuous batching技术,专为高吞吐量生产环境设计。文章提供两框架的安装指南、故障处理方法,并帮助开发者根据需求做出正确选择,实现从实验到生产的平稳过渡。

文章图片
#人工智能#机器学习#产品经理
主流大模型推理框架全面对比:vLLM、SGLang、TensorRT-LLM、Ollama、XInference 选型指南

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。

文章图片
#人工智能#产品经理#学习
大模型部署利器:Ollama 与 vLLM 深度解析

Ollama是一款专注于简化大型语言模型本地部署和运行的开源框架,基于Go语言实现,支持跨平台运行,并以“开箱即用”为核心理念,适合个人开发者和轻量化场景。而vLLM是一个高效的大模型推理与服务引擎,基于PyTorch构建,创新性地引入了PagedAttention技术,旨在解决大模型服务中的显存效率与吞吐量瓶颈,支持张量并行和流水线并行,可横向扩展至多机多卡集群。

文章图片
#人工智能#学习#自然语言处理
本地部署Anything LLM+Ollama+DeepSeek R1打造智能知识库并实现远程访问

为了方便演示,我们在上边的操作过程中使用cpolar生成的HTTP公网地址隧道,其公网地址是随机生成的。这种随机地址的优势在于建立速度快,可以立即使用。然而,它的缺点是网址是随机生成,这个地址在24小时内会发生随机变化,更适合于临时使用。如果有长期使用Anything LLM远程访问本地部署的DeepSeek等大模型,或者异地访问与使用其他本地部署的服务的需求,但又不想每天重新配置公网地址,还想让

文章图片
#人工智能#机器学习#学习 +1
【收藏必备】n8n+Ollama+Qwen3构建企业级RAG检索系统完整教程

本文详细介绍了如何使用n8n、Ollama和Qwen3构建企业级RAG检索系统。内容包括Qwen3-Embedding模型的获取、Ollama的安装与配置、Node.js和n8n的部署、本地模型下载配置、RAG工作流创建、文件解析和语义分割设置,以及检索知识库的完整构建流程。文章提供了详细的操作步骤和命令示例,帮助开发者搭建自己的知识库系统,并通过测试验证系统准确性。这是一份面向程序员的完整RAG

文章图片
#人工智能#算法#学习 +1
让AI转化为生产力,Dify 私有化部署 + 接入Ollama部署本地模型

工欲善其事,必先利其器。AI 是未来十年生产力的核心工具,要让 AI 真正转化为生产力,而不仅仅是围观一时的热潮。如果你对 AI 也很感兴趣,欢迎关注,共同探索 AI 的无限可能,与渔夫一起成长!今天聊聊AI智能体,同时也简单的将 Dify 本地私有化部署,接入 Ollama 部署的本地模型。AI智能体是什么?AI智能体是一种具备AI能力、感知、推理、决策和行动能力的计算系统,它能够自主与环境交互

文章图片
#人工智能#学习#深度学习 +2
大模型部署利器:Ollama 与 vLLM 深度解析

Ollama是一款专注于简化大型语言模型本地部署和运行的开源框架,基于Go语言实现,支持跨平台运行,并以“开箱即用”为核心理念,适合个人开发者和轻量化场景。而vLLM是一个高效的大模型推理与服务引擎,基于PyTorch构建,创新性地引入了PagedAttention技术,旨在解决大模型服务中的显存效率与吞吐量瓶颈,支持张量并行和流水线并行,可横向扩展至多机多卡集群。

文章图片
#人工智能#学习#自然语言处理
大模型推理框架:Ollama和vLLM到底应该选哪个?

在人工智能领域,大语言模型(LLM)的应用日益广泛,选择合适的推理(部署)框架对实现高效、稳定的模型运行至关重要。Ollama和vLLM作为当下流行的LLM部署工具,各具独特优势与适用场景。本文将深入剖析二者的优缺点,并给出选型建议,同时附上它们的具体使用案例,以便读者更直观地了解其应用情况。

文章图片
#人工智能#产品经理#职场和发展 +2
小白学大模型:LLaMA-Factory介绍与使用

Efficient fine-tuning对于将大型语言模型(LLMs)调整到下游任务中至关重要。然而要在不同模型上实现这些方法需要付出相当大的努力。多种精度:32 比特全参数微调、16 比特冻结微调、16 比特 LoRA 微调和基于 AQLM/AWQ/GPTQ/LLM.int8 的 2/4/8 比特 QLoRA 微调。先进算法:GaLore、DoRA、LongLoRA、LLaMA Pro、LoR

文章图片
#人工智能#深度学习#机器学习 +2
    共 1991 条
  • 1
  • 2
  • 3
  • 200
  • 请选择