logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

超实用!用 Ollama + DeepSeek + Dify 搭建本地知识库,提升企业效率

今天给大家带来一个超实用的开源工具组合,能帮企业快速搭建本地知识库,提升内部信息管理效率。这个组合就是 Ollama + DeepSeek + Dify,接下来我详细说说怎么操作,保证小白也能轻松上手!

文章图片
#人工智能#语言模型#Ollama +1
AI老板心中的迈巴赫:DeepSeek+Ollama+Xinference+RAGFlow+Dify部署教程,RAG落地5件套!

DeepSeek-R1火了之后,Ai老板部署需求大大提升,抛开效果不谈,五件套易用性和灵活性相比VLLM大大提升,门槛较低,但是效果不言而喻。以下部署全部以docker方式进行,因为太方便了,但同时坑很多,请做好心理准备

文章图片
#人工智能#DeepSeek#Ollama
deepseek+ragflow本地部署私有智能问答系统,全程干货,零基础小白也能轻松掌握!!

在安装docker和ragfllow的过程中遇到了2个问题,主要有:①wsl没有更新,需要根据提示更新wsl后才能完成docker desktop的安装;②docker Engine镜像仓库拉取到一半无法拉取的问题,由于ragfflow比较大,需要较好的网络,如无法拉取,多执行几次命令:

文章图片
#人工智能#语言模型#DeepSeek
Dify+Ollama搭建本地知识库完整指南,收藏这一篇就够了!

本文详细介绍了如何使用Dify搭建知识库并接入AI服务,分为两部分:首先部署Dify平台并配置知识库上传功能;然后通过Ollama部署本地Qwen3模型,解决服务监听和模型接入问题。教程提供了完整的安装、配置和调试步骤,帮助读者构建本地AI知识库系统,适合有一定技术基础的开发者实践。

文章图片
#人工智能#自然语言处理#机器学习 +1
【收藏必备】4种本地运行大模型方法详解:从Ollama到vLLM,小白也能轻松上手!

文章介绍了四种本地运行大语言模型的方法:Ollama提供简洁命令行接口,适合快速实验;LMStudio提供图形界面,类似ChatGPT体验;vLLM是高效推理引擎,专注于提升速度和降低显存占用;LlamaCPP是轻量级C/C++实现,适合个人电脑部署。每种方法各有优势,用户可根据需求和技术水平选择适合工具,实现大模型本地化应用。

文章图片
#人工智能#Ollama#vLLM
AI大模型推理框架:Ollama和vLLM到底应该选哪个?

在人工智能领域,大语言模型(LLM)的应用日益广泛,选择合适的推理(部署)框架对实现高效、稳定的模型运行至关重要。Ollama和vLLM作为当下流行的LLM部署工具,各具独特优势与适用场景。本文将深入剖析二者的优缺点,并给出选型建议,同时附上它们的具体使用案例,以便读者更直观地了解其应用情况。

文章图片
#人工智能#语言模型#Ollama
AI大模型推理框架:Ollama和vLLM到底应该选哪个?

在人工智能领域,大语言模型(LLM)的应用日益广泛,选择合适的推理(部署)框架对实现高效、稳定的模型运行至关重要。Ollama和vLLM作为当下流行的LLM部署工具,各具独特优势与适用场景。本文将深入剖析二者的优缺点,并给出选型建议,同时附上它们的具体使用案例,以便读者更直观地了解其应用情况。

文章图片
#人工智能#语言模型#Ollama
一文带你搞懂大模型部署Ollama和vLLM,非常详细,建议收藏!!

Ollama是一款专注于简化大型语言模型本地部署和运行的开源框架,基于Go语言实现,支持跨平台运行,并以“开箱即用”为核心理念,适合个人开发者和轻量化场景。而vLLM是一个高效的大模型推理与服务引擎,基于PyTorch构建,创新性地引入了PagedAttention技术,旨在解决大模型服务中的显存效率与吞吐量瓶颈,支持张量并行和流水线并行,可横向扩展至多机多卡集群。

文章图片
#人工智能#语言模型#Ollama +1
大模型微调神器LLaMA Factory:保姆级教程,小白也能轻松上手,建议收藏

LLaMA Factory是一款无需编写代码即可完成大模型微调的友好平台。本文详细介绍了该平台的安装、配置与使用流程,包括选择模型、准备数据集、设置参数进行微调、验证效果、模型导出及量化等步骤。通过WebUI界面,用户可轻松完成上百种预训练模型的微调,包括LLaMA、Qwen、ChatGLM等主流模型,支持LoRA、QLoRA等多种训练方法,实现大模型的定制化开发与应用。

文章图片
#人工智能
大语言模型背后的Transformer,与CNN和RNN有何不同,一文搞懂!!

Transformer是一种基于注意力机制的序列模型,与传统的循环神经网络(RNN)和卷积神经网络(CNN)不同,Transformer仅使用自注意力机制(self-attention)来处理输入序列和输出序列,因此可以并行计算,极大地提高了计算效率。

文章图片
#语言模型#transformer#cnn +2
    共 1265 条
  • 1
  • 2
  • 3
  • 127
  • 请选择