
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
知识库领域的 LLM 大模型和 Embedding 大模型有区别么?为什么在 RAG 领域,需要单独设置 embedding 大模型?
本文是Ollama系列教程的第4篇,在前面的3篇内容中,我们分享了如何在本地安装ollama、运行deepseek等大模型、以及如何在chatbox和cherryStudio中使用本地ollama中的大模型,我们创建了私有的AI对话框和智能体。

今天计划对之前ollama系列做个回顾,从如何部署到API使用,整理到一篇内容中,提供给大家参考。

Dify 是一款开源的大语言模型(LLM) 应用开发平台。它融合了后端即服务(Backend as Service)和 LLMOps 的理念,使开发者可以快速搭建生产级的生成式 AI 应用。

本文将带领您了解如何迅速在Windows平台上部署Ollama,这是一个开源的大语言模型(LLM)运行工具,以及如何通过Open WebUI和cpolar内网穿透技术,让您在任何地方都能访问您本地部署的AI语言模型,如llama2和千文qwen。

近年来,随着大语言模型(Large Language Model)应用的火热,越来越多的企业和个人开发者都希望能够在本地或服务器上方便地部署自己的大模型推理服务。无论是进行自然语言处理(NLP)任务,还是用来提供对话机器人服务,或是构建智能客服与搜索引擎,都离不开一个高效、易用、可扩展的大模型推理框架。
GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。在语义、数学、推理、代码和知识等多方面的数据集测评中, GLM-4-9B 在各项能力上均表现出卓越的能力。

【LLM大模型】Ollama 本地CPU部署开源大模型

我选择了Qwen2.5-Coder 14B Q6_K 量化版 + Ollama+Anaconda这个组合。这个阿里千问模型是16G显存下的最强写代码模型了,而且中文友好。
近期一直在研究Claude Agent SDK——这款驱动着当下最优秀的编码工具之一Claude Code的开发工具包。








