
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
要搭建我们自己的大模型,就要把目前有的大模型下载下来,因为我们基本上不具备自己本地训练大模型的条件。下载大模型进行本地部署,目前最方便的工具是Ollama。

Ollama 是一个本地运行的大语言模型(LLM)工具平台,允许用户在本地设备上运行和管理大模型,而无需依赖云服务。它支持多种开源模型,并提供了用户友好的接口,非常适合开发者和企业使用。首先,从 Ollama 官网 下载安装包,并按照提示完成安装。Windows下搜索ollama,然后点击启动Ollama 提供了几个简单易用的命令,基本功能如下:拉取模型并运行llama pull 具体的模型,这里

章详述了如何在大模型本地化部署方面取得成功,对比了API与本地部署的优劣,介绍了Ollama(极简易用)、vLLM(高性能)和LMDeploy(全栈优化)三大推理框架的特点与适用场景。提供了国内外开源大模型下载指南,并针对三种框架给出详细部署教程,帮助读者实现数据安全、高效可控的本地大模型应用。

Ollama和vLLM各有千秋,选择哪种方案取决于具体需求。如果需要一个简单易用、快速部署的LLM解决方案,并且对推理速度要求不高,那么Ollama是不错的选择。如果追求高性能的LLM推理,并且具备一定的技术基础,那么vLLM更适合。

Hermes 3::Hermes 3 是 Nous Research 推出的旗舰 Hermes 系列大语言模型 (LLM) 的最新版本,支持工具调用。Phi 3.5::一个轻量级 AI 模型,拥有 38 亿个参数,性能超越了同等规模甚至更大的模型。SmolLM::一系列小型模型,拥有 1.35 亿、3.6 亿和 17 亿个参数,在新的高质量数据集上训练。

本篇介绍bert和gpt区别。BERT和GPT是自然语言处理(NLP)领域中的两种重要预训练语言模型,它们在多个方面存在显著的区别。以下是对BERT和GPT区别的详细分析BERT:全称:Bidirectional Encoder Representations from Transformers。架构:基于Transformer的编码器部分进行堆叠构建,通过预训练和微调两个阶段来生成深度的双向语言

本文对比了国产开源大模型Qwen和DeepSeek的特点与性能。Qwen是阿里巴巴出品的"全能型"模型,更新快、生态全;DeepSeek是深度求索团队开发的"高效型"模型,擅长快速推理。文章通过硬件要求、写作表达、技术代码和知识推理等方面进行对比,并根据不同用户需求提供选择建议:日常用户可选Qwen,追求速度可选DeepSeek,程序员可根据需求选择不同版本,高配用户可尝试大参数版本。最后强调本地

轻松搞定大模型微调与推理的开源神器。

如何高效地微调和部署大型语言模型(LLM)?什么是LLaMA-Factory?LLaMA-Factory,全称Large Language Model Factory,即大型语言模型工厂。它支持多种预训练模型和微调算法,提供了一套完整的工具和接口,使得用户能够轻松地对预训练的模型进行定制化的训练和调整,以适应特定的应用场景,如智能客服、语音识别、机器翻译等。

本文介绍了一个名为RAG-SQL Router的实战项目,旨在解决智能问答系统中判断信息来源的困境。文章详细阐述了如何构建一个能自动判断用户问题类型(文档检索或数据查询)并给出准确答案的智能系统。作者提供了完整的实现思路和代码,包括环境准备、API配置、SQL查询引擎搭建、RAG检索引擎搭建、查询引擎包装、Router Workflow构建、Streamlit界面创建等步骤。此外,还介绍了如何加入








