logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

怎么在本地跑大模型?(ollama、LM Studio、llama.cpp、Oobabooga)

大家好,我是唐宇迪,作为人工智能在线教育机构的资深AI讲师和学习规划师,我已经指导过数千名学员从零起步,掌握AI技术。今天,我来给大家分享一篇全面的技术干货文章,主题是“怎么在本地跑大模型”。这篇文章面向零基础的学习者,如果你对AI感兴趣,但不知道从哪里入手,本地部署大模型就是一个绝佳的起点。我们会一步步走,从基础知识到实际操作,再到高级优化和应用,全程通俗易懂、步骤清晰、专业严谨。为什么选择这个

#人工智能#AIGC#深度学习
RAG(检索增强生成)是什么?为什么几乎所有企业都要用??

RAG全称Retrieval-Augmented Generation,翻译成“检索增强生成”。听起来高大上,但其实很简单:它是大模型的“外挂知识库”。核心思想:大模型像一个聪明但记忆有限的学生,它知道很多通用知识,但对特定领域(如你公司的内部文档)一无所知。RAG就像给它配个“搜索引擎”:当用户提问时,先从知识库中搜出相关片段,然后塞给大模型,让它基于这些“新鲜材料”生成回答。用生活比喻:你问朋

#人工智能#深度学习#自然语言处理 +1
多头注意力有什么用?

多头注意力是什么?别慌,我们用简单话拆解。技术定义:多头注意力是将自注意力分成多个“头”(heads),每个头独立计算注意力,然后拼接结果,再线性变换输出。它允许模型在不同表示子空间并行学习关联。通俗类比:像一个侦探团队。单头是独狼侦探,只从一个线索查案;多头是多人小组,每人从不同角度(如动机、证据、证人)调查,最后汇总报告,更全面。或者,厨师做菜:多头如多把刀,同时切菜、炒菜、调味,效率高、味道

#人工智能#自然语言处理#深度学习 +2
零基础学大模型应该先学什么?

大家好,我是唐宇迪,专注零基础转行AI就业的学习规划师。过去几年,我帮助过上千名零基础学员成功转行AI岗位,从互联网运营到传统行业职员,他们大多没有计算机背景,却通过系统规划实现了月薪过万的跳槽。今天这篇文章,我想和大家聊聊零基础学大模型的正确顺序。为什么强调“顺序”?因为根据我的经验,80%零基础想转行AI的人,最终失败不是因为智商不够或努力不足,而是因为“学错顺序”——盲目从数学或算法入手,导

#人工智能#机器学习#深度学习 +2
从零开始学大模型微调|LoRA + 全参数微调实操详解

2026 年,LLM 推理成本已下降至 2024 年的 1/10,但“通用模型”在垂直场景仍存在显著幻觉、风格偏差、知识缺失等问题。微调的核心价值在于参数高效定制:用极低成本让模型“只懂你的业务、只说你的语言、只守你的规则”。企业真实场景与 ROI金融合规:微调后反洗钱问答准确率从 72% → 96%,审计通过率 100%,年节省人力 3000 万。医疗辅助:领域微调后临床指南引用精确度提升 41

#人工智能#计算机视觉#深度学习 +3
从零开始学 RAG 检索增强|企业级落地实战指南

2026 年,企业 GenAI 采用率已超 70%,但 60% 以上项目因“幻觉、知识过时、数据泄露”而失败。RAG(Retrieval-Augmented Generation,检索增强生成)正是解决方案:通过实时从私有知识库检索上下文,注入 LLM 生成过程,实现“知识实时更新 + 幻觉大幅降低 + 隐私 100% 可控”。企业真实价值(2026 数据)准确率提升:标准 LLM 幻觉率 30-

#人工智能#深度学习#自然语言处理 +3
从零开始学 LLM 大模型|原理 + 微调 + 部署全栈教程

2026 年,LLM 已从“实验室玩具”彻底转向企业生产力核心。根据最新行业报告,开源权重模型(如 Llama 4、Qwen3、DeepSeek V3)已与闭源前沿模型(GPT-5.2、Claude 4.5、Gemini 3)在多数基准上并驾齐驱,推理成本却下降 5-10 倍。知识密集型任务自动化:客服、文档处理、代码生成、合规审查等场景,微调后准确率可提升 30-50%。数据隐私与成本控制:本地

#人工智能#深度学习#AIGC +2
从零开始学大模型|保姆级从入门到工程化实战

从零开始学 LLM 大模型|原理 + 微调 + 部署全栈教程大家好,我是唐宇迪,AI 在线教育机构的资深 AI 讲师兼学习规划师。过去三年,我专门帮零基础的小白从“完全不懂代码”到“自己做出专属 AI 助手”。今天这篇 8000 字长文,就是为你量身打造的:全程零代码、零命令行、零高数、零劝退。你只需要会用鼠标点一点、复制粘贴、看截图一样的文字说明,就能从零跑通 LLM 原理理解 + 微调 + 部

#人工智能#自然语言处理#深度学习 +2
从零开始学 Prompt 工程|大模型高效指令优化指南

2026年,大模型已经不是“会聊天”的玩具,而是职场人的第二大脑。但99%的人还在用“写一篇……”这种幼儿园级指令,结果输出要么跑题、要么泛泛、要么格式乱七八糟。Prompt工程的真实价值效率爆炸:同样的任务,优化后的Prompt能把耗时从30分钟压到3分钟。可控性:输出格式、风格、深度、逻辑全部由你掌控,零废话。可复用性:一次写好,终身使用,跨模型(GPT-4o、Claude 3.5 Sonne

#RAG#人工智能
LoRA微调原理:低秩矩阵如何插入注意力层

这样更可靠、更容易解析。语料切分:项目中的关系抽取任务是句子级关系抽取,传统的句子级关系抽取数据集每条样本的句子长度是几十个Token。我在项目中使用的自建数据集,质量一般,实体关系密度较低,如果按照传统句子级关系抽取的窗口来切分语料,会导致关系样本量不足。计算方法:首先利用 Embedding 模型(如 BGE 或 OpenAI-text-embedding)对某个关系类别下的所有样本句子进行向

#人工智能
    共 63 条
  • 1
  • 2
  • 3
  • 7
  • 请选择