logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek 代码助手:FastAPI 后端 + Streamlit 前端完整实现

本文介绍了如何构建一个基于 DeepSeek 大模型的代码助手系统,采用 FastAPI 后端和 Streamlit 前端架构。后端通过 FastAPI 封装 DeepSeek 模型的 API 调用,支持自定义系统提示词和用户问题输入;前端 Streamlit 界面提供友好的 Web 交互,可发送请求并高亮展示生成的代码或解答。文章详细讲解了前后端代码实现、运行方法及安全注意事项(如 API Ke

#fastapi#前端#状态模式
大模型的定义、特点

GPT 系列:是 OpenAI 开发的一系列基于 Transformer 架构的自回归语言模型。从 GPT 到 GPT-4,模型规模、性能等不断提升。GPT 专注于语言建模;GPT-2 零样本学习能力增强;GPT-3 参数量达 1.75 万亿,零样本学习和推理能力突出;GPT-3.5 中的 ChatGPT 引入强化学习与人类反馈,对话体验大幅提升;GPT-4 支持多模态,逻辑推理等能力更强,训练更

#学习
大模型前世今生

本文梳理了神经网络到大模型的发展历程:从20世纪40年代的单层感知机解决线性可分问题,到80年代BP算法突破线性不可分限制,再到2010年深度神经网络在图像分类等任务取得突破。2020年左右出现的大模型(如GPT-3)通过海量参数和预训练展现出通用智能潜力。文章还对比了CNN(擅长处理空间数据)和RNN(擅长序列数据)的架构特点与应用,并介绍了Transformer、BERT等里程碑模型。这些技术

文章图片
#学习
GPT工作机制

摘要:GPT工作机制基于单字接龙规则,以前一个词的尾字作为新词开头生成连贯文本。其构建流程分为四阶段:1)自监督预训练,利用前文预测下一个token,学习语言规律;2)有监督微调,通过高质量指令数据优化任务表现;3)奖励建模,训练评估模型对生成文本质量打分;4)强化学习,根据奖励信号调整参数。Token是文本处理的最小单元,中英文处理方式不同(中文以单字为主,英文可能拆分单词),其核心作用是将文本

文章图片
#人工智能#深度学习
DeepSeek-V3介绍

DeepSeek-V3是一款基于混合专家(MoE)架构的通用大语言模型,参数规模达6710亿,但每个Token仅激活370亿参数,显著提升推理效率。模型采用两阶段训练:预训练阶段使用14.8T多样化token数据,重点强化数学和编程能力,并通过两阶段策略将上下文长度扩展到128K;后训练阶段通过150万指令数据集进行有监督微调,并结合强化学习优化推理能力。关键技术包括:多头潜在注意力(MLA)降低

文章图片
#学习
DeepSeek-R1介绍

摘要 通用模型和推理模型在功能定位、数据训练、结构规模和应用场景上存在显著差异。通用模型(如GPT-3)具有广泛的知识覆盖和泛化能力,适合多样化任务;而推理模型(如DeepSeek-R1)专注于特定领域的逻辑分析,强调精确推理能力。DeepSeek-R1采用强化学习优化架构,通过思维链(CoT)技术实现复杂问题的分步求解,并创新性地结合无监督学习提升推理能力。知识蒸馏技术则可将大模型的推理能力迁移

文章图片
#学习
RAG(检索增强生成)介绍+四行代码构建RAG

RAG(检索增强生成)是一种结合信息检索与大语言模型的技术框架,通过检索外部知识库获取相关资料,再让大模型基于这些资料生成答案,解决了大模型知识陈旧、幻觉等问题。RAG系统包含索引、检索和生成三个核心组件,支持多种文档格式,并可结合向量数据库实现高效检索。相比微调,RAG更适用于知识更新频繁的场景。实现上,可使用OpenAI兼容接口或国产大模型(如DeepSeek、阿里云百炼、智谱AI)作为替代方

文章图片
#学习
本地 RAG 问答系统实战:FAISS 检索 + DeepSeek 生成

本文介绍了如何构建一个本地RAG(检索增强生成)问答系统,结合FAISS向量检索和DeepSeek大模型生成能力。系统首先通过FAISS索引检索相关文档片段,再将这些片段作为上下文输入DeepSeek模型生成回答。文章详细说明了环境配置、核心原理(包括检索模块、生成模块和Prompt设计)、完整代码实现及运行方法。该系统支持私有知识问答,具有可解释性强、减少幻觉等优点,适用于本地化部署场景。

#faiss
本地 RAG 问答系统实战:FAISS 检索 + DeepSeek 生成

本文介绍了如何构建一个本地RAG(检索增强生成)问答系统,结合FAISS向量检索和DeepSeek大模型生成能力。系统首先通过FAISS索引检索相关文档片段,再将这些片段作为上下文输入DeepSeek模型生成回答。文章详细说明了环境配置、核心原理(包括检索模块、生成模块和Prompt设计)、完整代码实现及运行方法。该系统支持私有知识问答,具有可解释性强、减少幻觉等优点,适用于本地化部署场景。

#faiss
本地 RAG 问答系统实战:FAISS 检索 + DeepSeek 生成

本文介绍了如何构建一个本地RAG(检索增强生成)问答系统,结合FAISS向量检索和DeepSeek大模型生成能力。系统首先通过FAISS索引检索相关文档片段,再将这些片段作为上下文输入DeepSeek模型生成回答。文章详细说明了环境配置、核心原理(包括检索模块、生成模块和Prompt设计)、完整代码实现及运行方法。该系统支持私有知识问答,具有可解释性强、减少幻觉等优点,适用于本地化部署场景。

#faiss
    共 106 条
  • 1
  • 2
  • 3
  • 11
  • 请选择