logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型部署 | Ollama + DeepSeek + Dify私有化部署自己的AI Agent

最近研究了一下Dify这个AI应用引擎,感觉功能还是很强大的,特别是流程编排、RAG检索、模型管理、知识库维护等,内置了各种国内外的厂商模型,可以根据自己的业务需求来选择模型进行处理,而且模型可以借助Ollama来私有化部署。与其对等的产品还有FastGPT,字节的Coze,不过目前开源的只有Dify和FastGPT,下面来介绍一下Ollama和Dify怎么私有化部署到自己的电脑或服务器吧。提示:

文章图片
#人工智能#自然语言处理
DeepSeek-R1复现方案解读之「Open-R1」

整体grpo原理如下:‍奖励函数的设计与应用在模型训练过程中,奖励函数扮演着至关重要的角色,它们指导模型如何优化其行为以适应特定的任务需求。1.**重要性**:准确度奖励函数确保模型在训练过程中尽可能地输出正确的答案,是衡量模型性能的核心指标。功能:计算模型完成内容与正确答案之间的匹配程度。步骤提取所有生成内容。对于每个生成和解,分别解析解和生成内容。使用验证函数(verify)检查解析结果是否一

文章图片
#人工智能#深度学习#DeepSeek
大模型实操与API调用 | 四十五、TGI模型部署

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频,免费分享!

文章图片
#人工智能#学习
大模型微调基本概念(三)3SFT 最佳实践:数据集准备、SFT 超参数调整

比如 10 万个样本 2-3 个 epoch 内为佳,2 ~ 5 万个样本 一般是 4-5 个 epoch 并且领域增强的 SFT 数据不需要太多,质量一定要把握好,一般的领域总结回复的任务几百条数据即可( 个人经验 ),视情况而定;小数据量可以适当增大 epoch,让模型充分收敛。数据规模、多样性:通常 1 万条左右的精标数据即可发挥良好的效果,在扩充数据规模时需要注意数据多样性,多样性的数据可

文章图片
#人工智能
大模型部署 | Ollama + DeepSeek + Dify私有化部署自己的AI Agent

最近研究了一下Dify这个AI应用引擎,感觉功能还是很强大的,特别是流程编排、RAG检索、模型管理、知识库维护等,内置了各种国内外的厂商模型,可以根据自己的业务需求来选择模型进行处理,而且模型可以借助Ollama来私有化部署。与其对等的产品还有FastGPT,字节的Coze,不过目前开源的只有Dify和FastGPT,下面来介绍一下Ollama和Dify怎么私有化部署到自己的电脑或服务器吧。提示:

文章图片
#人工智能#自然语言处理
大模型训练之训练数据准备,即怎么准备高质量的训练数据集?

训练数据集的质量是大模型的主要生命线之一,数据集质量直接影响到模型的性能和效果训练一个高性能且表现较好的模型是由多种因素决定的,比如模型的设计,损失函数与优化函数的实现,训练方式的选择;当然也包括高质量的训练数据。那么,怎么才能得到一个高质量的训练数据集呢?这个就是我们今天需要讨论的问题。‍‍‍‍‍‍‍‍。

文章图片
#人工智能#自然语言处理
一文彻底搞懂多模态:大语言模型推理,大模型入门到精通!

Chain-of-Thought(思维链,简称CoT)是一种改进的提示技术,旨在提升大型语言模型(LLMs)在复杂推理任务上的表现。Chain-of-Thought要求模型在输出最终答案之前,先展示一系列有逻辑关系的思考步骤或想法,这些步骤相互连接,形成了一个完整的思考过程。Chain-of-Thought可以通过两种主要方式实现:Zero-Shot CoT和Few-Shot CoT。

文章图片
#语言模型#人工智能#自然语言处理
如何从文档构建自己的 RAG 评估数据集

在本文中,将展示如何创建自己的 RAG 数据集,该数据集包含任何语言的文档的上下文、问题和答案。检索增强生成 (RAG) [1] 是一种允许 LLM 访问外部知识库的技术。通过上传 PDF 文件并将其存储在矢量数据库中,我们可以通过矢量相似性搜索检索这些知识,然后将检索到的文本作为附加上下文插入到 LLM 提示中。这为LLM提供了新的知识,并减少了LLM编造事实(幻觉)的可能性。

文章图片
#人工智能#自然语言处理#RAG
大模型 | 强化学习基础回顾、将强化学习应用于 LLMs、深度探索 R1

接下来,让我们继续探讨大模型,揭开强化学习(Reinforcement Learning, RL)的神秘面纱,探索它如何让语言模型更上一层楼。

文章图片
#人工智能#深度学习#AI
深入解析Agent | AI agent如何工作?AI Agent的核心组件

AI agent正在迅速改变我们与技术互动的方式,自动化复杂的工作流程,解决多步骤问题,并在各个行业中实现无缝的用户体验。根据凯捷咨询(Capgemini)对1000多名大型企业高管的调查显示,82%的组织计划在未来3年内采用AI agent。其实AI agent的核心是一个旨在自动观察、决策、行动并从其环境中学习的程序。在当今大多数AI agent中,通常其“大脑”是一个大型语言模型(LLM)。

文章图片
#人工智能#深度学习#AI
    共 108 条
  • 1
  • 2
  • 3
  • 11
  • 请选择