logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

2025如何学习Agent?谷歌重磅发布Agent白皮书

2025 年将是 AI Agent 发展的重要一年。谷歌最近发布了一篇关于 Agent 的白皮书。以下是白皮书的主要内容:AI Agent 简介工具在 Agent 中的角色通过针对性学习提升模型性能使用 LangChain 快速上手智能体利用 Vertex AI Agents 构建生产级应用。✅ 什么是 Agent?他们将生成式 AI Agent 定义为“。⭐️ 组件以下是通用 Agent 架构及

文章图片
#学习#人工智能#知识图谱 +2
DeepSeek核心技术解码:图解MoE架构如何实现大模型的智能「分诊」系统

混合专家 (MoE) 是一种使用许多不同子模型(或「专家」)来提高 LLM 质量的技术。专家:每个 FFNN 层现在都有一组“专家”,可以从中选择一个子集。这些“专家”通常本身就是 FFNN。路由器或门网络:确定哪些令牌被发送给哪些专家。在具有 MoE 的 LLM 的每个层级中,我们都会找到(某种程度上专业的)专家。注意,我们这里提到的专家并不是专攻「心理学」或「数据」等特定领域的专家。它最多只是

文章图片
#架构#开源#语言模型 +1
智慧医院建设再添新动能!仁济医院成功部署DeepSeek

完成DeepSeek大模型本地化部署,通过病情分析、病历质控等功能辅助医生全面提升诊疗服务水平。近日,DeepSeek大模型(以下简称DS)在社会各生产领域及社交平台引起轰动,DS因其可见的“深度思考”以及温暖的“东方文字”,给人带来了不同以往的AI感受。上海交通大学医学院附属仁济医院长期以来对人工智能在医疗领域的发展保持高度关注,此前已通过CDSS辅助决策知识库、专科知识库等项目建设,为大模型的

文章图片
#人工智能#算法#政务 +1
LlamaIndex+Phi-3:知识图谱生成的黄金组合

检索增强生成 (RAG) 是一种流行的有效方法,可以将 LLM 应用于特定领域。但是,它会受到幻觉的影响。知识图谱的使用是处理这种困境的一种尝试。LlamaIndex 利用 LLM 不断提高的能力来协助从非结构化文档生成知识图谱,并提供对这些图谱进行高效查询的支持。在本文中,我们为此目的使用了 LlamaIndex 模块。通过不到 20 行代码,我们拥有了一个受知识图谱启发的有效问答系统,可以查询

文章图片
#知识图谱#人工智能#深度学习 +2
大模型训练之训练数据准备,即怎么准备高质量的训练数据集?

训练数据集的质量是大模型的主要生命线之一,数据集质量直接影响到模型的性能和效果训练一个高性能且表现较好的模型是由多种因素决定的,比如模型的设计,损失函数与优化函数的实现,训练方式的选择;当然也包括高质量的训练数据。那么,怎么才能得到一个高质量的训练数据集呢?这个就是我们今天需要讨论的问题。‍‍‍‍‍‍‍‍训练数据集的准备机器学习和深度学习模型的性能高度依赖于训练数据的质量和数量;训练数据的准备工作

文章图片
#音视频#学习#人工智能 +2
微软 CEO 的大胆预言:“AI Agent将替代所有SaaS”

我认为商业应用程序的概念可能会在智能代理时代消失。微软CEO萨提亚·纳德拉表示,我们所知的应用程序正在消失,取而代之的是智能代理。这是一个重大声明,他实际上为软件开发的未来方向树立了一面旗帜。这意味着不再有应用程序,也就不再有SaaS(软件即服务),可能还意味着需要的开发人员会大幅减少。

文章图片
#microsoft#人工智能#自然语言处理 +3
一文介绍DeepSeek的模型蒸馏和模型量化技术

模型蒸馏是一种知识迁移的方法旨在将知识从一个大型的教师模型(Teacher Model)转移到一个较小的学生模型(Student Model)中。其基本思想是利用教师模型的输出、隐藏层特征或特征间相似度等作为额外的监督信号,来训练学生模型,以提升小模型的性能并在一定程度上取代大模型。学生模型可以在保持较高准确性和泛化能力的同时,减少参数数量和计算复杂度。在自然语言处理任务中,对于各种复杂的任务,深

文章图片
#人工智能#架构#开源 +1
DeepSeek+Dify 构建本地知识库,真香!

之前讲过 DeepSeek + Cherry 搭建本地知识库,这样的知识库比较初级,上传的文件限制较多。无法满足更多个性化需求。今天我们来看看 DeepSeek + Dify 如何搭建自己的知识库。Dify 作为同样开源的 AI 应用开发平台,提供完整的私有化部署方案。通过将本地部署的 DeepSeek 服务无缝集成到 Dify 平台,企业可以在确保数据隐私的前提下,在本地服务器环境内构建功能强大

文章图片
#知识图谱#人工智能#lstm +2
零代码,也能玩转大模型!“超级大脑”,来了→

2025年7月21日,由中央广播电视总台财经节目中心推出的《超级生产线》特别节目,聚焦2025中国联通合作伙伴大会。本次大会以“向实同行,共创融合新生态”为主题,聚焦AI与产业的融合落地,从智慧家庭到城市医疗,从企业采购到行业大模型,全面展示联通融合多领域生态的深度布局。

文章图片
#人工智能#microsoft#学习 +1
Prompt、Context、Memory:一组漫画带你了解大模型交互的三段技术演进

每次对话都像“第一次见你”,每轮任务都要从头讲起,它可以生成内容,却无法积累状态,也无法进行模型迭代和学习;可以理解你这一次,却无法记住你每一次。

文章图片
#数据库#前端#人工智能 +3
    共 803 条
  • 1
  • 2
  • 3
  • 81
  • 请选择