logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【LangGraph Agent架构篇—规划智能体2】【推理&没有观察】【Reasoning without Observation】

Reasoning without Observation的核心思想是,首先针对用户的目标提出一系列具体的操作,之后依次完成各个操作,期间不存在反思, 执行完所有计划后总结得到结果。

文章图片
#java#开发语言#python
【通义千问—Qwen-Agent系列1】Qwen-Agent 快速开始&使用和开发过程

Qwen-Agent是一个开发框架。开发者可基于本框架开发Agent应用,充分利用基于通义千问模型(Qwen)的指令遵循、工具使用、规划、记忆能力。本项目也提供了浏览器助手、代码解释器、自定义助手等示例应用。

文章图片
#自然语言处理#语言模型#阿里云
Dropout的深入理解(基础介绍、模型描述、原理深入、代码实现以及变种)

深度神经网络包含多个非线性隐藏层,这使得它们有强大的表现力,可以学习输入和输出之间非常复杂的关系。但是在训练数据有限的情况下,深度神经网络很容易过度学习造成过拟合,过拟合是深度神经网络的一个非常严重的问题,此外,神经网络越大,训练速度越慢,Dropout可以通过在训练神经网络期间随机丢弃单元来防止过拟合,实验证明Dropout有很好的效果。

文章图片
#深度学习#人工智能
Langchain-Chatchat 从入门到精通(基于本地知识库的问答系统)(更新中)

一种利用 langchain 思想实现的基于本地知识库的问答应用,目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。

文章图片
#人工智能#gpt-3
【LangChain系列7】【LangChain实战—客服机器人项目】

LangChain给自身的定位是:用于开发由大语言模型支持的应用程序的框架。它的做法是:通过提供标准化且丰富的模块抽象,构建大语言模型的输入输出规范,利用其核心概念chains,灵活地连接整个应用开发流程。这里是LangChain系列的第七篇,通过实战项目:客服机器人来熟悉整个流程。

文章图片
#机器人
Dropout的深入理解(基础介绍、模型描述、原理深入、代码实现以及变种)

深度神经网络包含多个非线性隐藏层,这使得它们有强大的表现力,可以学习输入和输出之间非常复杂的关系。但是在训练数据有限的情况下,深度神经网络很容易过度学习造成过拟合,过拟合是深度神经网络的一个非常严重的问题,此外,神经网络越大,训练速度越慢,Dropout可以通过在训练神经网络期间随机丢弃单元来防止过拟合,实验证明Dropout有很好的效果。

文章图片
#深度学习#人工智能
【超详细】【原理篇&实战篇】一文读懂Transformer

Transformer是一种用于自然语言处理(NLP)和其他序列到序列(sequence-to-sequence)任务的深度学习模型架构,它在2017年由Vaswani等人首次提出。Transformer架构引入了自注意力机制(self-attention mechanism),这是一个关键的创新,使其在处理序列数据时表现出色。

文章图片
#transformer#深度学习#自然语言处理
【通义千问—Qwen-Agent系列1】Qwen-Agent 快速开始&使用和开发过程

Qwen-Agent是一个开发框架。开发者可基于本框架开发Agent应用,充分利用基于通义千问模型(Qwen)的指令遵循、工具使用、规划、记忆能力。本项目也提供了浏览器助手、代码解释器、自定义助手等示例应用。

文章图片
#自然语言处理#语言模型#阿里云
【LangGraph Agent架构篇—规划智能体1】【计划&执行】

Plan&Act的核心思想是,首先针对用户的目标提出一系列具体的操作,之后依次完成各个操作,如果未达成目标则会重新规划。

文章图片
#python
【LangGraph Agent架构篇—多智能体系统2】【构建管理者分配任务给各个智能体】

LangGraph是一个专注于构建有状态、多角色应用程序的库,它利用大语言模型(LLMs)来创建智能体和多智能体工作流。

文章图片
#java#开发语言
    共 50 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择