logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【强化学习】QAC、A2C、A3C学习笔记

相比REINFORCE算法,为什么A2C可以提升速度?A2C增加了Critic组件用于估计状态价值,这样Actor可以利用Critic提供的价值信息来更新策略,使得学习过程更加高效。A2C、A3C是on-policy的吗?A2C算法是on-policy的,因为它根据当前策略生成的样本来更新这个策略,这意味着它评估和改进的是同一个策略。A3C算法虽然采用了异步的更新机制,但它本质上仍然是on-pol

文章图片
【强化学习】DQN、Double DQN、Dueling DQN、Per DQN、NoisyDQN 学习笔记

Dueling DQN修改的是网络结构,算法中在输出层之前分流( dueling )出了两个层,如图所示,一个是优势层,用于估计每个动作带来的优势,输出维度为动作数一个是价值层,用于估计每个状态的价值,输出维度为 1。在传统的DQN中,选择和评估动作的Q值使用相同的网络,这可能导致在某些状态下对某些动作的Q值被高估,从而影响学习的稳定性和最终策略的质量。经验回放:通过存储代理的经验(状态,动作,奖

文章图片
从零理解 GraphCodeBERT 与 Sentence-BERT

本文介绍了Transformer及其衍生模型BERT、Sentence-BERT和GraphCodeBERT的核心原理与应用。Transformer通过自注意力机制实现并行处理,成为大模型基础架构。BERT在此基础上采用双向编码器和预训练任务(MLM和NSP),提升语言理解能力。Sentence-BERT通过孪生网络结构优化句子向量表示,实现高效语义相似度计算。GraphCodeBERT则专为代码

文章图片
#bert#人工智能#深度学习
【机器学习】CatBoost 模型实践:回归与分类的全流程解析

CatBoost 是由俄罗斯搜索巨头 Yandex 于 2017 年开源的机器学习库,其名称来源于 “Category” 和 “Boosting” 的组合,旨在高效处理类别特征的梯度提升算法。支持类别特征:无需对类别特征进行独热编码,直接处理类别数据,避免数据膨胀。对缺失值的鲁棒性:无需特殊预处理即可直接处理缺失值。防止过拟合:内置多种正则化手段,减少梯度偏差和预测偏移,提高模型的准确性和泛化能力

文章图片
#回归#分类#数据挖掘
【langchain】快速封装替换自定义LLM(基于自定义API或本地模型)

本文旨在展示如何利用langchain快速封装自定义LLM,从而突破现有环境下对OpenAI API Key的依赖。通过langchain的LLM类或现有项目的类继承,再修改特定的回调方法即可实现更加个性化和灵活的LLM应用,推动项目快速进展。

文章图片
llama_index中query_engine的response_mode详解

在使用llama_index进行内容提炼、文章总结时,我们可以通过设置不同的ResponseMode来控制生成响应的结果。

文章图片
【Datawhale AI 夏令营】第四期 基于2B源大模型RAG 的三体问答

【Datawhale AI 夏令营】第四期 基于2B源大模型RAG 的三体问答,特点:手工文档切块、调优。

文章图片
#RAG
基于Whisper+SparkAI+Pyttsx3实现全流程免费的语音交互

HTTPS 协议:大多数现代浏览器只允许在 HTTPS 协议或localhost上使用摄像头和麦克风等硬件设备。如果你在开发环境中使用 HTTP,可能会遇到为undefined的问题。建议在开发和生产环境中都使用 HTTPS。你可以使用ngrok或serveo.net等工具将本地服务器暴露为 HTTPS 服务。权限问题:在调用时,需要处理用户拒绝权限请求的情况。可以通过捕获错误并提示用户检查权限设

文章图片
#交互
【Datawhale wow-agent】深入浅出:构建你自己的 LLM 工具调用Agent与 RAG 系统

首先,我们需要创建一个自定义的 LLM 类来封装大语言模型的调用。CustomLLM,@property通过以上步骤,我们实现了一个基础的 LLM 工具调用和 RAG 系统。执行基础的数学运算查询数据库解析和检索 Markdown 文档回答基于知识库的问题你也可以基于这个框架,根据自己的需求扩展更多功能。

文章图片
深度解构 Trae Agent:大模型如何像资深工程师一样“操刀”千万行代码库

TraeAgent创新性地将确定性工具链与大模型结合,解决了AI编程中的关键难题。其核心突破在于:1)采用基于精确字符串匹配的编辑工具,通过"唯一性匹配"机制确保代码修改的准确性;2)构建代码知识图谱(CKG)实现结构化检索,结合传统Bash工具完成文本检索,形成混合检索策略。这种设计将LLM定位为"决策者",而将易错操作交由确定性工具执行,有效降低了AI编

文章图片
    共 33 条
  • 1
  • 2
  • 3
  • 4
  • 请选择