logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型之CoT和ToT

将 ToT 框架的主要概念概括成了一段简短的提示词,指导 LLM 在一次提示中对中间思维做出评估。我的看法:如果模型足够强大,CoT和ToT的作用将大大减少。一句话总结:CoT和ToT都是Prompt技巧中的一种。,引导语言模型探索 把思维作为中间步骤 来解决通用问题。Chain-of-Thought思维链。:Tree of Thoughts 思维树。ToT 基于思维链提示进行了。

大模型之MoE

在做完capacity + random routing后,我们最终确认了每个token要发去的top2expert和其对应的权重,通过加权计算的方式,确认Moe-Layer最终的输出结果。: 为每个expert设置capacity(expert buffer),限制它能处理的最大token数量,多出来的token算为溢出,在top2Expert都溢出的情况下,该token会被直接发去下一层att

斯坦福NLP库python版:Stanza

项目地址官方教程能够使用的中文模型相关新闻

Agent的长期记忆

如果什么时候,可以不断流式的接受外界的输入token,KV Cache一直在GPU内存或者临时换出到CPU内存,这样KV Cache就是AI Agent的工作记忆,或者说AI Agent的状态,这是的Agent或许就是不断进行的“半神”存在。大模型的输入:包括角色设定(system prompt)、最近对话、全局记忆概要(即角色对用户的核心记忆 b.2)、经过RAG的聊天记录分段总结(a.)和分类

大模型之CoT和ToT

将 ToT 框架的主要概念概括成了一段简短的提示词,指导 LLM 在一次提示中对中间思维做出评估。我的看法:如果模型足够强大,CoT和ToT的作用将大大减少。一句话总结:CoT和ToT都是Prompt技巧中的一种。,引导语言模型探索 把思维作为中间步骤 来解决通用问题。Chain-of-Thought思维链。:Tree of Thoughts 思维树。ToT 基于思维链提示进行了。

大模型之RLHF

loss含义是 对上文St而言,如果token At产生的预估收益越高,那就增大它出现的概率,否则降低它的概率。这一步设计的目的是 要让 Rt 可计算,其中一种设计是 除了最后的T时刻,其余时刻的即时奖励,我们就用“Actor是否遵循了Ref的约束”来进行评价。3、在t时刻,At对应的即时收益为Rt,总收益是Vt(Vt=即时收益+未来收益),也可以理解成“对人类喜好的衡量”,此时模型的状态有St变

人工智能的热门应用

来源《百面机器学习》第14章计算广告1. 最赚钱的部门2. 计算广告学:信息科学、统计学、计算机科学、微观经济学等交叉融合,实现语境、广告和受众三者的最佳匹配3. 主要产品:合约广告、竞价广告、程序化交易广告等类型3.1 合约广告:客户多为品牌类广告主,结算方式多为CPM(cost per mille)千次曝光成本,每完成一千次曝光流量平台向广告主收取固定的成本。3.2 竞价广告:最重要的形式是搜

#人工智能
langchain源码

RunnableBinding类:用额外的功能封装一个Runnable。RunnableAssign 一般与RunnableParallel结合,将输入数据复制保留,将产生的数据用 RunnableParallel的key记录下来。Runnable 还具有的方法:bind、 with_config。Runnable 的基本方法有 invoke、 batch、 await、 ainvoke、 aba

多模态模型基础

ViT的位置编码:https://blog.csdn.net/qq_44166630/article/details/127429697QwenVL发布:https://qwenlm.github.io/zh/blog/qwen-vl/

#论文阅读
俄亥俄州立大学:GUI代理的通用视觉定位

我们展示了一个简单的方案,包括基于网络的合成数据和对LLaVA架构的轻微调整,对于训练此类视觉定位模型出奇地有效。我们收集了迄今为止最大的GUI视觉定位数据集,包含1000万个GUI元素及其在130万个屏幕截图上的指称表达,并用它来训练UGround,这是一个用于GUI代理的强大的通用视觉定位模型。

    共 40 条
  • 1
  • 2
  • 3
  • 4
  • 请选择