logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

监督对齐DPO算法实例讲解

DPO 让AI学会自我纠错还在用复杂的RLHF?DPO(直接偏好优化)正以更简单、更高效的方式,教会AI如何自我反思和择优学习。

文章图片
#算法
监督对齐DPO算法实例讲解

DPO 让AI学会自我纠错还在用复杂的RLHF?DPO(直接偏好优化)正以更简单、更高效的方式,教会AI如何自我反思和择优学习。

文章图片
#算法
智能体开发的6个核心经验,价值百万

构建Manus智能体的经验教训包括:1.KV缓存避免重复计算;2.掩码技术实现动态工具调用;3.使用文件系统扩展上下文;4.通过复述任务操控注意力;5.让错误留在上下文中;6.加入少量随机变化。下文将深入拆解底层原理。

文章图片
#人工智能
拆解扣子智能体 重塑生产力

感觉大模型(LLM)空有大脑却没手脚?今天我们从第一性原理扒一扒,扣子(Coze)是怎么给AI装上手脚,打造出最强AI Agent的!🚀。

文章图片
#人工智能
拆解扣子智能体 重塑生产力

感觉大模型(LLM)空有大脑却没手脚?今天我们从第一性原理扒一扒,扣子(Coze)是怎么给AI装上手脚,打造出最强AI Agent的!🚀。

文章图片
#人工智能
2025年三大AI底层规律

智能商品化:简单能力很快就免费,别做“人肉搜索器”。验证者定律:先做“验证易”的任务,构造反馈闭环。锯齿状边缘:AI不是全能,判断任务差异、分层推进才是正道。🎯行动建议它能数字化吗?数据足够多吗?能否构造客观评分?再画出“生成难/验难”的坐标象限,你的AI路线图就出来了。”的任务,构造反馈闭环。3.锯齿状边缘:AI不是全能,判断任务差异、分层推进才是正道。🎯行动建议它能数字化吗?数据足够多吗?

文章图片
#人工智能
AI时代大数据分布的深入洞察与应用

当前的大模型是卓越的相关性学习者,但无法回答“如果……会怎样?”的因果问题。因果推断的数学框架,其核心就是将复杂的联合分布分解为一系列由因果机制决定的、更简单稳定的局部条件概率分布。识别并解构数据分布,是迈向因果理解的第一步。识别和重构数据的真实分布结构,是AI想从“统计模拟”跨越到“因果理解”的必要条件。

文章图片
#人工智能
AI图像编辑能力评测的8大测评集

在图像编辑领域,近期涌现了多款的数据集。这类数据集通常包含和(如修改要求、风格变换或增强提示等),模型需据此生成,并配套来衡量生成图像对文本要求的满足程度和图像质量。

文章图片
#人工智能
    共 12 条
  • 1
  • 2
  • 请选择