logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Sora和快手可灵背后的核心技术 | 3DVAE:通过小批量特征交换实现身体和面部的三维形状变分自动编码器

本文提出了一种新的VAE框架,通过批特征交换与潜在一致性损失,使学习到的潜在表征具有更好的可解释性、结构性和解纠缠特性。实验旨在验证该方法在人脸与人体3D网格生成任务中的有效性。本论文针对3D生成模型中潜在表示解耦的问题,提出了一种基于Mini-Batch特征交换和潜在一致性损失的自监督方法。通过在Mini-Batch内的样本间交换预定义的网格特征并约束对应潜变量的相似性,实现了对身体和面部3D网

文章图片
AI生成内容检测|Fast-DetectGPT:通过条件概率曲率对机器生成文本进行有效的零样本检测

该论文提出了一种基于条件概率曲率的快速检测机器生成文本的方法Fast-DetectGPT。论文的实验部分主要验证了Fast-DetectGPT在不同场景下的检测性能,包括白盒和黑盒检测,不同长度文本的检测,跨领域和语言的泛化,以及面对各种生成策略和对抗攻击的鲁棒性。本论文针对零样本检测机器生成文本的问题,提出了一种基于条件概率曲率(conditional probability curvature

文章图片
#人工智能#机器学习#深度学习
SnapKV: LLM在生成内容之前就知道您在寻找什么

本文探索了SnapKV在多个极长上下文语言模型中的表现,涉及任务包括Needle-in-a-Haystack、基准测试LongBench、搜索增强生成等,考察了SnapKV在推理速度、内存占用、生成质量等方面的影响。本论文针对大语言模型(LLM)在处理长序列时存在计算和存储效率低下的问题,提出了一种名为SnapKV的压缩方法。通过对注意力机制中关键信息的挖掘和压缩,SnapKV能够在保持模型性能的

文章图片
#语言模型
问答数据构建框架 | SciQAG:一个具有细粒度评估的自动生成科学问答数据集的框架

该论文提出了一个自动生成科学问答数据集的框架SciQAG,论文实验核心验证SciQAG生成QA对的质量,以及与其他模型的对比效果。本论文针对大规模科学问答数据集构建问题,提出了一种名为SciQAG的自动生成框架。该框架利用种子问答引导LLMs生成更多问答数据,并设计了一个五维度的RACAR指标用于自动评估生成的问答质量。实验结果表明,SciQAG生成的96万个科学问答对在RACAR指标上平均得分达

文章图片
#自然语言处理
Octo:伯克利开源机器人开发框架

该论文提出了一个开源的通用机器人操作策略Octo,论文实验主要评估Octo在零样本多机器人控制和few-shot策略微调中的性能,以及不同设计决策的影响。本论文针对如何训练一个通用的机器人控制策略这一问题,提出了一个名为Octo的Transformer模型。通过在大规模多机器人数据集上预训练,再在小规模目标领域数据上微调的方式,Octo可以灵活适应新的观察和动作空间,实现了跨机器人和跨任务的强大泛

文章图片
#机器人
Tensorflow中k.gradients()和tf.stop_gradient()的深入理解

上周在实验室开荒某个代码,看到中间这么一段,对Tensorflow中的stop_gradient()还不熟悉,特此周末进行重新并总结。y = xx + K.stop_gradient(rounded - xx)这代码最终调用位置在tensoflow.python.ops.gen_array_ops.stop_gradient(input, name=None),关于这段代码...

MultiHop-RAG:多跳查询的基准检索增强生成

该论文提出了一个新的多跳查询数据集MultiHop-RAG,用于基于检索的语言生成任务(Retrieval-augmented Generation, RAG)的评估。论文实验旨在展示MultiHop-RAG数据集在评估RAG系统的检索和生成能力方面的benchmarking作用。本论文针对现有Retrieval-Augmented Generation (RAG)系统在回答多跳查询(Multi-

文章图片
干货|(含实例) 一文详解模型选择准则之BIC和AIC

最近在撰写笔记 【Sklearn源码学习笔记】(含官网样例解读)无监督学习之高斯混合模型 的过程中,官方Sklearn源码中有用BIC来估计高斯混合模型不同协方差矩阵和分量数下的得分,遂将BIC和AIC相关知识进行总结记录。关于我的更多学习笔记,欢迎您关注“武汉AI算法研习”公众号,本文作者微信comrliuyu。本文分三个部分“【BIC】”、“【AIC】”、“【Sklearn中bi...

LaTex零基础入门教程(含附件:安装包+LaTex文本编译软件+SCI期刊LaTex投稿图文流程)

LaTex是一种基于ΤΕΧ的排版系统,使用LaTex最大的好处就是“只需要写内容就可以,至于内容排版就不是我们的事”。LaTex的使用可以大大提高我们科研论文写作的工作效率。平时写文章一般使用最多的排版工具是Word,使用Word一般先写好内容,之后参考模板调整格式,相比较我们的LaTex就大大省事的多。Word工具LaTex1、编写内容1、编写内容2、参考模板...

到底了