logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

ICML 2025 高分论文!快手&南开提出:模块化双工注意力机制,显著提升多模态大模型情感理解能力!

快手可灵团队与南开大学成功定位了现有多模态大模型在情感线索捕捉中的关键短板。提出了新的模块化双工注意力范式,并基于此构建了一个涵盖感知、认知与情感能力的多模态模型‘摩达(MODA)’。该模型在通用对话、知识问答、表格处理、视觉感知、认知分析和情感理解等六大类任务的21个基准测试中均实现了显著性能提升!

文章图片
#人工智能#计算机视觉
快手基础大模型团队7篇论文入选人工智能领域顶会ACL 2025

通过评估众多最先进的描述模型,我们证明了 VidCapBench 与现有视频描述评估方法相比具有卓越的稳定性和全面性,确保评测的是视频描述的质量而不是裁判模型的评价能力。值得注意的是,与现有方法相比,我们的方法利用模型辨别有害信息的能力,同时保持了较高的有用性。然而,现有的视频理解基准测试往往将这些特性分开处理,或仅仅关注特定方面,忽视了视频内容的整体性。这项评估揭示了视频时序理解中的关键挑战,例

文章图片
#人工智能
新加坡见!快手11篇论文入选人工智能领域顶会ICLR 2025

快手11篇论文入选人工智能领域顶会ICLR 2025

文章图片
#人工智能
可图大模型再进化,实现AI试衣自由!

AI试衣,又叫做“虚拟试穿”(Virtual Try-On),是一种能让人穿上指定衣服的图像生成技术。随着GAN、Diffusion Model为代表的视觉生成模型技术发展,虚拟试穿逐步从实验室研究探索走向行业实践应用。尤其进入2024年,大模型应用进入行业新阶段,AI试衣也逐步具备了在行业中应用推广的技术可行性。在电商应用场景,无论面向广大买家、还是中小卖家,AI试衣能够将线下购买试衣过程线上化

文章图片
#人工智能
快手可灵视频生成大模型全方位测评

大模型落地的实际效果如何离不开用户的体验与感知,来自中科院计算所数字内容合成与伪造检测实验室的唐帆副研究员及黄子尧、徐子艺等同学对可灵AI视频生成大模型进行了测评。团队本次对可灵AI的评测,是为了评估现有视频生成模型能力,探索视频生成技术在学术和现实场景里的新方向和应用潜力。

文章图片
#音视频#人工智能
快手可图大模型Kolors全面开源——一个更懂中文的文生图大模型

快手可图大模型Kolors全面开源!支持中英文双语,文本输入最高可至256字符,具备英文和中文文字生成能力,生成效果比肩Midjourney-v6水平!

文章图片
#语言模型#人工智能
快手4篇论文入选人工智能领域顶会ACL 2024

快手四篇论文入选ACL,研究内容涵盖快意大模型在多轮对话、复杂推理、RLHF等领域的深入探索与最新进展,以及MoE在搜索技术上的创新应用。

文章图片
#人工智能
CVPR 2024 | 快手8篇论文入选计算机视觉顶会

此外,为进一步推动VQE领域的研究,我们构建了一个全新的压缩视频编码先验数据集VCP,包含300个原始视频和多种HEVC编码配置下的编码先验(如运动矢量、预测帧、残差帧等),有效弥补了现有数据集中编码先验缺失的空白。在三个评估数据集和四个偏好维度上,MPS的表现优于现有的评分方法,使其成为评估和改进文本生成图像的有前景的指标。基于这一视角,我们提出了测试时能量适应(TEA),它将训练好的分类器转变

文章图片
#人工智能#算法#AIGC
AAAI 2026|基于思维链与强化学习的可解释多模态广告审核护栏

你是否刷到过这样的短视频广告:如何在家躺着日赚几百块”、“通过手相预测未来姻缘”。在快手商业化广告素材审核过程中,快手商业化生态与体验团队每天也会拦截大量的风险素材。为解决这一痛点,快手商业生态与体验算法团队提出了BLM-Guard,这是一个专为高风险短视频广告设计的可解释性多模态审核框架。✨核心亮点:🧠【像审核员一样思考】📌【动态策略自适应】📊 【动态策略自适应】

文章图片
#人工智能
节省前端1000+pd人力成本!快手快聘「伏羲工作台」技术实践全解析

业务背景“快聘”是快手于2022年推出覆盖蓝领群体的短视频平台蓝领招聘业务。通过构建以信任为中心的蓝领招聘关系和直播带岗模式,为用工企业和蓝领用户搭建就业平台。快手“快聘”早期叫“快招工”,进行品牌升级后叫“快聘”,自推出后,已为比亚迪、宁德时代、理想汽车、中航锂电、歌尔股份、立讯集团、海信集团等众多制造企业进行“直播带岗”。2022年,快手“快聘”,引领直播带岗新模式,为招聘企业和蓝领用户搭建

文章图片
#前端
    共 77 条
  • 1
  • 2
  • 3
  • 8
  • 请选择