logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

快手&南大发布代码智能“指南针”,重新定义AI编程能力评估体系

快手 KwaiKAT 团队与南京大学刘佳恒老师 NJU-LINK 合作推出 SWE-Compass ——一个涵盖8大任务类型、8大编程场景、10种编程语言的代码智能统一评估框架,它包含2000个高质量实例,在任务类别、编程场景和语言方面实现了良好的平衡,为评估大型语言模型在实际软件工程任务中的能力提供了一个严格且具有代表性的评估框架。

文章图片
快手&南大发布代码智能“指南针”,重新定义AI编程能力评估体系

快手 KwaiKAT 团队与南京大学刘佳恒老师 NJU-LINK 合作推出 SWE-Compass ——一个涵盖8大任务类型、8大编程场景、10种编程语言的代码智能统一评估框架,它包含2000个高质量实例,在任务类别、编程场景和语言方面实现了良好的平衡,为评估大型语言模型在实际软件工程任务中的能力提供了一个严格且具有代表性的评估框架。

文章图片
快手统一特征抽取框架KaiFG,用Python的优雅,唤醒C++般的性能狂潮!

当算法工程师困于异构特征框架的碎片化泥潭,当创新灵感被30分钟编译枷锁牢牢禁锢 —— 快手算法引擎团队自研的「特征工程超导体」KaiFG,破局而来!这套框架将赋能更多业务团队,让创新不再受技术枷锁所困,让每一行代码都能释放极致效能。

文章图片
#python#c++#开发语言 +1
新加坡见!快手11篇论文入选人工智能领域顶会ICLR 2025

快手11篇论文入选人工智能领域顶会ICLR 2025

文章图片
#人工智能
快手基础大模型团队7篇论文入选人工智能领域顶会ACL 2025

通过评估众多最先进的描述模型,我们证明了 VidCapBench 与现有视频描述评估方法相比具有卓越的稳定性和全面性,确保评测的是视频描述的质量而不是裁判模型的评价能力。值得注意的是,与现有方法相比,我们的方法利用模型辨别有害信息的能力,同时保持了较高的有用性。然而,现有的视频理解基准测试往往将这些特性分开处理,或仅仅关注特定方面,忽视了视频内容的整体性。这项评估揭示了视频时序理解中的关键挑战,例

文章图片
#人工智能
新加坡见!快手11篇论文入选人工智能领域顶会ICLR 2025

快手11篇论文入选人工智能领域顶会ICLR 2025

文章图片
#人工智能
快手4篇论文入选人工智能领域顶会ACL 2024

快手四篇论文入选ACL,研究内容涵盖快意大模型在多轮对话、复杂推理、RLHF等领域的深入探索与最新进展,以及MoE在搜索技术上的创新应用。

文章图片
#人工智能
端到端短视频多目标排序机制框架EMER详解

近日,快手正式发布全新推出的端到端多目标融合排序框架——EMER。该框架以其“会比较、自进化”的核心能力,重构了传统依赖人工经验公式的推荐模式,在快手主站App与极速版应用中实现了七日留存提升0.13%~0.2%、用户停留时长提升1.2%~1.4% 的显著效果,为行业推荐系统的智能化升级提供了可落地的解决方案。

文章图片
#人工智能#算法
可图大模型再进化,实现AI试衣自由!

AI试衣,又叫做“虚拟试穿”(Virtual Try-On),是一种能让人穿上指定衣服的图像生成技术。随着GAN、Diffusion Model为代表的视觉生成模型技术发展,虚拟试穿逐步从实验室研究探索走向行业实践应用。尤其进入2024年,大模型应用进入行业新阶段,AI试衣也逐步具备了在行业中应用推广的技术可行性。在电商应用场景,无论面向广大买家、还是中小卖家,AI试衣能够将线下购买试衣过程线上化

文章图片
#人工智能
快手&南大联合发布自适应推理框架HiPO,突破LLM“过度思考”困局

别想太多,其实AI可以又简单又轻松!HiPO框架在简单问题上秒回,在复杂问题上深思,实现效率与准确率的双赢

文章图片
#人工智能#大数据#算法
    共 40 条
  • 1
  • 2
  • 3
  • 4
  • 请选择