logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

通用4D世界模型NeoVerse面世:单目视频秒变4D大片,推理提速8倍

来自中科院自动化所(CASIA)与CreateAI的研究团队联合发布了最新的通用4D世界模型——NeoVerse。该模型彻底打破了以往4D建模对专业多视角数据或复杂位姿预处理的依赖,通过学习互联网上100万条“野外”单目视频,实现了从视频重建到高保真生成的跨越式进化。

文章图片
#音视频#人工智能#机器学习 +2
DataFlow:用自然语言自动准备LLM数据

该论文提出LLM驱动的统一数据准备框架DataFlow,旨在解决当前LLM数据准备碎片化、标准化缺失的问题。框架含近200个可复用算子与6类领域通用流水线,采用类PyTorch编程接口,支持模块化、可调试的数据处理。通过DataFlow-Agent,可将自然语言指令自动转化为可执行流水线。实验表明,其在文本、数学推理、代码等任务上表现优异,Text-to-SQL执行准确率提升3%,代码基准平均提升

文章图片
#人工智能#计算机视觉#深度学习 +1
云端部署 OpenClaw:打造 24 小时“数字生命”助手

谁还在被AI“画大饼”?写邮件要自己点发送,列待办要自己去执行,看似智能实则只是 “嘴炮工具”,根本落不了地。但 2026 年初这款现象级 AI 产品的出现,彻底改变了这一现状 —— 它就是被网友亲切称为「那只龙虾」🦞的,一款真正能 “动手办事” 的。从Clawdbot到Moltbot,再到如今的OpenClaw,这款开源AI智能体框架在短短一个月内,,朋友圈、开发者社区全是它的身影,TechC

文章图片
#人工智能
LlamaFactory春节特供:AI 精准拿捏对联格律,告别对仗翻车

如今大语言模型早已能写文、答惑、创作,可面对对联这种讲究格律、对仗、意境的传统文体,通用大模型却屡屡 “水土不服”。问题的核心,在于模型缺少足量优质的对联专业样本,没能真正吃透中文对仗的规则。而微调(Fine-tuning)恰好能补上这一课:无需从零打造新模型,只需让现有大模型基于高质量对联数据 “拜师学艺”,就能掌握格律与意境的创作要领。借助LlamaFactory微调工具,大模型也能精准拿捏对

文章图片
#人工智能#机器学习#深度学习 +3
大模型训练全流程实战指南工具篇(五)——大模型训练全流程步骤详解与对应工具推荐

数据阶段训练阶段与评测阶段。每个阶段又可进一步细分为若干关键步骤。数据工程主要包括文本采集、文本过滤、文本清洗与去重及数据集构建等步骤。训练工程若从零开始设计模型,通常需经历选择基础架构、确定模型规模、设计模型结构与功能,随后进行预训练、监督微调(SFT)及强化学习对齐(RLHF)等步骤。然而,完全从头训练需消耗海量数据与巨额算力(例如数十亿条数据与数十台服务器并行),这对中小团队或个人开发者而言

#人工智能#深度学习#机器学习
当我用 AI 工具将论文转为漫画后,我发现真是太好用了

这篇论文开创了以“Transformer 为骨架、预训练为核心、大规模并行为支撑”的 AI 新范式,其影响力已延伸至多模态、机器人、自动驾驶等多个前沿领域。近日,知名 AI 研究者田渊栋在社交平台上分享了一次有趣的尝试:他使用 nano banana 与 NotebookLM 将一篇学术论文转化为可视化漫画,并直言“这比我自己做的海报好多了”。只需上传 PDF 格式的论文,系统即可自动生成高质量的

#人工智能
当我用 AI 工具将论文转为漫画后,我发现真是太好用了

这篇论文开创了以“Transformer 为骨架、预训练为核心、大规模并行为支撑”的 AI 新范式,其影响力已延伸至多模态、机器人、自动驾驶等多个前沿领域。近日,知名 AI 研究者田渊栋在社交平台上分享了一次有趣的尝试:他使用 nano banana 与 NotebookLM 将一篇学术论文转化为可视化漫画,并直言“这比我自己做的海报好多了”。只需上传 PDF 格式的论文,系统即可自动生成高质量的

#人工智能
答疑解惑 |「论文头号玩家」论文复现活动常见问题合集,一看就懂 ~

回答:大多数论文会将其代码发布到 GitHub 或其他平台上,因此你需要阅读论文,并且找到代码仓库的链接,链接通常在附加在论文末尾或摘要部分。找到论文提供的 GitHub 开源代码后,您需要查看项目中是否有清晰的 README 文件,介绍如何配置环境、安装依赖、运行代码等。如果您有特别想复现的、符合活动主题(AI 顶会论文)的其他论文,也欢迎在提交 Issue 时提出,审核通过后即可进行。回答:可

#人工智能
清华 + 快手联合提出 FilmWeaver 框架,攻克多镜头视频生成一致性难题

摘要:清华大学与快手团队联合提出FilmWeaver框架,解决多镜头视频生成的一致性问题。该框架采用双层缓存机制:时间缓存确保镜头内动作连贯性,镜头缓存维持跨镜头视觉一致性。通过四阶段推理流程支持从首镜头生成到多镜头叙事的全流程创作,并构建高质量多镜头数据集进行验证。实验表明,FilmWeaver在角色一致性(74.61%)、文本对齐(23.07%)等指标上显著优于现有方法,能稳定保持角色外观和背

#音视频
AAAI 2026 为什么开源 LLM 搞不定数据分析?浙江大学揭秘核心原因

论文标题:作者团队:浙江大学发布时间:2025年11月13日大语言模型(LLMs)在自动化数据分析任务中具有巨大潜力,但现有开源模型在面向高强度推理场景时仍存在明显局限。为此,本工作系统研究了提升开源 LLM 数据分析能力的策略。首先构建了一个涵盖多样且贴近真实场景的种子数据集,从数据理解、代码生成和策略规划三个核心维度对模型表现进行评测。

#数据分析#数据挖掘
    共 58 条
  • 1
  • 2
  • 3
  • 6
  • 请选择