
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
来自中科院自动化所(CASIA)与CreateAI的研究团队联合发布了最新的通用4D世界模型——NeoVerse。该模型彻底打破了以往4D建模对专业多视角数据或复杂位姿预处理的依赖,通过学习互联网上100万条“野外”单目视频,实现了从视频重建到高保真生成的跨越式进化。

该论文提出LLM驱动的统一数据准备框架DataFlow,旨在解决当前LLM数据准备碎片化、标准化缺失的问题。框架含近200个可复用算子与6类领域通用流水线,采用类PyTorch编程接口,支持模块化、可调试的数据处理。通过DataFlow-Agent,可将自然语言指令自动转化为可执行流水线。实验表明,其在文本、数学推理、代码等任务上表现优异,Text-to-SQL执行准确率提升3%,代码基准平均提升

谁还在被AI“画大饼”?写邮件要自己点发送,列待办要自己去执行,看似智能实则只是 “嘴炮工具”,根本落不了地。但 2026 年初这款现象级 AI 产品的出现,彻底改变了这一现状 —— 它就是被网友亲切称为「那只龙虾」🦞的,一款真正能 “动手办事” 的。从Clawdbot到Moltbot,再到如今的OpenClaw,这款开源AI智能体框架在短短一个月内,,朋友圈、开发者社区全是它的身影,TechC

如今大语言模型早已能写文、答惑、创作,可面对对联这种讲究格律、对仗、意境的传统文体,通用大模型却屡屡 “水土不服”。问题的核心,在于模型缺少足量优质的对联专业样本,没能真正吃透中文对仗的规则。而微调(Fine-tuning)恰好能补上这一课:无需从零打造新模型,只需让现有大模型基于高质量对联数据 “拜师学艺”,就能掌握格律与意境的创作要领。借助LlamaFactory微调工具,大模型也能精准拿捏对

数据阶段训练阶段与评测阶段。每个阶段又可进一步细分为若干关键步骤。数据工程主要包括文本采集、文本过滤、文本清洗与去重及数据集构建等步骤。训练工程若从零开始设计模型,通常需经历选择基础架构、确定模型规模、设计模型结构与功能,随后进行预训练、监督微调(SFT)及强化学习对齐(RLHF)等步骤。然而,完全从头训练需消耗海量数据与巨额算力(例如数十亿条数据与数十台服务器并行),这对中小团队或个人开发者而言
这篇论文开创了以“Transformer 为骨架、预训练为核心、大规模并行为支撑”的 AI 新范式,其影响力已延伸至多模态、机器人、自动驾驶等多个前沿领域。近日,知名 AI 研究者田渊栋在社交平台上分享了一次有趣的尝试:他使用 nano banana 与 NotebookLM 将一篇学术论文转化为可视化漫画,并直言“这比我自己做的海报好多了”。只需上传 PDF 格式的论文,系统即可自动生成高质量的
这篇论文开创了以“Transformer 为骨架、预训练为核心、大规模并行为支撑”的 AI 新范式,其影响力已延伸至多模态、机器人、自动驾驶等多个前沿领域。近日,知名 AI 研究者田渊栋在社交平台上分享了一次有趣的尝试:他使用 nano banana 与 NotebookLM 将一篇学术论文转化为可视化漫画,并直言“这比我自己做的海报好多了”。只需上传 PDF 格式的论文,系统即可自动生成高质量的
回答:大多数论文会将其代码发布到 GitHub 或其他平台上,因此你需要阅读论文,并且找到代码仓库的链接,链接通常在附加在论文末尾或摘要部分。找到论文提供的 GitHub 开源代码后,您需要查看项目中是否有清晰的 README 文件,介绍如何配置环境、安装依赖、运行代码等。如果您有特别想复现的、符合活动主题(AI 顶会论文)的其他论文,也欢迎在提交 Issue 时提出,审核通过后即可进行。回答:可
摘要:清华大学与快手团队联合提出FilmWeaver框架,解决多镜头视频生成的一致性问题。该框架采用双层缓存机制:时间缓存确保镜头内动作连贯性,镜头缓存维持跨镜头视觉一致性。通过四阶段推理流程支持从首镜头生成到多镜头叙事的全流程创作,并构建高质量多镜头数据集进行验证。实验表明,FilmWeaver在角色一致性(74.61%)、文本对齐(23.07%)等指标上显著优于现有方法,能稳定保持角色外观和背
论文标题:作者团队:浙江大学发布时间:2025年11月13日大语言模型(LLMs)在自动化数据分析任务中具有巨大潜力,但现有开源模型在面向高强度推理场景时仍存在明显局限。为此,本工作系统研究了提升开源 LLM 数据分析能力的策略。首先构建了一个涵盖多样且贴近真实场景的种子数据集,从数据理解、代码生成和策略规划三个核心维度对模型表现进行评测。







