
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
摘要:DeepSeek提出流形约束超连接(mHC)解决大模型训练稳定性问题。传统残差连接在超大模型中成为带宽瓶颈,而超连接(HC)方案虽提升性能却破坏了恒等映射特性。mHC创新性地将HC连接空间投影到伯克霍夫多面体流形上,通过双随机矩阵确保信号稳定传输,同时结合TileLang等系统优化,仅增加6.7%训练时间就实现了4倍残差路径拓宽。该方案在数学推理等任务上表现优异,为万亿参数模型提供了可行的架

腾讯混元团队发布HY-Motion1.0模型,通过AI实现自然3D动作生成。该模型采用十亿参数DiT架构和流匹配技术,经过三阶段训练(预训练、微调、强化学习),能精准理解文字指令并生成流畅动作。支持200多种动作类别,大幅降低3D动画制作门槛。目前模型已开源,或将开启3D动画大模型时代。

腾讯混元团队发布HY-Motion1.0模型,通过AI实现自然3D动作生成。该模型采用十亿参数DiT架构和流匹配技术,经过三阶段训练(预训练、微调、强化学习),能精准理解文字指令并生成流畅动作。支持200多种动作类别,大幅降低3D动画制作门槛。目前模型已开源,或将开启3D动画大模型时代。

字节跳动Seed团队发布Seedance1.5pro视频生成模型,实现原生音画同步创作。该模型突破传统AI视频生成局限,能根据文字描述自动生成包含方言配音、专业运镜和情绪连贯的电影级短片。核心技术包括:双分支扩散Transformer架构实现音画实时同步;多方言口型精准对齐;支持希区柯克变焦等专业运镜;推理速度提升10倍以上。应用场景涵盖短视频创作、影视预演、文化保护等,有望降低专业视频制作门槛,

Quilter是一款革命性的AI电路板设计工具,采用强化学习技术自动优化PCB布局布线。不同于传统自动布线器,它能同时生成上百种方案,综合考虑信号完整性、散热等物理因素,将复杂电路板设计时间从数周缩短至几天。该工具已获SpaceX等公司采用,可将工程师从繁琐布线中解放,专注系统架构设计。创始人预言,未来手动设计PCB将像手写代码一样过时。目前处于免费测试阶段,有望彻底改变硬件设计流程。

Qwen3-Omni-Flash突破多模态AI交互瓶颈,实现全感官实时响应。该模型采用Thinker-Talker创新架构,在36项音视频测试中取得32个开源第一,响应速度达毫秒级(音频211ms/视频500ms)。其核心技术包括2000万小时训练的AuT编码器、MoE专家系统和多码本流式生成,支持119种语言交互和30分钟长音频理解。相比传统AI的割裂处理流程,Qwen3-Omni能同步理解并自

字节跳动推出AI神器AnyGen,可一键将零散内容转化为精美PPT、网页、绘本等成品。该工具具备三大核心能力:1)"炼金术"式一键生成,输入文字/语音即可输出各类成品;2)多模态理解力,能处理语音、图片等杂乱信息;3)可视化创作,自动完成插画、网页构建等。AnyGen让普通人摆脱技术门槛,只需提供创意即可快速产出专业作品,大幅提升工作和创作效率。目前该工具已开放试用,或将改变未

字节跳动推出AI神器AnyGen,可一键将零散内容转化为精美PPT、网页、绘本等成品。该工具具备三大核心能力:1)"炼金术"式一键生成,输入文字/语音即可输出各类成品;2)多模态理解力,能处理语音、图片等杂乱信息;3)可视化创作,自动完成插画、网页构建等。AnyGen让普通人摆脱技术门槛,只需提供创意即可快速产出专业作品,大幅提升工作和创作效率。目前该工具已开放试用,或将改变未

阿里云开源Z-Image-Turbo-Fun-Controlnet-Union(简称Z-Controlnet),一款轻量级AI绘图工具,仅60亿参数却支持多条件精准控制。该工具可在RTX4080上9秒生成1024x1024高清图,支持姿势、边缘、深度等联合控制,显存需求仅6GB,老显卡和Mac均可流畅运行。其多条件输入能力解决了传统AI绘图不可控的问题,为电商、游戏开发等领域提供高效解决方案,大幅

NanoBananaPro是基于谷歌Gemini3的AI图像生成工具,具备专业级设计能力。文章介绍了7大使用技巧:1)通过5W法则构建详细提示词;2)添加专业摄影参数;3)实现完美文本渲染;4)运用真实物理认知;5)支持智能翻译;6)专业布光与运镜;7)灵活画幅与材质模拟。提供了黄金公式"主题+构图+动作+地点+风格+细节"的提示词编写方法,同时指出工具在细节处理上仍有改进空间








