
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文原是github开源项目MC_thread_pool的说明文档,原文发送在此,同时本文中所有代码均在github中有完整实现,查看代码请移步github仓库!

摘要: DiC提出了一种纯卷积架构的扩散模型,在保持生成质量的同时显著降低计算成本。核心创新包括:**频率感知空洞卷积(FADC)**动态捕捉多尺度特征,**双路径残差(DPR)缓解深度梯度消失,以及混合频率采样(MFS)**优化训练效率。实验表明,DiC-B(72M参数)在512×512图像生成上FID达7.95,优于DiT-L(344M参数),且骁龙8 Gen3 NPU部署仅需0.9秒/图。开

XPath 是一门在 XML 文档中查找信息的语言。查找所有id属性等于head并且class属性等于s_down的div标签。html_tree = etree.HTML(html字符串)通过在路径表达式中使用“|”运算符,您可以选取若干个路径。谓语用来查找某个特定的节点或者包含某个指定的值的节点。选取文档中的所有 title 和 price 元素。查询所有id属性中包以he开头的div标签。查

本文原是github开源项目MC_thread_pool的说明文档,原文发送在此,同时本文中所有代码均在github中有完整实现,查看代码请移步github仓库!

昆仑万维在2025年8月11日至15日举办的SkyWork AI技术发布周上,开源了6大前沿AI模型,涵盖视频、3D、图像、智能体和音乐创作等领域。其中,SkyReels-A3实现分钟级长视频生成,Matrix-Game 2.0支持实时交互式长序列生成,Matrix-3D可从单图生成全景场景,Mureka V7.5则针对中文音乐创作进行了优化。这些技术突破将深刻影响直播电商、虚拟现实、科研及音乐创

【摘要】清华大学与智谱AI联合发布Glyph框架,创新性地通过视觉压缩技术突破大模型的长文本处理瓶颈。该框架将文本渲染为图像,利用视觉语言模型(VLM)处理,在保持精度的同时实现3-4倍token压缩。Glyph采用三阶段技术路径:持续预训练建立视觉-语言对齐能力;LLM驱动的遗传搜索算法优化渲染参数;强化学习与OCR辅助任务提升细节理解。实验表明,该方法显著降低算力消耗,使128K窗口模型能处理

小红书AIGC团队在NIPS2025提出创新性InstanceAssemble算法,解决布局可控图像生成(L2I)的核心难题。该算法采用两阶段级联架构,先生成全局背景再通过实例组装注意力模块(Assemble-Attn)实现局部精准控制,同时利用LoRA技术仅增加3%参数即实现DiT扩展。实验表明,即使在密集布局场景下(每图18个目标),该方法仍能保持高精度的位置对齐和语义一致性,同时参数开销减少

华为联合高校推出世界模型WorldGrow,实现室内3D场景生成技术突破。该模型能在单张A100显卡上30分钟生成272㎡高质量连贯场景,解决了传统AI建模中边缘断裂、逻辑混乱等问题。通过"双生成器搭档"和三线性插值算法,WorldGrow实现了高精度细节与逻辑化布局,测试指标FID值仅7.52。值得注意的是,这项由华为实习生主导研发的技术,已通过论文公开并集成至华为云盘古大模

2025年8月24日,马斯克宣布xAI开源Grok-2.5(实际为Grok-2)模型,采用混合专家(MoE)架构,参数量达2680亿,包含42个分片约500GB。开源采用受限许可证,仅允许非商业和年收入低于100万美元的商业使用,禁止用于训练其他基础模型。Grok-2技术亮点包括:64层Transformer结构、8192隐藏维度、支持128k token的超长上下文处理能力,以及混合精度训练和分

DeepSeek V3.1突破性实现128k上下文处理能力 摘要:DeepSeek于2025年8月发布V3.1版本,核心突破是将上下文处理能力扩展至128k字符。该版本采用混合稀疏注意力机制,结合局部注意力和周期性全局注意力,有效解决了传统Transformer模型在处理长文本时的计算瓶颈问题。通过分块处理、并行计算和优化的内存管理技术,在保证计算效率的同时显著提升了长文本处理能力。新版本保持AP








