
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
开源仅6天,阿里通义千问Qwen2.5-Omni就登顶Hugging Face 开源模型榜首,杭州公司包揽榜单前三,中国开源生态全面崛起。

今天,阿里全力进军AI to C市场,统一其to C品牌:千问App公测版正式上线各大应用商店。

大模型API聚合平台作为AI应用的“智能调度员”,通过统一接口简化了多模型调用流程,显著降低开发门槛。

本文对比了三大AI绘图工具:Midjourney是商业付费工具,操作简单但控制有限,适合新手和设计师;StableDiffusion是开源模型,通过WebUI提供灵活定制,适合进阶用户;ComfyUI采用节点工作流,专业度高但学习曲线陡峭,适合开发者和工程师。三者在使用门槛、自由度、工作流定制等方面差异显著。

腾讯混元推出业界首个美术级3D生成大模型,建模效率提升70%!这对数字内容生产行业将产生哪些影响?

“开源之光”通义千问,再次突破了AI的边界。

当前AI规模化应用正面临着核心困境:在追求极致响应速度的同时,如何控制呈指数级增长的计算成本?

摘要:MoonshotAI发布开源编程模型KimiK2.6,具备对标GPT-5.4的代码生成能力。

SAIL-VL2 是由抖音 SAIL 团队与新加坡国立大学 LV-NUS 实验室联合推出的一个多模态大模型,它在保持较小参数规模的同时,实现了媲美甚至超越部分大规模模型的性能。SAIL-VL2 框架概述。该架构由一个视觉编码器组成,将视觉输入对齐到 LLM 的表示空间。轻量级适配器进一步将视觉嵌入转换为标记化表示,这些表示与语言嵌入一起进行多模态推理和预测。SAIL-VL2 支持多种 LLM 主干

MultiTalk 是由联合研发的一款。它能够根据多路音频输入、参考图像和文本提示,生成包含且的视频内容。简单来说,它能让静态图片中的人物“开口说话”,并且还能进行“对话”。其特点为:💬 逼真的对话 - 支持单人和多人生成👥 交互式角色控制 - 通过提示指导虚拟人🎤 泛化表演 - 支持卡通人物和歌唱的生成📺 分辨率灵活性:任意纵横比下的 480p 和 720p 输出⏱️ 长视频生成:支持长








