logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

阿里登顶全球榜首!通义千问7B全模态模型拿下Hugging Face开源榜单第一

开源仅6天,阿里通义千问Qwen2.5-Omni就登顶Hugging Face 开源模型榜首,杭州公司包揽榜单前三,中国开源生态全面崛起。

文章图片
#人工智能
千问APP正式上线!基于Qwen 3技术,阿里的AI to C战略全面启航

今天,阿里全力进军AI to C市场,统一其to C品牌:千问App公测版正式上线各大应用商店。

文章图片
#人工智能
一文读懂大模型API聚合平台:一次接入,玩转所有大模型

大模型API聚合平台作为AI应用的“智能调度员”,通过统一接口简化了多模型调用流程,显著降低开发门槛。

文章图片
#人工智能
一文读懂 ComfyUI、Stable Diffusion、Midjourney 的区别

本文对比了三大AI绘图工具:Midjourney是商业付费工具,操作简单但控制有限,适合新手和设计师;StableDiffusion是开源模型,通过WebUI提供灵活定制,适合进阶用户;ComfyUI采用节点工作流,专业度高但学习曲线陡峭,适合开发者和工程师。三者在使用门槛、自由度、工作流定制等方面差异显著。

文章图片
腾讯重磅发布!业界首个美术级3D生成大模型Hunyuan3D-PolyGen诞生:BPT+强化学习实现美术级3D生成

腾讯混元推出业界首个美术级3D生成大模型,建模效率提升70%!这对数字内容生产行业将产生哪些影响?

文章图片
#算力
推理成本吞噬AI未来,云计算如何平衡速度与成本的难题?

当前AI规模化应用正面临着核心困境:在追求极致响应速度的同时,如何控制呈指数级增长的计算成本?

文章图片
#云计算#人工智能
Kimi K2.6 震撼发布:代码与 Agent 集群能力全面进阶

摘要:MoonshotAI发布开源编程模型KimiK2.6,具备对标GPT-5.4的代码生成能力。

文章图片
#人工智能#机器学习#深度学习
SAIL-VL2本地部署教程:2B/8B参数媲美大规模模型,为轻量级设备量身打造的多模态大脑

SAIL-VL2 是由抖音 SAIL 团队与新加坡国立大学 LV-NUS 实验室联合推出的一个多模态大模型,它在保持较小参数规模的同时,实现了媲美甚至超越部分大规模模型的性能。SAIL-VL2 框架概述。该架构由一个视觉编码器组成,将视觉输入对齐到 LLM 的表示空间。轻量级适配器进一步将视觉嵌入转换为标记化表示,这些表示与语言嵌入一起进行多模态推理和预测。SAIL-VL2 支持多种 LLM 主干

文章图片
#开源
ComfyUI-MultiTalk本地部署教程:创新L-RoPE机制破解多音频流绑定难题,定义多人对话视频生成新SOTA!

MultiTalk 是由联合研发的一款。它能够根据多路音频输入、参考图像和文本提示,生成包含且的视频内容。简单来说,它能让静态图片中的人物“开口说话”,并且还能进行“对话”。其特点为:💬 逼真的对话 - 支持单人和多人生成👥 交互式角色控制 - 通过提示指导虚拟人🎤 泛化表演 - 支持卡通人物和歌唱的生成📺 分辨率灵活性:任意纵横比下的 480p 和 720p 输出⏱️ 长视频生成:支持长

文章图片
#人工智能
    共 324 条
  • 1
  • 2
  • 3
  • 33
  • 请选择