
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
自从ChatGPT掀起大模型热潮后,AI Agent正以惊人的速度渗透进人类工作的毛细血管。近期,信息处理和文件管理领域也迎来了AI代理。

ComfyUI是一个强大的、模块化的界面与后端项目。该用户界面将允许用户使用基于图形/节点/流程图的界面设计和执行高级稳定的扩散管道。目前全面支持SD1.xSD2.xSDXLSD3和命令行选项:--lowvram使其在显存小于 1GB 的 GPU 上运行(在显存较低的 GPU 上自动启用)即使没有 GPU,也可以工作:--cpu(慢)可以加载ckpt和。独立 VAE 和 CLIP 模型从生成的 P

是由北京智源研究院最新推出的一个强大、高效的开源多模态生成模型。与 OmniGen v1 不同,OmniGen2 具有两种不同的文本和图像模态解码路径,利用非共享参数和解耦的图像分词器。

DeepSeek重磅归来!这次,新模型重新定义了数学推理的本质。

其中的逻辑大概就是通过“假如你是一个顶尖的风水大师”等提示词假定DeepSeek是一个专业的算命大师,然后提供一组个人信息,包括性别、出生日期、地点等,让DeepSeek分析学业、事业、财运、婚姻等,当然,如果希望结果再精确一些,还可以让DeepSeek结合不同的推算方法。但值得注意的是,DeepSeek算出来的结果也具有一定的通用性,符合大部分人的成长轨迹。最近,DeepSeek无疑是最火爆的话

AI浪潮席卷全球,中小企业如何规避数据风险、破解算力瓶颈?

在全球AI竞赛进入白热化阶段之际,中国算力正以硬核创新改写规则,这场静默的算力革命,正在为中国赢得AI时代的关键话语权。

清华大学KVCache.AI团队(同时也是 Mooncake PD 分离推理框架的开发团队)与趋境科技于 2 月 10 日推出了 KTransformers 开源项目,通过一系列创新技术,使得只需一块 24G 显存的 4090D 显卡便能在本地运行全参数的 DeepSeek-R1,并实现了 286 tokens/s 的 Prefill 速度和 14tokens/s 的生成速度。我们先简单了解下 K

MultiTalk 是由联合研发的一款。它能够根据多路音频输入、参考图像和文本提示,生成包含且的视频内容。简单来说,它能让静态图片中的人物“开口说话”,并且还能进行“对话”。其特点为:💬 逼真的对话 - 支持单人和多人生成👥 交互式角色控制 - 通过提示指导虚拟人🎤 泛化表演 - 支持卡通人物和歌唱的生成📺 分辨率灵活性:任意纵横比下的 480p 和 720p 输出⏱️ 长视频生成:支持长

HunyuanVideo-Foley 是腾讯混元团队在2025年8月底开源的一款。它旨在解决AI生成视频“有画无声”的痛点,通过输入视频和文本描述,就能自动生成的同步音效,显著提升视频的沉浸感。它是专为视频内容创作者设计的专业级 AI 工具,广泛适用于短视频创作、电影制作、广告创意、游戏开发等多种场景。








