
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
hi,大家好~我是shadow,一枚设计师/全栈工程师/算法研究员,目前主要研究方向是人工智能写作和人工智能设计,当然偶尔也会跨界到人工智能艺术及其他各...
- Apple的3D声音Apple正在开发一种新的音频格式,即使在用户移动,戴着“ Apple Glass ”或其他AR设备时,也可以更轻松沉浸式地在用户周围放置“3d声音”。Apple...
生成多人播客:Comfyui-ChatTTS是一个开源的GitHub项目,致力于为ComfyUI添加语音合成功能。该项目提供了一系列功能强大的节点和模型,支持用户创建和复用音色,支持多人对话模式的生成,并提供了导出音频字幕文件的功能。项目包含多个关键节点,如ChatTTS、Multi Person Podcast、CreateSpeakers,以及SaveSpeaker和LoadSpeaker
文本生成图像已有了大量模型工具,文本生成3D模型的工具到是很少见。#我记得有一期推文介绍了文本生成数字人模型吧,现在有能生成通用3D模型的工具了?近期谷歌AI 发布了文本生成3D模型— Dreamfusion#赶紧去体验下有多神奇~DreamFusionDreamfusion是Google 的大型AI图像模型 Imagen 与 NeRF 的3D功能相结合。从模型发展脉络上看,Dreamfusi..
另外,提一句,最近我把小智迁移到了nodejs,现在可以通过nodejs创建虚拟设备,然后可以用js来二次开发小智了。mcp-exe --mcp-config <mcp.json文件的路径> --ws <小智的mcp接入点地址>(一个简单的 CLI 工具,确保 Node.js 应用持续运行,即使崩溃或服务器重启也能自动重启)。也就是说,可以在chrome插件、网页、甚至是桌面软件上实现小智语音助手
AI 已经能让 “一句话” 诞生出巨大的生产力了。#文本-图像、文本-3D模型、文本-视频......Meta AI 发布了文本生成视频模型 Make-A-Video#未来的编剧就是导演?真的看到任何人都能落地自己想象力的时代来临了小杜Make-A-Video 可以让我们仅用几句话或几行文本生成异想天开、独一无二的视频。促进想象力变为现实的AI工具包发展得越来越多样了~Make-A-VideoMe
设计商业技术 No.67 ????计算机+X=跨学科计算机技术已经成为一种底层技术,与任意学科结合,产生新学科。Mixlab倡导大家去探索好玩、有趣的项目(学科)。从创立至...
从前有一个神奇的编辑器王国,那里住着各种编辑器:开源的、AI代码编辑器、视频编辑器,还有专门处理邮件和音频的编辑器。一天,国王Markdown决定举办一场盛会,邀请所有编辑器展示各自的才华。开源编辑器们自豪地展示了他们的自由精神,任何人都能加入并贡献代码;AI代码编辑器则炫耀着他们的智能,能自动补全代码;视频编辑器们则播放着他们精心剪辑的视频,让观众目不转睛。谷歌的可视化编程编辑器甚至带来了神秘的
#聆心智能、智谱AI、全资收购话题:聆心智能被智谱AI全资收购#CharacterGLM超拟人大模型话题:聆心智能与智谱AI合作发布CharacterGLM超拟人大模型#投资话题:智谱AI投资了聆心智能的天使轮以及Pre-A轮融资曝智谱AI全资收购清华系大模型公司聆心智能https://36kr.com/p/2441035936682369#MixCopilot...
阿里云智能 NPS 工具是一款由设计中心打造、深植于云业务体验管理场景的调研工具,将用研专业赋能给产品经理等角色并实现提效;目前通过工具发起的 NPS 调研已覆盖所有主营云产品,近半数参...







