20240604 每日AI必读资讯
2.语音和面部动画:通过先进的AI技术,ACE可以让游戏角色不仅能“听”懂玩家说的话,还能通过语音合成和面部动画来进行回复。- 该基准由来自多个大学和研究机构的研究人员共同开发,旨在通过多样化和高质量的数据集,全面考察MLLMs在处理视频数据时的能力。- 每个领域进一步细分为30个子类别,如天文学、科技、纪录片、新闻报道、电竞、魔术表演和时尚等,确保广泛的场景适用性。- 照片真实感: 克服手和脸上
🔍斯坦福团队被曝抄袭清华系大模型,现已删库跑路!
- 斯坦福AI团队Llama3-V抄袭中国国产的大模型成果——MiniCPM-Llama3-V 2.5。
- 模型结构、代码、配置文件一模一样,只是变了变量名。
- Llama3-V,于5月29日发布,宣称只需要500美元就能训出一个SOTA多模态大模型。
- 目前,GitHub还是HuggingFace,统统都是404
🔗 斯坦福团队被曝抄袭清华系大模型,已删库跑路,创始人回应:也算国际认可-CSDN博客
🛠️ChatGPT4o被越狱拿来搞大尺度!
-黑客利用OpenAI“漏洞”,让最新版ChatGPT4o突破安全防护,执行不被允许执行的指令。
- 借鉴中文躲避审查的思路,把一些字符进行替换从而躲避关键词审查。
- 目前,绕过限制的方式已经被OpenAI给堵住。
🔗ChatGPT4o被越狱了,有人拿来搞大尺度!-CSDN博客
📊Video-MME: 首个多模态大模型视频分析综合评估基准
- 该基准由来自多个大学和研究机构的研究人员共同开发,旨在通过多样化和高质量的数据集,全面考察MLLMs在处理视频数据时的能力。
- 视频数据集涵盖6个主要视觉领域,包括知识、电影与电视、体育竞技、艺术表演、生活记录和多语言。
- 每个领域进一步细分为30个子类别,如天文学、科技、纪录片、新闻报道、电竞、魔术表演和时尚等,确保广泛的场景适用性。
🔗项目地址:https://video-mme.github.io/home_page.html
📂Meta更新隐私政策:强制规定用户在Facebook 和 Instagram上发布的内容被用于训练AI
- 根据新版隐私权政策,用户将同意将自己发布的任何内容用于 AI at Meta 模型训练。
- 如果用户选择不同意该隐私权政策则应该主动停止使用 Facebook 和Instagram等产品,否则均为接受新政策。
- 新的隐私权政策将在 2024 年 6 月 26 日生效。
🤖NVIDIA发布数字人 AI 技术:NVIDIA ACE
- 可以让游戏NPC具有AI对话功能,同时能直接生成数字人的语音和面部动画!
- Avatar Cloud Engine (ACE)是一项用于提升游戏和虚拟角色互动体验的技术。
1.赋予游戏角色智能:ACE可以让游戏中的非玩家角色(NPC)具有真实的对话能力。这意味着玩家可以与这些角色进行自然、智能的对话,而不是仅仅触发预设的台词 。
2.语音和面部动画:通过先进的AI技术,ACE可以让游戏角色不仅能“听”懂玩家说的话,还能通过语音合成和面部动画来进行回复。这使得角色的反应更加生动和真实 。
3.灵活部署:开发者可以根据需要将ACE部署在云端或本地设备上,保证在不同环境下都能提供高质量的互动体验 。
4.高效低延迟:ACE优化了神经网络的性能,确保在游戏中的互动能够实时进行,避免延迟问题
🔗 https://blink.csdn.net/details/1716524
🖼️Stability AI宣布Stable Diffusion3 Medium开放发布日期为6月12日
- 照片真实感: 克服手和脸上的常见工件,提供高质量的图像,无需复杂工作流程。
- 排版优秀: 在排版上获得健壮的结果,优于更大的最先进的模型。
- 高性能: 优化的大小和效率,非常适合消费者系统和企业工作负载。
更多推荐
所有评论(0)