logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【ZEGO即构开发者日报】谷歌Gemini Live语音升级;文心5.0正式发布,一手实测2.4万亿参数原生全模态模型;中东AI市场迈向千亿美元,年增速高达35%;DataEye海外微短剧热榜数据..

科技快讯:谷歌GeminiLive语音功能升级2.0版本,具备实时语速调节和情绪感知能力,深度集成Google生态;百度发布2.4万亿参数文心5.0全模态大模型,支持跨模态输入输出。行业方面,中东AI市场增速达35%,预计2030年突破千亿美元;DataEye数据显示海外微短剧热度稳定,本期热榜TOP30总热值5644万。

文章图片
#人工智能#大数据#实时音视频 +1
【ZEGO即构开发者日报】可灵新一代数字人 2.0 已上线;GPT-5-Thinking新训练方法公开:忏悔训练Confessions;Kling 预告的 2.6 模型已经正式上线......

【AI技术动态】 1.可灵数字人2.0上线,实现表现力、手势口型控制及5分钟长内容三大突破; 2.OpenAI公布GPT-5忏悔训练法,模型自检准确率提升至89%; 3.Kling 2.6模型实现视听同步生成功能。 【行业趋势】 Tinder报告显示76%用户使用AI优化约会形象,主要用于照片选择(28%)和简介润色(28%),同时"真诚沟通"需求上升。

文章图片
#人工智能#深度学习
【ZEGO即构开发者日报】ChatGPT “语音模式“全面整合至主聊天界面;Character AI为孩子上线互动“Stories“,而不是开放式聊天;腾讯混元3D创作引擎正式推出国际站......

摘要:AI领域近期动态频出,OpenAI将ChatGPT语音模式整合至主界面,实现多模态交互;CharacterAI推出结构化"Stories"功能替代聊天服务,专注青少年安全互动;腾讯混元3D引擎国际站上线,其3.0版本建模精度提升3倍。游戏行业方面,2025年国产出海休闲游戏爆发,8款产品年流水增幅超1亿元,合成类游戏和三消品类成为增长主力。

文章图片
#人工智能
【ZEGO即构开发者日报】ElevenLabs发布Scribe v2模型;RTC+AI融合,AI伴学方案破解在线课堂互动难题;寒武纪加入众智FlagOS生态;谷歌AI破译两世纪前“天书”账本.....

谷歌AI Studio神秘模型成功识别200多年前商人"天书"账本,字符错误率1.7%,词错误率6.5%,达到人类专家级准确度。谷歌近期更新平台政策,明确规定含约会、现金竞赛、真钱博彩等机制的社交互动类应用,必须通过技术手段实现功能级年龄屏蔽,禁止仅依赖用户协议。该系统由北京智源研究院牵头,通过统一软件层实现AI模型与异构硬件解耦,支持超过20种国内外主流AI芯片型号,旨在系统性解决跨架构场景下的

文章图片
#人工智能#语音识别#实时音视频
【ZEGO即构开发者日报】DeepSeek发布两个正式版模型;全球首个统一多模态视频模型可灵视频 O1 模型全量上线;Vidu Q2一致性生图正式上线......

DeepSeek官方12月1日同时发布两个正式版模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。DeepSeek-V3.2 的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用 Agent 任务场景。在公开的推理类 Benchmark 测试中,DeepSeek-V3.2 达到了 GPT-5 的水平,仅略低于 Gemini-3.0-Pro;相比 Kim

文章图片
【ZEGO即构开发者日报】即构科技上线云端实时语音识别 API:低延迟高精准;DeepSeek :UE8M0 FP8 参数精度适配下一代国产芯片;百度蒸汽机 2.0 大模型上线:行业首破多......

采用 “有效内容触发识别” 机制,仅在检测到真实有效语音内容时启动识别功能,大幅提升资源利用率,相较传统方案节省 50% 以上成本在功能细节上,方案设计贴合多场景需求:识别维度支持 “房间维度”,可对 RTC 房间内所有音视频流分别识别,输出结果包含 roomid(房间 ID)、userid(用户 ID)、streamid(流 ID)、userdata(用户数据)及 ASR 识别文本等完整信息,便

文章图片
#microsoft
【ZEGO即构开发者日报】Soul AI Lab开源播客语音合成模型;腾讯混元推出国内首个交互式AI播客;ChatGPT Go向用户免费开放一年......

【摘要】科技行业动态:即构科技发布ZIM 2.23.0版本,强化AI+IM功能与跨端兼容;SoulApp开源播客语音合成模型SoulX-Podcast,支持多语言方言克隆;腾讯混元推出国内首个交互式AI播客。OpenAI在印度推出ChatGPT Go免费服务。电商方面,罗马尼亚市场表现突出,电商规模达117亿欧元,增速超欧盟平均,消费者呈现价格敏感特征,数字化基础设施成熟。(149字)

文章图片
#语音识别#人工智能#实时音视频 +1
【ZEGO即构开发者日报】国产大模型MiniMax M2全球调用量进入前五;OceanBase发布首款AI数据库seekdb;夸克全面接入千问对话助手,将发布全新AI浏览器;PixVerse上线升级版

AI领域动态摘要 产品技术: MiniMaxM2国产大模型全球调用量第五,性能对标Claude,定价更低,支持多开发工具适配。 OceanBase开源AI数据库seekdb,支持百亿级数据检索,兼容主流AI框架,3行代码快速构建应用。 夸克接入千问对话助手,将推AI浏览器,与千问App战略协同。 PixVerse升级V5Fast视频生成速度提升30%,新增Modify精修功能,支持端到端编辑。

文章图片
#人工智能
【ZEGO即构开发者日报】MiroMind发布开源智能体基座模型MiroThinker v1.0;NotebookLM正式上线图像识别,知识检索变得超简单;蚂蚁集团推出全模态通用 AI 助手“灵光”

科技动态速览 MiroMind开源智能体MiroThinkerv1.0:支持256K上下文和600轮工具调用,中文任务表现优于DeepSeek-v3.2,72B版本接近OpenAI DeepResearch,全面开源推动智能体主动学习。 NotebookLM新增图像识别:谷歌升级OCR与语义解析功能,支持手写/印刷识别,教育用户48小时上传50万页图像,未来将集成AR实时拍摄。 蚂蚁发布AI助手“

文章图片
#人工智能
【ZEGO即构开发者日报】AI语音深度伪造钓鱼攻击成功率近100%;华为鸿蒙 HarmonyOS 4.X 系统“全新小艺”获 12.2.9.400 众测升级,新增文生图等功能;阿里首款自研AI眼镜上线

【每日科技快讯】ZEGO即构开发者日报聚焦AI、泛娱乐等领域最新动态: 1️⃣ AI安全:NCCGroup研究显示AI语音伪造实现实时化,钓鱼攻击成功率近100%,仅需0.5秒延迟即可模仿目标声音。 2️⃣ 智能助手:华为鸿蒙4.X小艺升级12.2.9.400版本,新增文生图、文案创作等大模型能力。 3️⃣ 硬件新品:阿里发布夸克AI眼镜,集成通义千问等应用,采用光波导技术,续航达24小时。 🔍

文章图片
#人工智能#业界资讯#实时音视频
    共 50 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择