logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【ZEGO即构开发者日报】Soul AI Lab开源播客语音合成模型;腾讯混元推出国内首个交互式AI播客;ChatGPT Go向用户免费开放一年......

【摘要】科技行业动态:即构科技发布ZIM 2.23.0版本,强化AI+IM功能与跨端兼容;SoulApp开源播客语音合成模型SoulX-Podcast,支持多语言方言克隆;腾讯混元推出国内首个交互式AI播客。OpenAI在印度推出ChatGPT Go免费服务。电商方面,罗马尼亚市场表现突出,电商规模达117亿欧元,增速超欧盟平均,消费者呈现价格敏感特征,数字化基础设施成熟。(149字)

文章图片
#语音识别#人工智能#实时音视频 +1
【ZEGO即构开发者日报】即构科技上线云端实时语音识别 API:低延迟高精准;DeepSeek :UE8M0 FP8 参数精度适配下一代国产芯片;百度蒸汽机 2.0 大模型上线:行业首破多......

采用 “有效内容触发识别” 机制,仅在检测到真实有效语音内容时启动识别功能,大幅提升资源利用率,相较传统方案节省 50% 以上成本在功能细节上,方案设计贴合多场景需求:识别维度支持 “房间维度”,可对 RTC 房间内所有音视频流分别识别,输出结果包含 roomid(房间 ID)、userid(用户 ID)、streamid(流 ID)、userdata(用户数据)及 ASR 识别文本等完整信息,便

文章图片
#microsoft
【ZEGO即构开发者日报】 OpenAI同日推出GPT-5.1 Pro和GPT-5.1-Codex-Max两大模型;华为Flex AI容器发布:算力利用率提升30%;腾讯混元视频大模型开源......

OpenAI同日发布GPT-5.1Pro(情商智商双强)和GPT-5.1-Codex-Max(首个原生支持压缩机制的编码模型),后者在SWE-bench测试达77.9%高分。华为推出FlexAI容器技术,算力利用率提升30%,支持多品牌算力卡。腾讯开源8.3B参数视频生成模型HunyuanVideo1.5,可生成5-10秒高清视频。德国拟要求操作系统厂商内置青少年保护模式,限制不当内容访问。海外A

文章图片
#人工智能#业界资讯#语音识别 +1
【ZEGO即构开发者日报】 OpenAI同日推出GPT-5.1 Pro和GPT-5.1-Codex-Max两大模型;华为Flex AI容器发布:算力利用率提升30%;腾讯混元视频大模型开源......

OpenAI同日发布GPT-5.1Pro(情商智商双强)和GPT-5.1-Codex-Max(首个原生支持压缩机制的编码模型),后者在SWE-bench测试达77.9%高分。华为推出FlexAI容器技术,算力利用率提升30%,支持多品牌算力卡。腾讯开源8.3B参数视频生成模型HunyuanVideo1.5,可生成5-10秒高清视频。德国拟要求操作系统厂商内置青少年保护模式,限制不当内容访问。海外A

文章图片
#人工智能#业界资讯#语音识别 +1
【ZEGO即构开发者日报】蚂蚁集团开源 Awex 框架,秒级完成 TB 级参数交换;微软推出具备记忆用户偏好和工作流程的智能层Work IQ;谷歌正式发布Gemini 3 Pro......

科技巨头持续发力AI领域创新:蚂蚁集团开源Awex框架实现TB级参数秒级交换;微软推出WorkIQ智能层强化Copilot记忆功能,并发布Agent365平台;谷歌Gemini3Pro以优异性能登顶AI排行榜。行业方面,全球游戏市场2025年规模预计达1890亿美元;日本将打破iOS封闭生态,全面开放第三方应用安装。

文章图片
#人工智能#语音识别#实时音视频 +2
【ZEGO即构开发者日报】蚂蚁集团开源 Awex 框架,秒级完成 TB 级参数交换;微软推出具备记忆用户偏好和工作流程的智能层Work IQ;谷歌正式发布Gemini 3 Pro......

科技巨头持续发力AI领域创新:蚂蚁集团开源Awex框架实现TB级参数秒级交换;微软推出WorkIQ智能层强化Copilot记忆功能,并发布Agent365平台;谷歌Gemini3Pro以优异性能登顶AI排行榜。行业方面,全球游戏市场2025年规模预计达1890亿美元;日本将打破iOS封闭生态,全面开放第三方应用安装。

文章图片
#人工智能#语音识别#实时音视频 +2
【ZEGO即构开发者日报】蚂蚁集团开源 Awex 框架,秒级完成 TB 级参数交换;微软推出具备记忆用户偏好和工作流程的智能层Work IQ;谷歌正式发布Gemini 3 Pro......

科技巨头持续发力AI领域创新:蚂蚁集团开源Awex框架实现TB级参数秒级交换;微软推出WorkIQ智能层强化Copilot记忆功能,并发布Agent365平台;谷歌Gemini3Pro以优异性能登顶AI排行榜。行业方面,全球游戏市场2025年规模预计达1890亿美元;日本将打破iOS封闭生态,全面开放第三方应用安装。

文章图片
#人工智能#语音识别#实时音视频 +2
【ZEGO即构开发者日报】月之暗面正式发布了Kimi-k2 thinking模型;谷歌Gemini 3 Pro预览版或于11月发布;GTC2025全球流量大会在上海世博展览馆顺利举行......

AI技术推动行业变革:月之暗面发布Kimi-k2thinking推理模型,编程能力突出;谷歌将推百万Tokens的Gemini3Pro。即构科技获出海服务商奖项,提供音视频及AI互动方案。海外短剧市场中国份额下降至67%,但收入占比仍超90%。AI漫剧爆发增长,月播量增92%,制作成本降至千元/分钟,市场规模或达200亿。(149字)

文章图片
#人工智能#大数据#实时音视频 +2
【ZEGO即构开发者日报】Anthropic Agent开发新范式,降低Token消耗;对话式 AI 如何打造个性化学习体验;Soul 宣布推出 SoulX-Podcast 开源语音生成模型.....

【摘要】AI技术领域取得多项突破:Anthropic推出"代码执行"新范式,使Token消耗降低98.7%;对话式AI正重塑教育行业,实现个性化学习体验;Open-SoraPlan发布UniWorld-V2图像编辑模型,在权威测试中超越GPT-Image-1;Soul开源语音生成模型SoulX-Podcast登顶HuggingFace榜单。行业方面,美国91%互联网家庭订阅流媒

文章图片
#音视频#面试#语音识别 +3
【ZEGO即构开发者日报】Anthropic Agent开发新范式,降低Token消耗;对话式 AI 如何打造个性化学习体验;Soul 宣布推出 SoulX-Podcast 开源语音生成模型.....

【摘要】AI技术领域取得多项突破:Anthropic推出"代码执行"新范式,使Token消耗降低98.7%;对话式AI正重塑教育行业,实现个性化学习体验;Open-SoraPlan发布UniWorld-V2图像编辑模型,在权威测试中超越GPT-Image-1;Soul开源语音生成模型SoulX-Podcast登顶HuggingFace榜单。行业方面,美国91%互联网家庭订阅流媒

文章图片
#音视频#面试#语音识别 +3
    共 28 条
  • 1
  • 2
  • 3
  • 请选择