logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【ZEGO即构开发者日报】即构科技上线云端实时语音识别 API:低延迟高精准;DeepSeek :UE8M0 FP8 参数精度适配下一代国产芯片;百度蒸汽机 2.0 大模型上线:行业首破多......

采用 “有效内容触发识别” 机制,仅在检测到真实有效语音内容时启动识别功能,大幅提升资源利用率,相较传统方案节省 50% 以上成本在功能细节上,方案设计贴合多场景需求:识别维度支持 “房间维度”,可对 RTC 房间内所有音视频流分别识别,输出结果包含 roomid(房间 ID)、userid(用户 ID)、streamid(流 ID)、userdata(用户数据)及 ASR 识别文本等完整信息,便

文章图片
#microsoft
【ZEGO即构开发者日报】Vidu Q1全球上线「参考生图」功能;阿里发布最新语音识别模型Qwen3-ASR-Flash;上半年日本最赚钱的AI产品Top10,近一半来自中国?

即构科技通过RTC和AI技术提升泛娱乐应用体验,如AI陪玩、AI观众等,增强用户互动与留存。 ViduQ1「参考生图」功能支持多图融合生成,还原度高、一致性优,超越FluxKontext等竞品,适用于创意生产场景。 阿里语音模型Qwen3-ASR-Flash支持11种语言及方言,识别准确率领先GPT-4o等,提供定制化语音转文字服务。 日本AI市场用户付费能力强,中国出海产品如Plaud表现亮眼,

文章图片
#人工智能#语音识别#AI作画 +1
【ZEGO即构开发者日报】华为开源openPangu-R-7B-Diffusion扩散语言模型;商汤科技发布并开源原生多模态模型架构NEO;Mistral AI 推出 Mistral 3 系列模型..

中国AI与游戏产业双线突破:华为开源7B扩散语言模型创数学推理新纪录;商汤发布原生多模态架构NEO,实现视觉语言深层融合;MistralAI推出675B参数开源模型。同时,SensorTower数据显示中国手游厂商在海外表现亮眼,超30家进入收入TOP100,点点互动、库洛等厂商在SLG、二次元等细分领域取得突破。

文章图片
#语言模型#人工智能#自然语言处理
【ZEGO即构开发者日报】Vidu Q2参考生功能全球上线,视频延长至5分钟;元宝AI推出录音实时转写与“内心OS”解读;DeepSeek推出新模型DeepSeek-OCR......

产品技术前沿:Vidu Q2推出参考生功能与5分钟视频延长,升级AI社交平台;元宝AI新增“内心OS”解读,实现智能录音转写与语义分析;DeepSeek-OCR以3B参数量实现文本“光学压缩”,10倍压缩率达97%准确率;甲骨文发布全球最大AI超算Zettascale10,80万GPU构建16 ZettaFLOPS算力行业动态观察:欧盟启动DSA首轮执法,Snapchat、苹果、谷歌面临未成年人保

文章图片
#人工智能#实时音视频#业界资讯 +1
【ZEGO即构开发者日报】国产大模型MiniMax M2全球调用量进入前五;OceanBase发布首款AI数据库seekdb;夸克全面接入千问对话助手,将发布全新AI浏览器;PixVerse上线升级版

AI领域动态摘要 产品技术: MiniMaxM2国产大模型全球调用量第五,性能对标Claude,定价更低,支持多开发工具适配。 OceanBase开源AI数据库seekdb,支持百亿级数据检索,兼容主流AI框架,3行代码快速构建应用。 夸克接入千问对话助手,将推AI浏览器,与千问App战略协同。 PixVerse升级V5Fast视频生成速度提升30%,新增Modify精修功能,支持端到端编辑。

文章图片
#人工智能
告别多端兼容噩梦!如何用uni-app 集成直播SDK玩转电商!

uni-app 以其“一次开发,多端部署”的强大能力,成为电商直播开发者的首选。本文将聚焦 uni-app 开发者,深入探讨如何在 uni-app 项目中高效集成 ZEGO(即构科技)直播 SDK,实现高性能、低延迟、强互动的多端电商直播功能,覆盖 APP、小程序和 Web 端,快速完成电商直播开发。

文章图片
#uni-app#音视频#微信小程序 +1
如何在全球200+国家和地区实现低延迟、高可用的实时互动?即构「RTC全球化架构」技术解析

即构科技十年深耕实时音视频技术,构建全球化RTC架构,日通话量超30亿分钟。其核心技术包括:1)连麦集群互通实现媒体中心全网多活;2)信令房间2.0多活架构优化协同;3)边缘统一接入层高可用容灾体系;4)边缘二次调度提升性能。该架构突破传统局限,实现多云深度融合,使首帧时间优化41.6%,中心压力降低45%,支持全球200+国家地区业务接入,为4000家企业提供低延迟、高可用的实时互动解决方案。

文章图片
#实时互动#实时音视频
简单4步,快速搭建数字人实时视频通话功能

【摘要】即构实时互动AIAGENT提供4步快速搭建数字人视频通话系统:1)注册账号获取AppID;2)开通数字人PaaS等核心服务;3)后台配置智能体实例,支持1080P高清、低延迟互动;4)客户端集成SDK实现实时交互。该方案支持多语种口型同步,适用于客服、直播等场景,开发者可通过测试账号快速验证功能,注意需正确处理LLM/TTS等复杂参数配置。

文章图片
#音视频#人工智能#实时音视频
如何基于ZEGO直播 SDK 实现 Web 端云直播(含代码演示)

【摘要】本文介绍了如何快速集成即构超低延迟直播SDK到Web端。即构直播方案具有超低延迟、强同步性、弱网抗性等优势。集成步骤包括:1)准备兼容性浏览器环境;2)获取控制台AppID和Server地址;3)通过npm/yarn自动集成或手动下载SDK;4)按需引入功能模块。文中详细说明了项目初始化、SDK集成方式(完整/模块化)以及示例代码结构,帮助开发者快速实现Web端云直播功能。集成过程遇到问题

文章图片
#前端#实时音视频#webrtc
【实操】如何在社交语音游戏中集成AI队友——以鹅鸭杀为例

本文介绍了如何为鹅鸭杀、狼人杀等社交推理游戏快速集成AI队友功能。通过叠加式架构设计,AI Agent层无需改动原游戏核心逻辑,即可实现智能体角色配置、发言逻辑、听与理解、投票与行动等功能。文章详细阐述了技术方案、开发流程与实战代码,包括AI初始化注册、创建实例、发言调用链等核心环节。

文章图片
#unity#人工智能#游戏引擎 +2
    共 100 条
  • 1
  • 2
  • 3
  • 10
  • 请选择