logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

能怼能哄能听懂!这届AI聊天搭子不简单!

用多种声线递上“情绪奶茶”,LLM+ASR+TTS三核驱动让AI从“莫得感情”秒变“小棉袄”;,织就一张“会呼吸”的对话网,你的赛博知己不仅能接梗抛梗,还能把温暖焊进每句语音里。当传统AI还在“一问一答”单机对话时,网易云信的实时对话式AI智能体已经开启。,毒舌闺蜜、霸总男友、治愈奶狗……AI聊天搭子背后的实时对话式AI智能体。,打断对话比闺蜜抢话还丝滑,弱网环境也能正常对话。,获取demo试用,

#人工智能
大模型“男友”很能“撩”?我用10分钟证实了!

platform=server 让数字人离开当前 RTC 房间,cid taskId 传之前加入房间时缓存的值。platform=server 让数字人加入到当前 RTC 房间,cname 传用户加入房间时候传的 cname。最近AI圈的大事可谓是一件接一件,前有国产黑马 DeepSeek,现在又有一夜刷屏的 Manus,科技圈的故事可谓是一浪接一浪!当然,Ta 还可以出现在多种互动场景中,比如

文章图片
#AI#开源软件#机器人 +1
AI世界的「通用连接器」?网易云信IM/RTC支持兼容MCP开源协议

将最新的数据或私有的数据通过向量数据库方式进行 topN 匹配,并作为上下文提交给大模型,缺点是需要在大模型的请求 pipeline 中额外增加请求向量数据库的工作,有一定的业务侵入性。最后,欢迎您试用云信 MCP,若您对当前 Yunxin-MCP-tool 提供的能力有任何建议,比如对已有工具能力增强的需求、更多其他的工具需求等,都可以留言告诉我们。云信的能力可以通过 MCP 协议暴露,开发者无

#人工智能#实时音视频
关于智能体(AI Agent),不得不看的一篇总结

智能体(Agent)是一种能够感知环境、制定决策并采取行动以实现特定目标的AI系统,一般具有记忆、规划、采取行为、使用工具等基本能力,如下图所示,其中规划中有思维链、能进行反思、目标分解。OS Agent(操作系统智能体)是一类特殊的智能体,它们通过操作计算设备(如计算机和移动手机)的图形用户界面(GUI)来完成各种任务。其中,基于视觉的智能体(如SpiritSight)和视觉-语言混合智能体(如

文章图片
#人工智能#语音识别
网易云信10周年:AI点亮通信的智慧与温度

网易云信的嵌入式智能体为 AI 智能硬件提供了强大的技术内核,将成熟的融合通信能力与 AI 技术深度耦合,精准解决识别、互动、话题扩展、内容安全、定制音色、功耗、芯片适配等多种问题,支持通过摄像头识别用户皱眉、低头等微表情,结合麦克风捕捉的语音语调,双重判断情绪状态。随着 AI 技术蓬勃发展,其更强的知识储存和记忆能力、理解能力、创造能力,以及所展现出的更自然和拟人化的交互特点,都为传统云通信注入

#人工智能
技术干货 | 面向 AIGC 的内容风控新技术

以上案例主要可在视觉任务中取得应用,类似地,在语音任务中,为了获取语音分类的半监督数据,我们采用对比学习的方式,将音频特征空间和视觉特征空间对齐,从而间接的对齐音频和文本特征空间,这样可以实现通过文本搜索音频的方式来扩充训练数据。以未成年人保护项目中的年龄识别任务为例,现有年龄识别模型使用的训练数据集包含的类型、场景、风格有限,而且具有明显的长尾分布,中间年龄数据多,两端年龄数据少,严重制约了年龄

文章图片
#人工智能#业界资讯#开源
萌趣AI娃娃来袭,懂你的伙伴超神奇!

用语音进行导航,提醒视障人士注意车辆与红绿灯,在生活中,它还能帮助视障人士辨别颜色、识文断字,让生活更便利。除此之外,嵌入式对话语音 AI 智能体还能够为视障人士提供方便,嵌入智能体的AI眼镜,能够成为。的知心搭子,温和耐心地给予反馈,为你的开心而快乐,因你的忧愁而担忧,为你提供。,在突发跌倒、疾病等健康危机时,自动联系预设紧急联系人,争取救援时间。,随着孩子的长大,它也会自行拓展知识库,输出符合

#人工智能
QCon大会 | 融合大模型的对话式语音AI变革与技术架构

到了20世纪90年代,IVR(交互式语音应答)系统开始广泛应用,用户通过电话按键进行菜单选择,这种模式至今仍存在于客服系统中,例如我们熟知的"按1转人工"。然而,在AI对话场景下,背景人声、环境杂音、键盘敲击声、脚步声等各类噪音,会直接干扰AI语音识别的准确性。未来,个人语音助手或许会像《钢铁侠》中的贾维斯一样,不仅能精准理解指令,还能感知情绪、主动协助,真正成为用户的。2014年,亚马逊推出Ec

#人工智能#架构
糟糕,我的 AI 玩具又犯“失忆症”了!

例如,用户在一个会话中,明确提到自己在健身,希望能够减重增肌,但在后续会话中,缺乏持久记忆的AI系统,为了迎合用户,可能会推荐烧烤、炸鸡的饮食方式,完全违背用户自己建立的偏好。在具体应用上,三种记忆方式的使用需要根据用户的输入信息,综合考虑最近、相关、重要的记忆,通过上下文传递给大模型( LLMs),协助 AI 给出更好的响应内容。综合来看,网易云信基于开源系统和记忆产品的设计目标,通过自研的情感

#人工智能
    共 358 条
  • 1
  • 2
  • 3
  • 36
  • 请选择