近两年来,国内外大模型发展如火如荼,今天你“首次”“重磅”“史诗级”发布,明天我就“突然”“超越”“干翻”你,比拼参数,展示“成果”,成为家常便饭。当然,这些大模型多以互联网数据训练推理,可谓是“信息世界智能”的重大突破。

而众所周知,作为人工智能发展的终极目标,通用人工智能需要融合地球上的一切事物,除了要实现“信息世界智能”,还要实现“物理世界智能”。人工智能大牛李飞飞曾言,具身智能不单指人形机器人,任何能在空间中移动的有形智能机器都是人工智能的一种形式。因此,“物理世界智能”的终极目标是“具身智能”。

“信息世界智能”成绩卓然,一日千里;“物理世界智能”则鲜有报道,低调内敛,直到在6月21日举行的HDC 2024华为开发者大会上,华为云CEO张平安发布了盘古具身智能大模型,并现场展示了搭载盘古能力的人形机器人“夸父”,引起了公众的广泛讨论。

一周之后的6月27日,在海康威视总部举办的2024 ECDC萤石云开发者大会上,智能家居安全头部玩家萤石发布了其具身智能大模型“蓝海”,为具身智能发展再添一把火。

萤石“蓝海”:具身智能的蓝海

2015年开始公司化运营的萤石,基于智能硬件、云服务、AI和机器人等技术,构建了“1+4+N”智能家居生态,以安全为核心,以萤石云为中心,搭载包括智能家居摄像机、智能入户、智能控制、智能服务机器人在内的四大自研硬件,开放接入环境控制、智能影音等子系统生态,实现家居及类家居场景的全屋智能化,同时利用互联互通的萤石云开放平台,与合作伙伴分享智能视频的云平台服务能力,共同打造物联网云生态。萤石的发展可谓迅猛,成立不到十年就于2022年登陆上交所科创板,而截至2023年底,萤石云平台就已拥有超过31万名开发者客户,场景涵盖零售连锁、畜牧养殖、教育教学等音视频应用普及的千行百业。

作为智能家居、物联网、音视频领域的佼佼者,萤石以用户最终需求为始,以云服务为依托,借助大模型的跨越式发展春风,针对互联网大模型天生缺少与设备的交互、不具备具身记忆、端云协同能力存在明显短板等问题,聚焦于空间级的具身智能,自主研发了面向物联网场景的“蓝海”大模型。

据萤石智能算法总经理程战战介绍,萤石蓝海大模型具备开发开放、基础交互、具身代理三大体系化AI能力,覆盖从设备感知到设备执行全链路,接入的设备多种多样,能够感知世界空间信息,处理多模态数据,进行精确识别与理解,最终规划指导设备做出响应。

萤石积累的海量AI能力,除了应用在自身智能家居行业,也将进一步开放给行业开发者。

1. 萤石提供了29大类、93子类的原子算法能力,这些算法是AI开发者的基础能力,覆盖从基础的数据治理工具到模型部署等AI工具,可以被直接调用与使用。

2. 萤石提供的端云协同算法能力,包含了73种基础感知算法,覆盖文本、音频、图像、视频,如人脸识别、人形检测、OCR等,可以被直接调用与使用,供开发者做出对应的AI解决方案。

3. 萤石还提供了26种交互或生成式类算法能力,覆盖语言交互、图像生成、多模态交互,及多种具身代理服务。

了解萤石的朋友都知道,萤石采用“双主业模式”,即智能家居+物联网云平台。与之相应的,萤石的开发者策略,是将在智能家居市场积累的经过验证的成熟的自研技术,进行产品化,提供给云平台开发者使用,以开拓出更丰富的应用场景和市场机会。

此次推出的“蓝海”具身智能大模型,意味着在萤石看来,时机已来,恰到好处。

HomePlay OS+开放平台,助开发者遨游“蓝海”

诚然,大模型好处多多,既带来了准确率的大幅提升,又可以处理更复杂的任务,可谓催动人工智能突破发展的良方。但与此同时,大模型也给开发者带来了AI应用开发更复杂、大模型运行成本高等问题。

为此,萤石提出了以AI为核心的新一代架构——萤石HomePlay OS,一个围绕人、家、商业,以提升用户的生活及工作体验为目的,通过提供智能代理及以视觉为主的AI能力,让开发者可以快速、灵活、低成本的方式开发自身智能场景或应用的平台。简言之,HomePlay OS是将AI、“蓝海”等封装起来的总控。

萤石云系统架构负责人明旭在大会上表示,萤石HomePlay OS具备AI核心、代理封装、端云协同、隐私保护、全面开放等五大特性。展开来说,基于HomePlay OS不仅可以有效实现以AI为核心的感知、计算和执行,还能将大模型与服务、工具紧密融合实现代理封装,解决开发者大模型应用门槛的问题。另外,HomePlay OS基于有效的端云协同,可灵活分配端和云的算力实现成本最优化,保持计算资源、模型、模型组合、代理等多层的全栈开放性。

说了这么多,不管是“蓝海”还是“HomePlay OS”,更多展示的是萤石的底气与能力,而开发者调用这些能力则是通过萤石开放平台的玲琅满目的组件和工具。

据萤石开放平台产品负责人邵佩介绍,萤石开放平台不仅为设备制造商提供南向的云接入能力,还为行业开发者提供基于云的音视频和AI能力,以辅助开发者打造个性化的行业解决方案。截至目前,萤石开放平台已累计发布了超过1000个开放接口,涵盖接入、直播、通话、存储、AI、信令和用户连接7个类别,31组原子能力,以及20多款aPaaS低代码组件,为海量开发者提供了有力的技术支撑。作为一个可进化的开放平台,萤石此次针对自助消费场景所需要的远程巡检能力、及时响应连线能力、低成本运维能力,结合“蓝海”大模型,推出了智能视觉巡检组件、智能视频客服组件、远程排障专家工具,帮助开发者第一时间享受最新、最热的音视频开发服务。

具备更高准确率、更复杂事务处理能力的“蓝海”具身大模型,让开发者更加高效、更低成本开发AI应用的HomePlay OS架构,更加开放化、智能化、场景化的萤石开放平台,为开发者呈现了萤石所理解的具身智能的正确打开方式,让我们隐约看到了具身智能“开发者时刻”的来临。具身智能应用百花齐放的时刻指日可待。

Logo

加入「COC·上海城市开发者社区」,成就更好的自己!

更多推荐