logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

MiniMax模型能力与付费方式选择

MiniMax AI模型功能与付费方式全解析 MiniMax提供六大AI能力:文本生成(通用/对话模型)、语音合成(Turbo/HD系列)、视频生成(文生/图生视频)、图像生成(文生/图生图)、音乐创作及MCP协议工具集成。付费方式灵活多样:开发者可选Coding Plan套餐(标准/极速版),语音/视频/音乐/图像资源包,或按量计费(按token/字符/条/张收费)。用量稳定推荐套餐,测试或低频

文章图片
#人工智能
谷歌Gemini语音模型12月份更新版与当前的应用

谷歌推出Gemini 2.5 Flash Native Audio实时语音智能体更新版,优化了函数调用、指令遵循和对话流畅度三大功能。该技术已集成至Gemini Live API,支持企业构建智能语音助手。应用场景包括Shopify的AI客服Sidekick、SightCall的AR远程协助、UWM的贷款助手Mia等。新版本能处理复杂视觉数据,理解用户意图和情感,实现跨场景自然对话,如Napste

文章图片
#语音识别#人工智能#语言模型
三步构建AI评估体系:从解决“幻觉”到实现高效监控

AI评估正成为解决大模型应用幻觉问题的关键方法。文章系统介绍了AI评估的三个核心步骤:1)通过错误分析定性研究交互日志;2)归类量化问题形成优先级;3)构建AI评估器实现自动化监控。评估不同于简单测试,而是针对开放领域问题的系统性解决方案。虽然存在争议,但所有成功的AI产品都在进行严格评估。评估不是目的而是手段,其核心价值在于将产品迭代从感觉驱动转向数据驱动,同时人类专业判断仍是不可替代的关键环节

文章图片
#人工智能#语言模型#产品经理 +1
谷歌2025年度最热门AI应用(三):旅行游玩

谷歌推出多项AI功能优化旅行体验:1)Flight Deals通过对话式搜索智能匹配廉价机票,根据用户模糊需求推荐意外目的地;2)Canvas功能将零散旅行建议自动整理为可视化攻略清单;3)地图新增图片识别功能,通过截图自动定位景点并分类保存;4)"即圈即搜"实现无需切换应用的即时信息获取。这些创新将传统填表式搜索升级为自然交互的闭环旅行服务,通过AI处理海量数据,帮助用户实现

文章图片
#人工智能
谷歌2025年度最热门AI应用(二):个人AI知识库NotebookLM

NotebookLM是谷歌开发的AI研究工具,专注于用户上传的文档内容,避免信息幻觉。核心功能包括:1)将论文/报告转为播客;2)提供带引用的回答;3)智能整理笔记和创作内容;4)支持快速查询和深度研究两种模式;5)多模态处理,将照片等素材转为结构化文档;6)生成带旁白的视频摘要。其三大特点是信息可靠性(严格基于用户资料)、理解多样化(支持多种输出形式)和知识结构化(自动整理零散内容)。适用于学术

文章图片
#人工智能
谷歌Gemini语音模型12月份更新版与当前的应用

谷歌推出Gemini 2.5 Flash Native Audio实时语音智能体更新版,优化了函数调用、指令遵循和对话流畅度三大功能。该技术已集成至Gemini Live API,支持企业构建智能语音助手。应用场景包括Shopify的AI客服Sidekick、SightCall的AR远程协助、UWM的贷款助手Mia等。新版本能处理复杂视觉数据,理解用户意图和情感,实现跨场景自然对话,如Napste

文章图片
#语音识别#人工智能#语言模型
到底了