logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【AI大模型前沿】Mini-o3:字节跳动联合港大推出的开源视觉推理模型

Mini-o3是一个开源的视觉推理模型,专为解决复杂的视觉搜索问题而设计。它通过强化学习和基于图像的工具,能够执行深度多轮推理,推理轮次可扩展至数十轮。该模型在多个视觉搜索基准测试中取得了最先进的结果,并且所有代码、模型和数据集均开源,便于研究人员复现和进一步研究。

文章图片
#人工智能#开源#AIGC +1
【AI大模型前沿】Mini-o3:字节跳动联合港大推出的开源视觉推理模型

Mini-o3是一个开源的视觉推理模型,专为解决复杂的视觉搜索问题而设计。它通过强化学习和基于图像的工具,能够执行深度多轮推理,推理轮次可扩展至数十轮。该模型在多个视觉搜索基准测试中取得了最先进的结果,并且所有代码、模型和数据集均开源,便于研究人员复现和进一步研究。

文章图片
#人工智能#开源#AIGC +1
AI新纪元:OpenAI GPT-4o模型发布,开启智能交互革命!

2024年5月13日,OpenAI向全球发布了其ChatGPT旗舰版本的升级模型——GPT-4o(Generative Pre-trained Transformer 4 Omni)。这个多语言、多模态的GPT大型语言模型被誉为比前代GPT-4快两倍,而价格却只有其一半。在OpenAI的直播演示中,米拉·穆拉蒂宣布,该模型将对所有用户免费开放。发布会上,OpenAI详细介绍了GPT-4o在移动端与

文章图片
#人工智能#AIGC#语言模型
探索AIGC的无限可能:引领人工智能生成内容的未来

在数字化浪潮的推动下,人工智能技术正以前所未有的速度重塑我们的生活和工作方式。AIGC(人工智能生成内容)作为人工智能领域的一颗璀璨新星,正在以其独特的魅力吸引着全球的关注。AIGC涉及利用人工智能算法自动或半自动地生成具有创意的内容,包括文字、图像、音频甚至视频。从专业角度来看,AIGC结合了机器学习、大数据分析、自然语言处理等技术,通过模仿人类的创作过程,实现对内容的自动生成和编辑。

文章图片
#AIGC#人工智能#程序人生
【AI大模型前沿】腾讯ARC开源AudioStory:大语言模型驱动的长篇叙事音频生成技术

AudioStory是由腾讯ARC实验室开发的一款基于大语言模型(LLM)的长篇叙事音频生成模型,旨在通过自然语言描述生成高质量、连贯的长篇音频内容。它将大语言模型与文本到音频系统相结合,采用“解耦桥接机制”和三阶段渐进训练策略,有效解决了长音频生成中的时序一致性与语义连贯性问题。通过AudioStory,用户只需输入简单的自然语言描述,系统即可自动生成长达150秒的连贯叙事音频。

文章图片
#人工智能#开源#语言模型 +1
【AI大模型前沿】腾讯ARC开源AudioStory:大语言模型驱动的长篇叙事音频生成技术

AudioStory是由腾讯ARC实验室开发的一款基于大语言模型(LLM)的长篇叙事音频生成模型,旨在通过自然语言描述生成高质量、连贯的长篇音频内容。它将大语言模型与文本到音频系统相结合,采用“解耦桥接机制”和三阶段渐进训练策略,有效解决了长音频生成中的时序一致性与语义连贯性问题。通过AudioStory,用户只需输入简单的自然语言描述,系统即可自动生成长达150秒的连贯叙事音频。

文章图片
#人工智能#开源#语言模型 +1
【GitHub开源AI精选】OpenLens AI:清华推出的医学研究全自主AI助手,开启科研新纪元

OpenLens AI是一个专为医学研究设计的高度自主人工智能研究助手,由清华大学自动化系开发。它通过多智能体协作,能够从文献综述、实验设计、数据分析到论文生成的全流程自动化,将科研周期从“月级”缩短至“小时级”,极大地提升了医学研究效率。该系统不仅支持处理健康信息学领域复杂的、多模态的数据,还提供了用户友好的网页版交互界面,用户只需上传数据集和简单的研究想法,即可启动研究项目。

文章图片
#开源#人工智能#AIGC +1
【GitHub开源AI精选】OpenLens AI:清华推出的医学研究全自主AI助手,开启科研新纪元

OpenLens AI是一个专为医学研究设计的高度自主人工智能研究助手,由清华大学自动化系开发。它通过多智能体协作,能够从文献综述、实验设计、数据分析到论文生成的全流程自动化,将科研周期从“月级”缩短至“小时级”,极大地提升了医学研究效率。该系统不仅支持处理健康信息学领域复杂的、多模态的数据,还提供了用户友好的网页版交互界面,用户只需上传数据集和简单的研究想法,即可启动研究项目。

文章图片
#开源#人工智能#AIGC +1
【GitHub开源AI精选】OpenLens AI:清华推出的医学研究全自主AI助手,开启科研新纪元

OpenLens AI是一个专为医学研究设计的高度自主人工智能研究助手,由清华大学自动化系开发。它通过多智能体协作,能够从文献综述、实验设计、数据分析到论文生成的全流程自动化,将科研周期从“月级”缩短至“小时级”,极大地提升了医学研究效率。该系统不仅支持处理健康信息学领域复杂的、多模态的数据,还提供了用户友好的网页版交互界面,用户只需上传数据集和简单的研究想法,即可启动研究项目。

文章图片
#开源#人工智能#AIGC +1
【GitHub开源AI精选】FireRedChat:小红书开源的全双工语音交互系统,开启智能语音新时代

FireRedChat是由小红书智创音频团队开发的一款全双工语音交互系统,它提供了一个可完全自主部署的解决方案,用于构建实时语音AI代理。该系统不仅支持用户和AI代理同时说话,实现无缝的实时双向对话,还具备可控打断机制,显著提升了人机语音交互的自然度和流畅性。FireRedChat的出现,为智能语音助手的发展开辟了新的道路,其开源的特性也吸引了众多开发者的关注。

文章图片
#开源#人工智能#AIGC +1
    共 59 条
  • 1
  • 2
  • 3
  • 6
  • 请选择