logo
publist
写文章

简介

微信公众号:@蚝油菜花 如果你也关注大模型发展现状,或对大模型应用开发非常感兴趣,很期待你的关注,我会每日分享最新的热点资讯和开源模型实例。

擅长的技术栈

AI 应用开发人工智能深度学习PyTorch

可提供的服务

分享大模型与AI领域的最新应用和热点信息,提供开源实例和实用教程,帮助快速上手AI技术。

MobileLLM:Meta 开源适用于移动设备的语言模型,具备高质量的语言理解和生成能力

MobileLLM 是 Meta 推出的适合移动端使用的大语言模型,通过优化设计实现在少于十亿参数的情况下提供高质量的语言理解和生成能力。

文章图片
#人工智能#开源#语言模型 +1
POINTS 1.5:腾讯微信开源的多模态大模型,超越了业界其他的开源视觉语言模型,具备强大的视觉和语言处理能力

POINTS 1.5是腾讯微信推出的多模态大模型,基于LLaVA架构,具备强大的视觉和语言处理能力。它在复杂场景的OCR、推理能力、关键信息提取等方面表现出色,是全球10B以下开源模型中的佼佼者。

文章图片
#微信#语言模型#人工智能 +1
自动查文献+写代码+跑数据+出报告!港大开源 Auto Deep Research 搞定科研全流程

Auto-Deep-Research 是一款由香港大学开源的个人 AI 助理,基于模块化多 Agent 架构,专注于深度研究任务,兼容多种大语言模型,并提供一键启动和文件解析等强大功能。

文章图片
#开源#人工智能
今日 AI 简报|模拟学术评审、AI 头部融合、增强搜索视觉理解、辅助学术的多智能体系统、多视图 3D 拖拽编辑

本文介绍了五个前沿的 AI 开源项目,涉及学术同行评审、AI 换头技术、视觉搜索、多智能体写作助手以及多视图 3D 编辑等领域,展示了这些项目的关键技术和应用场景。

文章图片
#人工智能#3d#开源 +1
Anus:公开整活!完全用 Manus 复刻 Manus 功能的开源 AI 智能体项目

Anus 是一个开源 AI 智能体项目,复刻了 Manus 的部分功能,支持自然语言指令执行、多代理协作、多模态输入处理等功能,旨在为开发者提供强大且灵活的工具。

文章图片
#开源#人工智能
Hibiki:实时语音翻译模型打破语言交流障碍!支持将语音实时翻译成其他语言的语音或文本

Hibiki 是由 Kyutai Labs 开发的实时语音翻译模型,能够将一种语言的语音实时翻译成另一种语言的语音或文本,支持高保真度和低延迟。

文章图片
#人工智能#开源
GPT-4o mini TTS:OpenAI 推出轻量级文本转语音模型!情感操控+白菜价冲击配音圈

GPT-4o mini TTS 是 OpenAI 推出的轻量级文本转语音模型,支持多语言、多情感控制,适用于智能客服、教育学习、智能助手等多种场景。

文章图片
#开源#人工智能
三行代码实现实时语音转文本,支持自动断句和语音唤醒,用 RealtimeSTT 轻松创建高效语音 AI 助手

RealtimeSTT 是一款开源的实时语音转文本库,支持低延迟应用,具备语音活动检测、唤醒词激活等功能,适用于语音助手、实时字幕等场景。

文章图片
#人工智能
通义万相2.1:VBench榜单荣登第一!阿里通义万相最新视频生成模型,支持生成1080P长视频

万相2.1是阿里通义万相最新推出的视频生成模型,支持1080P无限长视频生成,具备复杂动作展现、物理规律还原、艺术风格转换等功能。

文章图片
#人工智能#开源
商业级免费OCR利器!Surya OCR:支持90+种语言识别,复杂布局识别,表格解析全覆盖!

Surya是一款强大的开源OCR工具包,支持90多种语言,能识别文本、分析阅读顺序、检测布局元素及解析表格。免费且跨平台,适合处理敏感信息。安装简单,提供多种功能命令。

文章图片
#深度学习
    共 153 条
  • 1
  • 2
  • 3
  • 16
  • 请选择