logo
publist
写文章

简介

微信公众号:@蚝油菜花 如果你也关注大模型发展现状,或对大模型应用开发非常感兴趣,很期待你的关注,我会每日分享最新的热点资讯和开源模型实例。

擅长的技术栈

AI 应用开发人工智能深度学习PyTorch

可提供的服务

分享大模型与AI领域的最新应用和热点信息,提供开源实例和实用教程,帮助快速上手AI技术。

三行代码实现实时语音转文本,支持自动断句和语音唤醒,用 RealtimeSTT 轻松创建高效语音 AI 助手

RealtimeSTT 是一款开源的实时语音转文本库,支持低延迟应用,具备语音活动检测、唤醒词激活等功能,适用于语音助手、实时字幕等场景。

文章图片
#人工智能
POINTS 1.5:腾讯微信开源的多模态大模型,超越了业界其他的开源视觉语言模型,具备强大的视觉和语言处理能力

POINTS 1.5是腾讯微信推出的多模态大模型,基于LLaVA架构,具备强大的视觉和语言处理能力。它在复杂场景的OCR、推理能力、关键信息提取等方面表现出色,是全球10B以下开源模型中的佼佼者。

文章图片
#微信#语言模型#人工智能 +1
Open-LLM-VTuber:宅男福音!开源AI老婆离线版上线,实时语音+Live2D互动还会脸红心跳

Open-LLM-VTuber 是一个开源的跨平台语音交互 AI 伴侣项目,支持实时语音对话、视觉感知和生动的 Live2D 动态形象,完全离线运行,保护用户隐私。

文章图片
#开源#人工智能
Moonshine – 颠覆性实时语音识别,低延时高准确,完胜 Whisper!

Moonshine 是一款专为资源受限设备优化的语音识别模型,提供快速且准确的实时语音转文本服务,适用于现场转录和语音命令识别,展现出比同类 Whisper 模型更低的词错误率。

文章图片
#语音识别#人工智能
FunASR:阿里巴巴开源的语音识别工具包,提供预训练模型与详细教程,一键部署多场景应用.

FunASR是由阿里巴巴开源的语音识别工具包,支持语音识别、语音活动检测、标点恢复等功能。提供预训练模型和易用接口,可快速部署。本文介绍其功能、技术原理及安装教程,附运行示例。

文章图片
#开源#语音识别#人工智能
子曰-o1:网易有道开源国内首个分步式讲解推理模型,支持K12数学教学

子曰-o1是网易有道推出的国内首个分步式讲解推理模型,采用14B轻量级架构,专为消费级显卡设计,支持K12数学教学,提供精准的解题思路和答案。

文章图片
#人工智能#开源
Probly:开源 AI Excel表格工具,交互式生成数据分析结果与可视化图表

Probly 是一款结合电子表格功能与 Python 数据分析能力的 AI 工具,支持在浏览器中运行 Python 代码,提供交互式电子表格、数据可视化和智能分析建议,适合需要强大数据分析功能又希望操作简便的用户。

文章图片
#人工智能#数据分析
AutoTrain:Hugging Face 开源的无代码模型训练平台

AutoTrain 是 Hugging Face 推出的开源无代码模型训练平台,旨在简化最先进模型的训练过程。用户无需编写代码,只需上传数据即可创建、微调和部署自己的 AI 模型。AutoTrain 支持多种机器学习任务,并提供自动化最佳实践,包括超参数调整、模型验证和分布式训练。

文章图片
#人工智能#开源
TaskWeaver:微软推出代码优先的 AI 代理框架,专注于数据分析!

TaskWeaver 是微软推出的代码优先 AI 代理框架,专注于数据分析任务规划和执行,通过代码片段解释用户请求,协调插件执行,支持复杂数据结构和自定义算法封装,提供安全验证,简化用户与技术交互。

文章图片
#人工智能#开源#数据分析 +1
LazyLLM:还在为AI应用开发掉头发?商汤开源智能体低代码开发工具,三行代码部署聊天机器人

LazyLLM 是一个低代码开发平台,可帮助开发者快速构建多智能体大语言模型应用,支持一键部署、跨平台操作和多种复杂功能。

文章图片
#人工智能#开源#低代码
    共 134 条
  • 1
  • 2
  • 3
  • 14
  • 请选择