logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【小沐学AI】Python实现语音识别(faster-whisper-webui)

Whisper 是一种通用语音识别模型。它是在各种音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。OpenAI 的开源模型 whisper,可以执行 99 种语言的语音识别和文字转写。但是 whisper 模型占用计算资源多,命令行使用门槛高。whisper 模型本身还存在一些问题,例如 模型幻听问题。Whisper是可以理解多种语言的自动语音识别()系统

文章图片
#人工智能#python#语音识别 +1
【小沐杂货铺】基于Three.JS绘制卫星轨迹Satellite(GIS 、WebGL、vue、react,提供全部源代码)

Three.js 是一个基于 WebGL 的 JavaScript 3D 图形库,能够简化浏览器中复杂 3D 场景和动画的开发。Satellite.js 是一个专注于卫星轨道计算的 JavaScript 工具库,基于 SGP4/SDP4 模型实现卫星位置与速度的预测。它通过解析 TLE(两行轨道根数)数据,支持低地球轨道(LEO)和中地球轨道(MEO)卫星的实时跟踪与轨迹模拟,常用于航天工程、天文

文章图片
#javascript#webgl#vue.js
【小沐学CAD】虚拟仿真开发工具:GL Studio

DiSTI 是 HMI 软件、虚拟驾驶舱、仪表、信息娱乐、集群显示器和嵌入式 UI 解决方案的领先提供商。而它的GL Studio是HMI & UI/UX Design Software。嵌入式HMI系统设计软件可以通过高质量设计和高性能提升用户体验,同时降低生产成本。GL Studio 功能具有强大的功能、可靠性和敏捷性,可满足小型嵌入式 MCU 的要求。GL Studio 内置的安全关键代码生

文章图片
#ui#vr#ar
【小沐学Python】网络爬虫之lxml

LXML是功能最丰富的 和易于使用的库 用于处理 XML 和 HTML 在 Python 语言中。lxml XML 工具包是 C 库 libxml2 和 libxslt 的 Pythonic 绑定。它的独特之处在于它结合了速度和 这些库的 XML 功能完整性与 原生 Python API,大部分兼容,但优于众所周知的 ElementTree API。最新版本适用于所有 CPython 版本 从 2

文章图片
#python#爬虫#开发语言
【CAD开发】3dxml文件格式读取(Python、C++、C#)

文章目录1、简介2、文件格式3、代码实现(Python)3.1 blender(个人测试代码)3.2 FreeCAD3.3 trimesh4、代码实现(C++)4.1 CAD Exchanger4.2 个人测试代码5、代码实现(C#)5.1 xsd文件验证5.2 xsd文件读取结语1、简介3D XML 格式用于所有 Dassault Systèmes 品牌 - CATIA、DELMIA、ENOVI

文章图片
#python#blender
【小沐学AI】解锁Claude Code,小白也能玩转AI编程

戈戈与小沐实践王阳明“知行合一”理念,测试Claude Code智能编程工具。通过CLI终端生成五子棋代码,验证了从需求描述到代码落地的全流程。文章详细介绍了Claude Code的安装、配置及四种使用方式(CLI/Web/桌面/IDE插件),重点演示了终端生成完整可运行的五子棋项目过程,包括调试技巧与API中转配置,最终浏览器运行效果良好,展现AI编程助手的高效能力。

文章图片
#人工智能
【小沐学AI】智谱AI大模型的一点点学习(Python)

202年1月30日,大模型开源开放评测体系司南(OpenCompass2.0)正式发布,旨在为大语言模型、多模态模型等各类模型提供一站式评测服务。GLM-4模型编码:glm-4根据输入的自然语言指令完成多种语言类任务,推荐使用 SSE 或异步调用方式请求接口client = ZhipuAI(api_key="") # 填写您自己的APIKeymodel="glm-4", # 填写需要调用的模型名称

文章图片
#人工智能#python#AI
【小沐学AI】Google AI大模型的一点点学习(Python)

Gemini 是 Google 最大、功能最强大的 AI 模型。Gemini 是 Google 的最新一代生成模型,超越了 PaLM 模型系列的功能。

文章图片
#人工智能#python
【小沐学AI】Python实现语音识别(whisperX)

Whisper 是一种通用语音识别模型。它是在各种音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。Transformer 序列到序列模型针对各种语音处理任务进行训练,包括多语言语音识别、语音翻译、口语识别和语音活动检测。这些任务共同表示为解码器要预测的一系列标记,从而允许单个模型取代传统语音处理管道的许多阶段。多任务训练格式使用一组特殊标记作为任务说明符或

文章图片
#人工智能#python#语音识别 +1
【小沐学AI】Python实现语音识别(faster-whisper)

Faster-Whisper是Whisper开源后的第三方进化版本,它对原始的 Whisper 模型结构进行了改进和优化。faster-whisper 是使用 CTranslate2 重新实现 OpenAI 的 Whisper 模型,CTranslate2 是 Transformer 模型的快速推理引擎。此实现比 openai/whisper 快 4 倍,同时使用更少的内存实现相同的准确性。通过对

文章图片
#人工智能#python#语音识别 +1
    共 76 条
  • 1
  • 2
  • 3
  • 8
  • 请选择