logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

ESP32-S3-CAM:豆包语音识别文字后控制小车(三)——SD卡本地音频识别转文字

这里要注意,提前告诉kimi背景信息,SD卡是板载卡槽,相关的GPIO口等,我是直接把之前跑通的代码也作为附件上传给了kimi。注意点:kimi转的代码中由于原来python demo代码里 有文件压缩动作,其实可以不用压缩,可以去掉,然后分片发送即可。kimi改过的代码,它自动补全了,WiFi要单独连接,所以你要给配置WiFi名称和密码,SD卡里要拷贝音频文件到根目录。最后kimi给的代码中是可

文章图片
#语音识别#人工智能#智能硬件
ESP32-S3-CAM:豆包语音识别文字后控制小车(四)——增加mic拾音后通过豆包语音识别后转文字输出

现在修改一下代码逻辑,当终端输入 r文件名 命令 的时候,就从SD卡读对应文件去识别,当终端输入audio的时候,就增加从mic读取 音频到豆包后台识别,分片大小也按照之前代码设置,mic的gpio口设置如下。输入audio命令后只从mic采集3秒音频就结束了,不要一直采集,然后继续等终端输入新的命令。本地音频文件已经识别成功了,接下来就是增加mic拾音转文字功能。1、上硬件,GPIO口都和之前帖

文章图片
#语音识别#智能硬件
ESP32-S3-CAM:豆包语音识别文字后控制小车(终章)——语音控制+L298N模块驱动小车

1)L198N连接两个轮子,然后用胶带粘到车架上的,比较丑陋,先组装起来2)供电:我是用充电宝给ESP32-S3供电;用电池仓给L298N供电3)L298N接线:左轮:图中黑色胶带对应的那边左轮:OUT3 接左电机左侧金属片 和OUT4 接左电机右侧金属片,控制线 接IN3 和IN4 分别插入G5和G6引脚右轮:OUT1 接右电机左侧金属片 和OUT2 接右电机右侧金属片,控制线 接IN1 和IN

文章图片
#语音识别#人工智能
ESP32-S3-CAM:豆包语音识别文字后控制小车(规划)

最近一直很忙,有半个月没折腾板子了,但一直都有个想法,搞个复杂一丢丢的需求,通过MIC拾音,然后豆包后台接口去识别语音内容,转成文字后,再控制小车前进还是后退。买回来发现组装也挺有意思的,不过这玩意比较脆,中间那两个车板子容易碎,具体怎么装小车后面单独帖子介绍。前期准备工作:淘宝买了些硬件,刚开始没经验,其实不仅仅要买轮子,还得买个车架子。

文章图片
#语音识别#人工智能
ESP32-S3-CAM:豆包语音识别文字后控制小车(五)——认识L298N驱动模块

在淘宝上看了下硬件选型,小车好像比较普遍都是用L298N来驱动,但是一个L198N只能控制两个电机,后来发现有那种一个驱动模块控制四个电机的模块。L198N上接线都要用螺丝拧紧,所以必须要准备个小螺丝刀。。。。

文章图片
#语音识别#人工智能#智能硬件
ESP32-S3-CAM:豆包语音识别文字后控制小车(一)——注册豆包火山引擎开发者接口

因为我们这个案例只是用来识别语音指令,比如前进后退,所以用不着特别牛逼的模型,另外还要考虑成本问题,我之前也不知道选哪个模型,都是问豆包的,后来我发现,有个 一句话识别模型,消耗的token最小,效果也很好,于是就选择了这个,如果是想自己开发录音笔,自动播客这类的智能硬件,就要选择其他大点的模型了。作者倒是写得超级详细,但是说实话,看了交互流程我就被劝退了,这个交流流程,我起码看了有个十遍,基本看

文章图片
#语音识别#火山引擎#人工智能 +1
ESP32-S3-CAM:豆包语音识别文字后控制小车(终章)——语音控制+L298N模块驱动小车

1)L198N连接两个轮子,然后用胶带粘到车架上的,比较丑陋,先组装起来2)供电:我是用充电宝给ESP32-S3供电;用电池仓给L298N供电3)L298N接线:左轮:图中黑色胶带对应的那边左轮:OUT3 接左电机左侧金属片 和OUT4 接左电机右侧金属片,控制线 接IN3 和IN4 分别插入G5和G6引脚右轮:OUT1 接右电机左侧金属片 和OUT2 接右电机右侧金属片,控制线 接IN1 和IN

文章图片
#语音识别#人工智能
ESP32-S3-CAM:豆包语音识别文字后控制小车(一)——注册豆包火山引擎开发者接口

因为我们这个案例只是用来识别语音指令,比如前进后退,所以用不着特别牛逼的模型,另外还要考虑成本问题,我之前也不知道选哪个模型,都是问豆包的,后来我发现,有个 一句话识别模型,消耗的token最小,效果也很好,于是就选择了这个,如果是想自己开发录音笔,自动播客这类的智能硬件,就要选择其他大点的模型了。作者倒是写得超级详细,但是说实话,看了交互流程我就被劝退了,这个交流流程,我起码看了有个十遍,基本看

文章图片
#语音识别#火山引擎#人工智能 +1
ESP32-S3-CAM:豆包语音识别文字后控制小车(规划)

最近一直很忙,有半个月没折腾板子了,但一直都有个想法,搞个复杂一丢丢的需求,通过MIC拾音,然后豆包后台接口去识别语音内容,转成文字后,再控制小车前进还是后退。买回来发现组装也挺有意思的,不过这玩意比较脆,中间那两个车板子容易碎,具体怎么装小车后面单独帖子介绍。前期准备工作:淘宝买了些硬件,刚开始没经验,其实不仅仅要买轮子,还得买个车架子。

文章图片
#语音识别#人工智能
ESP32-S3-CAM:豆包语音识别文字后控制小车(五)——认识L298N驱动模块

在淘宝上看了下硬件选型,小车好像比较普遍都是用L298N来驱动,但是一个L198N只能控制两个电机,后来发现有那种一个驱动模块控制四个电机的模块。L198N上接线都要用螺丝拧紧,所以必须要准备个小螺丝刀。。。。

文章图片
#语音识别#人工智能#智能硬件
    共 16 条
  • 1
  • 2
  • 请选择