爱上珍珠的贝壳个人主页

@Diaoliangwang

爱上珍珠的贝壳

2023-08-18 10:16:05 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

ESP32-S3-CAM：豆包语音识别文字后控制小车（三）——SD卡本地音频识别转文字

这里要注意，提前告诉kimi背景信息，SD卡是板载卡槽，相关的GPIO口等，我是直接把之前跑通的代码也作为附件上传给了kimi。注意点：kimi转的代码中由于原来python demo代码里有文件压缩动作，其实可以不用压缩，可以去掉，然后分片发送即可。kimi改过的代码，它自动补全了，WiFi要单独连接，所以你要给配置WiFi名称和密码，SD卡里要拷贝音频文件到根目录。最后kimi给的代码中是可

#语音识别 #人工智能 #智能硬件

ESP32-S3-CAM：豆包语音识别文字后控制小车（一）——注册豆包火山引擎开发者接口

因为我们这个案例只是用来识别语音指令，比如前进后退，所以用不着特别牛逼的模型，另外还要考虑成本问题，我之前也不知道选哪个模型，都是问豆包的，后来我发现，有个一句话识别模型，消耗的token最小，效果也很好，于是就选择了这个，如果是想自己开发录音笔，自动播客这类的智能硬件，就要选择其他大点的模型了。作者倒是写得超级详细，但是说实话，看了交互流程我就被劝退了，这个交流流程，我起码看了有个十遍，基本看

#语音识别 #火山引擎 #人工智能 +1

ESP32-S3-CAM：豆包语音识别文字后控制小车（五）——认识L298N驱动模块

在淘宝上看了下硬件选型，小车好像比较普遍都是用L298N来驱动，但是一个L198N只能控制两个电机，后来发现有那种一个驱动模块控制四个电机的模块。L198N上接线都要用螺丝拧紧，所以必须要准备个小螺丝刀。。。。

#语音识别 #人工智能 #智能硬件

ESP32-S3-CAM：豆包语音识别文字后控制小车（规划）

最近一直很忙，有半个月没折腾板子了，但一直都有个想法，搞个复杂一丢丢的需求，通过MIC拾音，然后豆包后台接口去识别语音内容，转成文字后，再控制小车前进还是后退。买回来发现组装也挺有意思的，不过这玩意比较脆，中间那两个车板子容易碎，具体怎么装小车后面单独帖子介绍。前期准备工作：淘宝买了些硬件，刚开始没经验，其实不仅仅要买轮子，还得买个车架子。

#语音识别 #人工智能

ESP32-S3-CAM：豆包语音识别文字后控制小车（终章）——语音控制+L298N模块驱动小车

1）L198N连接两个轮子，然后用胶带粘到车架上的，比较丑陋，先组装起来2）供电：我是用充电宝给ESP32-S3供电；用电池仓给L298N供电3）L298N接线：左轮：图中黑色胶带对应的那边左轮：OUT3 接左电机左侧金属片和OUT4 接左电机右侧金属片，控制线接IN3 和IN4 分别插入G5和G6引脚右轮：OUT1 接右电机左侧金属片和OUT2 接右电机右侧金属片，控制线接IN1 和IN

#语音识别 #人工智能

ESP32-S3-CAM：豆包语音识别文字后控制小车（四）——增加mic拾音后通过豆包语音识别后转文字输出

现在修改一下代码逻辑，当终端输入 r文件名命令的时候，就从SD卡读对应文件去识别，当终端输入audio的时候，就增加从mic读取音频到豆包后台识别，分片大小也按照之前代码设置，mic的gpio口设置如下。输入audio命令后只从mic采集3秒音频就结束了，不要一直采集，然后继续等终端输入新的命令。本地音频文件已经识别成功了，接下来就是增加mic拾音转文字功能。1、上硬件，GPIO口都和之前帖

#语音识别 #智能硬件

ESP32-S3-CAM：豆包语音识别文字后控制小车（终章）——语音控制+L298N模块驱动小车

#语音识别 #人工智能

ESP32-S3-CAM：豆包语音识别文字后控制小车（一）——注册豆包火山引擎开发者接口

#语音识别 #火山引擎 #人工智能 +1

ESP32-S3-CAM：豆包语音识别文字后控制小车（规划）

#语音识别 #人工智能

ESP32-S3-CAM：豆包语音识别文字后控制小车（五）——认识L298N驱动模块

#语音识别 #人工智能 #智能硬件

共 16 条

请选择