logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LD3320语音识别模块分析

LD3320语音识别模块分析LD3320是非特定人语音识别芯片,即语音声控芯片。最多可以识别50条预先内置的指令。识别原理声音分帧:声音是一种波,常见的mp3等格式都是压缩格式,必须转为非压缩的纯波形文件来处理,比如Windows PCM文件,也就是wav文件。wav文件李存储的除了一个文件头以外就是声音波形的一个个点。比如下图一个波形示例:在语音开始识别之前,需要把首尾端的静音切除,降低对后续

文章图片
材料科学+AI新突破 | MatterChat 首个理解材料原子结构的多模态大模型问世,性能超越GPT-4

(a)MatterChat架构:该系统包括一个生成原子嵌入的材料编码器和一个处理语言数据的LLM。这些组件由可训练的桥梁模型连接,该模型将材料结构与自然语言对齐,以支持材料描述和性能预测等任务。(b) 142899种成分的元素分布,代表了数据集的成分多样性。(c) 数据集分布由空间群(外环)和晶体系统(内环)显示,说明数据集中的结构变化。MatterChat的技术架构:三大核心组件的协同工作Mat

文章图片
#人工智能
搜索算法(迷宫问题)

搜索算法盼来盼去终于又要开始学习算法了!笔者自学算法,所以学习顺序以个人舒服的形式!一,DFS(深搜)用例子来看:问题:有一个迷宫,以1 2形式来表示————1表示是空地,即可以行走,2表示是障碍物,即无法通行。该迷宫由一个矩阵形式表示。即1  1  2  11  1  1  11  1  2  11  2  1  11  1  1  2有终点和起点,我们需要计算从起点到达终点的最短路径!准备代码

#算法#c++
材料科学+AI新突破 | MatterChat 首个理解材料原子结构的多模态大模型问世,性能超越GPT-4

(a)MatterChat架构:该系统包括一个生成原子嵌入的材料编码器和一个处理语言数据的LLM。这些组件由可训练的桥梁模型连接,该模型将材料结构与自然语言对齐,以支持材料描述和性能预测等任务。(b) 142899种成分的元素分布,代表了数据集的成分多样性。(c) 数据集分布由空间群(外环)和晶体系统(内环)显示,说明数据集中的结构变化。MatterChat的技术架构:三大核心组件的协同工作Mat

文章图片
#人工智能
机器学习基础知识

针对新手阅读论文中会经常出现的很多概念不太清楚(主要是个人刚开始阅读文献时)进行了积累。

文章图片
#机器学习#人工智能#深度学习
LD3320语音识别模块分析

LD3320语音识别模块分析LD3320是非特定人语音识别芯片,即语音声控芯片。最多可以识别50条预先内置的指令。识别原理声音分帧:声音是一种波,常见的mp3等格式都是压缩格式,必须转为非压缩的纯波形文件来处理,比如Windows PCM文件,也就是wav文件。wav文件李存储的除了一个文件头以外就是声音波形的一个个点。比如下图一个波形示例:在语音开始识别之前,需要把首尾端的静音切除,降低对后续

文章图片
LD3320语音识别模块分析

LD3320语音识别模块分析LD3320是非特定人语音识别芯片,即语音声控芯片。最多可以识别50条预先内置的指令。识别原理声音分帧:声音是一种波,常见的mp3等格式都是压缩格式,必须转为非压缩的纯波形文件来处理,比如Windows PCM文件,也就是wav文件。wav文件李存储的除了一个文件头以外就是声音波形的一个个点。比如下图一个波形示例:在语音开始识别之前,需要把首尾端的静音切除,降低对后续

文章图片
到底了