
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
webrtc初了解
Web Real-Time Communication(网页实时通信),是浏览器原生支持的实时音视频通信技术,无需安装插件或客户端,可直接在浏览器之间实现点对点(P2P)通信。核心目标:让浏览器具备实时数据传输能力(音视频、文本、文件等),常用于视频会议、直播连麦、在线教育等场景。核心在客户端(浏览器)(如 getUserMedia、RTCPeerConnection 等),用于在 客户端之间直接
c++新特性之 左右值 lambda 以及“for”
std::movec++lambda新for

神经网络之RNN和LSTM(基于pytorch-api)
RNN以及LSTM原理 以及pytorchapi调用

神经网络的数据集处理
数据集的处理

构建神经网络之常用pandas(补充中 )
便于查找常用的panda是函数

神经网络架构之transformer
一文读懂transformer 和工程实践 -调用api

神经网络之CNN文本识别
目前对NLP的研究分析应用最多的就是RNN系列的框架,比如RNN,GRU,LSTM等等,再加上Attention,基本可以认为是NLP的标配套餐了。更为具体地理解可以看下图,输入为一个7x5的矩阵,filters的高度分别为2,3,4,宽度和输入矩阵一样为5。在CV中,filters是以一个patch(任意长度x任意宽度)的形式滑过遍历整个图像,但是在NLP中,filters会覆盖到所有的维度,也

如何快速看懂并修改神经网络
看懂 action 和 x-clip代码

prompt工程起步
有关CLIP和ActionClip的手工特征,也是一个进步。通过给标签填入不同的修饰语当中,组成一段话来,来增强语义理解这个就是一个手工提示词,针对于特殊的任务设计出来的。text_dict就是蕴含着一个模板是键,对应不同的一句话!将输入标签随机选一个模板与视频进行对比学习!







