logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

webrtc初了解

Web Real-Time Communication(网页实时通信),是浏览器原生支持的实时音视频通信技术,无需安装插件或客户端,可直接在浏览器之间实现点对点(P2P)通信。核心目标:让浏览器具备实时数据传输能力(音视频、文本、文件等),常用于视频会议、直播连麦、在线教育等场景。核心在客户端(浏览器)(如 getUserMedia、RTCPeerConnection 等),用于在 客户端之间直接

#webrtc
神经网络架构之transformer

一文读懂transformer 和工程实践 -调用api

文章图片
#神经网络#transformer#人工智能
神经网络之CNN文本识别

目前对NLP的研究分析应用最多的就是RNN系列的框架,比如RNN,GRU,LSTM等等,再加上Attention,基本可以认为是NLP的标配套餐了。更为具体地理解可以看下图,输入为一个7x5的矩阵,filters的高度分别为2,3,4,宽度和输入矩阵一样为5。在CV中,filters是以一个patch(任意长度x任意宽度)的形式滑过遍历整个图像,但是在NLP中,filters会覆盖到所有的维度,也

文章图片
#神经网络#cnn#人工智能
prompt工程起步

有关CLIP和ActionClip的手工特征,也是一个进步。通过给标签填入不同的修饰语当中,组成一段话来,来增强语义理解这个就是一个手工提示词,针对于特殊的任务设计出来的。text_dict就是蕴含着一个模板是键,对应不同的一句话!将输入标签随机选一个模板与视频进行对比学习!

#python#开发语言
    共 23 条
  • 1
  • 2
  • 3
  • 请选择