logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Numpy处理图片方法

在进行图像领域的深度学习的时候经常需要对图片进行处理,包括图像的翻转,压缩,截取等,一般都是用Numpy来处理。处理起来也很方便。In[3]# 导入需要的包import numpy as npimport matplotlib.pyplot as pltfrom PIL import Image# 读入图片image = Image.open('./work/vehicl...

百度AI攻略:增值税发票识别

1.功能描述:在日常工作中经常要用到增值税发票。在使用的时候需要对增值税发表进行检查,验真,录入等很多工作。使用增值税发票识别技术,实现对增值税普票或专票各字段信息的识别和录入,可应用于企业税务核算及内部报销等场景,能够有效减少人工核算工作量,降低人力成本,实现财税报销的自动化2.平台接入增值税发票识别接入网址:https://console.bce.baidu.com/ai/#/ai...

百度AI攻略:实现人体姿态判定打分

【使用攻略】【人体关键点识别】1.方案介绍百度推出了人体关键点识别,检测图像中的人体并返回人体矩形框位置,精准定位21个核心关键点,包含头顶、五官、颈部、四肢主要关节部位,支持多人检测、大动作等复杂场景。支持多人体检测,检测图像中的所有人体,标记出每个人体的坐标位置;不限人体数量,适应人体轻度遮挡、截断的情况。人体关键点识别的功能特点可以应用到体育健身,根据人体关键点信息,分析人体姿态、...

Windows下使用zeppelin、Dockers搭建Flink学习环境

一、原因最近在学Flink,学的时候非常怀念学习Python用的Jupyter notebook,因此非常希望也能有一个类似Jupyter Notebook的环境来运行、学习Flink。可惜Jupyter Notebook现在不支持Flink,不过幸好还有Zeppelin。zeppelin是一个基于web的notebook,支持各种解析器,可视化的数据提取,数据发现,数据分析等。当前zeppeli

文章图片
#windows#flink#大数据
GPT vs Bert

GPT和BERT的输入顺序不同:GPT是从左到右的单向模型,它只能在当前位置之前看到的上下文信息,而BERT是一种双向模型,它可以同时看到前面和后面的文本信息。GPT和BERT的训练数据不同:GPT使用了更广泛的训练数据,包括维基百科和网页文本,而BERT则使用了更多的语言任务,如问答和阅读理解。GPT和BERT的任务不同:GPT是一种基于语言模型的生成式模型,可以生成类似人类写作的文本,而BER

文章图片
#bert#深度学习#自然语言处理
VQGAN(Vector Quantized Generative Adversarial Network)模型简介

为了训练 VQGAN 模型,需要使用大量的图像数据集和一些预处理技术,如数据增强和图像裁剪等。在训练过程中,VQGAN 模型会优化两个损失函数:一个用于量化误差(即离散化向量和连续值之间的误差),另一个用于生成器和判别器之间的对抗损失。在实际应用中,VQGAN 可以用于许多有趣的任务,如从文本生成图像、从图像生成文本、图像到图像的翻译、图像编辑、风格迁移等。总的来说,VQGAN 通过使用 VQ 技

文章图片
#计算机视觉#深度学习#人工智能
DINOv2: A Self-supervised Vision Transformer Model

作者指出:自然语言处理领域近期在大规模数据的模型预训练方面取得的突破为计算机视觉领域的类似基础模型铺平了道路。这些模型可以通过产生通用的视觉特征大大简化任何系统中图像的使用,即在不进行微调的情况下适用于图像分布和任务的特征。这也是本文的中心思想,即可以通过类似的方法来训练模型,生成一些通用的视觉特征,这些特征适用于不同的图像分布和不同的任务,无需进行进一步的微调即可使用。3. 动量更新:学生网络的

文章图片
#transformer#深度学习#计算机视觉
大语言模型(LLM)的进化树,学习LLM看明白这一张图就够了

近期大语言模型迅速发展,让大家看得眼花缭乱,感觉现在LLM的快速发展堪比寒武纪大爆炸,各个模型之间的关系也让人看的云里雾里。最近一些学者整理出了 ChatGPT 等语言模型的发展历程的进化树图,让大家可以对LLM之间的关系一目了然。论文:https://arxiv.org/abs/2304.13712Github(相关资源):https://github.com/Mooler0410/LLMsPr

文章图片
#语言模型#学习#人工智能
Starcoder:愿源码与你同在, 最新的开源代码生成LLM来了

在5月4日,BigCoder在HuggingFace的支持下发布了开源代码生成模型Starcoder。为方便查找,以下是主要的参考和资源链接:VSCode插件:HF Code AutocompleteStarCoder 和 StarCoderBase 是代码的大型语言模型 (Code LLM),使用来自 GitHub 的许可数据进行训练,包括来自 80+ 编程语言、Git 提交、GitHub 问题

文章图片
#开源#github#git
百度AI攻略:语音识别

1.功能描述:将60秒内的语音快速识别为文字,适用于手机语音输入、语音搜索、人机对话等语音交互场景2.平台接入具体接入方式比较简单,可以参考我的另一个帖子,这里就不重复了:http://ai.baidu.com/forum/topic/show/9433273.调用攻略(Python3)及评测3.1首先认证授权:在开始调用任何API之前需要先进行认证授权,具体的说明请参考:...

    共 13 条
  • 1
  • 2
  • 请选择