logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Flink CDC + Hudi + Hive + Presto 构建实时数据湖最佳实践

每个文件组包含多个切片,其中每个切片包含在某个提交 / 压缩即时时间生成的基本列文件 (parquet 文件),以及自生成基本文件以来对基本文件的插入 / 更新的一组日志文件 (*.log)。Hudi 采用 MVCC 设计,其中压缩操作会将日志和基本文件合并成新的文件片,清理操作会将未使用/较旧的文件片删除来回收 DFS 上的空间。说明:目前还没写入测试数据,Hudi 目录只生成一些状态标记文件,

文章图片
#大数据#hadoop#flink
【OCR技术系列之四】基于深度学习的文字识别(3755个汉字)

上一篇提到文字数据集的合成,现在我们手头上已经得到了3755个汉字(一级字库)的印刷体图像数据集,我们可以利用它们进行接下来的3755个汉字的识别系统的搭建。用深度学习做文字识别,用的网络当然是CNN,那具体使用哪个经典网络?VGG?RESNET?还是其他?我想了下,越深的网络训练得到的模型应该会更好,但是想到训练的难度以及以后线上部署时预测的速度,我觉得首先建立一个比较浅的网络(基于LeN...

自然语言处理基于预训练模型的方法 代码地址

本书配套案例代码地址https://github.com/HIT-SCIR/plm-nlp-code本书课件及答案请见百度网盘:https://pan.baidu.com/s/1y6hJhUpya_5_8Zk6iu7ZVg提取码:bvbk

#自然语言处理#深度学习#人工智能
nlp 命名实体识别-中文名识别

目录命名实体识别基于CRF的命名实体识别方法SVM和最大熵相结合的中文机构名自动识别中文名识别盘古分词中的算法预处理消除歧义总结基于词典的实体识别jcseg中文姓名识别算法总结HENU汉语分词系统中的中文人名识别算法同姓异名对的冲突处理局部回溯分词基于支持向量机的中国人名的自动识别基于可信度模型的中文人名识别研究命名实体识别命名实体识别是自然语言处理中的一项基础性工作,需要把文

#自然语言处理#机器学习#人工智能
基于opencv的图像阴影去除

基于opencv的图像阴影去除需求:图像阴影去除,有时候用手机或者相机拍照,往往会出现背景。打印出来就是灰色或者有黑色的背景,就需要实现背景去除,还原清晰图像。\一。最大、最小值滤波最大最小值滤波:首先排序周围像素和中心像素值,将中心像素值与最大和最小值比较,如果比最小值小,则替换中心像素为最小值,如果比最大值大,则替换中心像素为最大值。一个Kernel矩阵为3x3的最大最小值滤波如下:def m

YOLOv5s 目标检测算法Anchor box 的尺寸优化-之三

每个粒子的位置用 K ×2 的矩阵表示,每个聚类中心为宽 w高 h 的矩形框,jC 为某一类别的数据向量,jd 表示粒子与聚类中心的距离和,w 取 1,1 2c=c =2。如下图所示出现两个明显的拐点,考虑到更高召回率因此采用 K 值为 9 因此生成 9个 Anchor boxes 框,分别为(29x48),(32x84),(49x46),(50x103),(68x49),(90x83)(128x

#聚类#深度学习
python(+opencv2+numpy)对彩色图像的RGB通道提取、合成、显示并计算灰度图像

一、image中RGB通道提取,直接上代码很简单import cv2Import sysimport numpy as npimage = cv2.imread(sys.argv[1], cv2.IMREAD_COLOR)b = image[:, :, 0]g = image[:, :, 1]r = image[:, :, 2]也可以直接用opencv的split...

融合人体姿态估计和目标检测的学生课堂行为识别

正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消摘要: 在課堂教学中 , 人工智能技术可以帮助实现学生行为分析自动化 , 让教师能够高效且直观地掌握学生学习行为投入的情况 , 为后续优化教学设计与实施教学干预提供数据支持.构建了学生课堂行为数据集 , 为后续研究工作提供了数据基础;提出了一种行

#深度学习#计算机视觉#人工智能
keras-ocr是CRAFT文本检测器和Keras CRNN识别模型的一个打包与灵活版本

详细内容问题7同类相比218keras-ocrThis is a slightly polished and packaged version of theKeras CRNN implementationand the publishedCRAFT text detection model. It provides a high level API for tr...

哈工大团队开源医学智能问诊大模型 | 华佗: 基于中文医学知识的LLaMa指令微调模型

的结构化和非结构化医学知识,并利用基于知识的指令数据进行微调,使得模型具有较为丰富的医学领域专业知识,从而为智能诊断作出较为专业的回答。中提取相关的医学知识,生成多样的指令数据,以确保模型回答问题的事实正确性,并收集了超过8000条指令数据进行监督微调。通常只在英语语境下进行训练,这限制了它们在其他语言环境下的理解和响应能力,例如中文,因此它们在中国语境中的应用受到极大限制。做的更好,回答的也更加

文章图片
#人工智能#AIGC
    共 599 条
  • 1
  • 2
  • 3
  • 60
  • 请选择