
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
减少目标定位的准确度减少背景干扰提高目标定位的准确度目标检测系统常用评价指标:检测速度和精度提高精度:有效排除背景,光照和噪声的影响提高检测速度:精简检测流程,简化图像处理算法算法概述:传统目标算法、基于候选区域的两步算法、基于回归的单步算法1.传统目标算法对于区域选择,传统目标检测最常用的两种模型是滑动窗口模型与缩放窗口模型。滑动窗口模型,顾名思义,是通过设计好的窗口在图像上进行滑动来检测目标。

被识别成:“12”“2方案”,这种可以通过x坐标交叉并且第一个结果最后一个字符与第二个结果第一个字符相同判断。通过轮廓裁剪出数字区域,det设置为False可以提高识别率。resize图片的高宽比为1:10可以提高检测和识别率。情况1:检测错误,同一个字符串被两次检测到。无直接解决办法,更换精度更高数字模型解决。同上,但是仍然可能漏掉一些文字没识别出来。情况2: 识别错误,11被识别成111。适当

windows 安装paddleocr(CPU)

camelot方法有两种解析模式:流解析(stream)、格子解析(lattice),其中格子解析能够保留表格完整的样式,对于复杂表格来说要优于流解析模式。同时,camelot方法默认格子解析(lattice),而采用这种解析方式,需要安装ghostscript。ModuleNotFoundError: No module named ‘Workbook’ xlwt,是版本太低,升级版本即可。效果

LangChain 实践之工具使用

参考:慕课《人工智能导论:模型与算法》pytorch中文教程历史pytorch神经网络构建神经网络可以通过 torch.nn 包来构建。神经网络是基于自动梯度 (autograd)来定义一些模型。一个 nn.Module 包括层和一个方法 forward(input) 它会返回输出(output)。一个典型的神经网络训练过程包括以下几点:1.定义一个包含可训练参数的神经网络2.迭代整个输入3.通过
相关包的版本twisted.internet.error.TCPTimedOutError: TCP connection timed out: 10060: 由于连接方在一段时间后没有正确答复或连接的主机没有反应,连接尝试失败原因:被检测到为爬虫解决:爬虫时间设置为白天[<twisted.python.failure.Failure twisted.internet.error.Conne
https://zhuanlan.zhihu.com/p/151854074句向量应用语义搜索,通过句向量相似性,检索语料库中与query最匹配的文本文本聚类,文本转为定长向量,通过聚类模型可无监督聚集相似文本文本分类,表示成句向量,直接用简单分类器即训练文本分类器句向量模型:文档向量构建方法优缺点:bag of words而言,有如下缺点:1.没有考虑到单词的顺序,2.忽略了单词的语义信息。因此
参考:AutoGluon背后的技术自动对数据抽取特征并进行模型训练,大部分automl框架是基于超参数搜索计算,Autogluon依赖于融合多个无需超参数搜索的模型融合计算stacking在同一个训练集训练出多个模型,这些模型输出进入线性模型对输出做加权和做最终输出k则交叉bagging训练同一个模型,使用不同的初始权重或者数据块,模型输出取平均降低方差多层stacking将模型输出跟数据合并起来
数据挖掘过程和步骤问题定义数据采集数据预处理(数据清洗:数据缺失点补充、离群点异常点检测、重复数据监测等)集成:变换:数据类型变换(离散、连续)、标准化(z_score)、映射(0-1),规约:独热编码、ordinal)建立模型评估和解释知识应用关联算法Apriori算法回归算法线性回归逻辑回归分类算法逻辑回归二分类softmax多分类SVM算法:寻找支持向量,由此构造出的分类器可以最大化类与类的







