
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
在本节中,我们学习了如何在硬件资源受限的情况下减轻运行大模型的负担。我们介绍了如何通过蒸馏、剪枝和量化从训练好的模型中提取高效模型。预训练轻量级的通用语言模型(如 DistilBERT) 可以在各种任务上进行微调,并表现出与非蒸馏模型相当的性能。随着数据量的不断增加,我们希望模型能够更快地运行,在这方面,高效 Transformer 起着至关重要的作用。

在计算机视觉领域,卷积神经网络 (CNN) 长期以来一直是处理图像任务的主流架构。然而,随着 Transformer 在自然语言处理领域的巨大成功,研究人员开始探索将这种基于自注意力机制的架构应用于视觉任务。Vision Transformer (ViT) 是这一探索的重要里程碑,它首次证明了纯 Transformer 架构在图像分类任务上可以超越最先进的 CNN 模型。本文将详细介绍 ViT 的

Ubuntu18.04解决OpenCV4出现“/usr/bin/ld: cannot find -lcudart_static.../usr/bin/ld: cannot find -lx86_64-linux-gnu”问题

智能文档图像处理技术是指利用计算机视觉和人工智能等技术对文档图像进行处理和分析,实现自动化识别、提取、分类和管理的技术。随着人工智能时代的到来和各行业信息化进程的加速,越来越多的个人和企业用户开始借助智能文档图像处理技术来提高工作效率,降低人力成本,并减少出错率。本文将探讨智能文档图像处理技术的基本原理和特点,回顾了合合信息在 VALSE 2023 会议上关于智能文档图像处理技术的相关分享,并详细

Tesseract是一个开源 OCR 引擎,可以直接通过命令行使用,或者通过使用API从图像中提取文本。它为多种语言提供了API,其中显然包括Python。Tesseract支持unicode (UTF-8),可以识别 100 多种语言。Tesseract支持各种输出格式,包括纯文本、HTML、PDF、TSV等。本文介绍了Windows下Tesseract的安装和如何通过Python调用Tesse

Ian Goodfellow 在首次提出GAN,使用了形象的比喻来介绍 GAN 模型:生成网络 G 的功能就是产生逼真的假钞试图欺骗鉴别器 D,鉴别器 D 通过学习真钞和生成器 G 生成的假钞来掌握钞票的鉴别方法。这两个网络在相互博弈中进行训练,直到生成器 G 产生的假钞使鉴别器 D 难以分辨。而DCGAN是使用卷积操作和反卷积操作来替代原始GAN中的全连接操作。
本文介绍了如何将新颖的深度学习技术应用于古老文字的识别上,介绍了合合信息如何解决古彝文识别中的困难与挑战。依托于合合信息在古文字识别领域的积累,相对于传统古彝文识别模型,合合信息携手上海大学提出的基于深度学习的古彝文识别模型能够以更高的精度识别古彝文手写体,极大的提高了古彝文识别的准确率。

在计算机中通常使用像素矩阵表示图像,像素的位置对应图像的坐标,像素深度用于定义表示像素值的位数,图像通道在RGB色彩模式下就是指那单独的红色、绿色、蓝色部分。
在遗传算法 (Genetic Algorithms, GA) 中,使用选择、交叉、突变和适应度来模拟生物减数分裂或繁殖的基本操作。适应度是衡量个体优劣的指标,可以用于量化模拟个体成功解决给定问题的能力。通过修改遗传算法超参数,如种群大小、世代数、交叉率和突变率等超参数,能够调整和修改进化进程。在本节中,我们介绍了遗传算法基本概念及算法流程,并使用 Python 实现遗传算法解决 OneMax 问题

通过爬取“触站”批量获取高清二次元图片(以“女孩子”板块为例),并将获取的webp格式的图片转化为更为常见的png格式图片。尽管二次元知识人类幻想出来的唯美世界,但其本质上还是我们心中模糊的对梦想生活的憧憬和对美好未来的期望,学习Python爬虫,一起获取二次元女友(们)吧。







