简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
近年来,深度学习模型性能取得了飞跃,可以在单个网络中使用大量隐藏层。训练深度学习模型可能会占用大量计算资源,并且通常在图形处理单元(GPU)上进行,同时为了获得最优的模型性能,可能需要网络架构和超参数的反复修改和调整,通常此过程取决于实际问题和网络架构设计人员的经验,而利用遗传算法可以将此过程自动化,同时可以在可接受的时间开销内找到更好的网络架构。本文使用MNIST数据集和Tensorflow构建
探索文档解析技术是推动大模型训练与应用的重要一环。在本节中,我们将回顾来自合合信息的智能创新事业部研发总监常扬在中国图象图形大会 (CCIG 2024) 中关于文档解析技术加速大模型训练与应用的分享,介绍大模型训练和应用过程的关键环节面临的挑战,探索当前高性能的文档解析技术。
正则化是防止过拟合的有效手段,它通过对模型的复杂度进行约束来提高模型的泛化能力。选择合适的正则化方法可以帮助模型在面对未见过的数据时有更好的表现,而不只是仅仅记住训练数据的细节。
正则化是防止过拟合的有效手段,它通过对模型的复杂度进行约束来提高模型的泛化能力。选择合适的正则化方法可以帮助模型在面对未见过的数据时有更好的表现,而不只是仅仅记住训练数据的细节。
在生成式 AI 时代,模型具备快速响应用户需求的能力,能够实现即时生成与交互。但不准确数据会影响模型的表现,导致生成内容不可靠,同时随着伴随内容生成的便利,也出现了虚假信息、版权问题等安全挑战。本文通过回顾郭博士在郭丰俊博士在第七届中国模式识别与计算机视觉大会中的报告,介绍了合合信息关于文档和证件等数据的伪造检测技术,以及能够用于加速大模型系统的构建和训练过程的文档处理服务平台。
在本文中,我们使用 TensorFLow 库构建了简单的神经网络模型以了解 TensorFLow 库的基本用法,然后进一步构建了原始神经网络用于识别 MNIST 手写数字数据集,对于模型训练的流程和其中的关键步骤进行了详细的总结和介绍。
随着 AI 技术的快速发展,AI 造假问题也越来越严重,为经济、社会发展带来了诸多挑战,也威胁着的个人的隐私安全和社会的秩序,AI 安全的治理目前是学术界和产业界非常关注的课题。为了应对这一挑战,本文回顾了在《CCF-CV 企业交流会—走进合合信息》活动中,与会专家从监管、前沿研究、技术实践等多个维度分享的 AI 安全领域的最新研究成果以及实践经验,以推动 AI 在保障安全和公平的基础上健康发展。
Tesseract是一个开源 OCR 引擎,可以直接通过命令行使用,或者通过使用API从图像中提取文本。它为多种语言提供了API,其中显然包括Python。Tesseract支持unicode (UTF-8),可以识别 100 多种语言。Tesseract支持各种输出格式,包括纯文本、HTML、PDF、TSV等。本文介绍了Windows下Tesseract的安装和如何通过Python调用Tesse
Qt5.x解决报错main.cpp:1:10: fatal error: QApplication: No such file or directory问题。
在本文中, 我们了解了神经网络的相关基础知识,同时看到了神经网络常见的模型架构与其在实际中的广泛应用,同时利用 Python 从零开始实现了神经网络的训练过程——前向传播和反向传播,了解了神经网络的通用训练流程。