logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习周报四十四

本周还是寻找到一个可以替换OCR的内容一致性损失,合成了新的数据集,以训练一个保持内容一致性的轻量级模型来替代OCR。当前训练模型发现存在过拟合的问题,训练损失在下降,但是验证损失类似一条直线,基本不下降,后续还要继续修改,

文章图片
#机器学习#人工智能
机器学习周报四十三

本周主要的工作是,寻找到一个无监督或者自监督的方法,解决模型的域泛化的问题,探索了幅度损失和方向损失等函数的思路和局限性。内容一致性循环一致性微调的流程:第一步生成任务的目标是用target_glyph的内容替换img1原来的内容source_glyph得到img2_pred;第二步的目标是用source_glyph替换img2_pred的内容得到img1_pred,最后计算img1_pred与i

#机器学习
机器学习周报四十二

本周看了一篇论文《Accurate Scene Text Recognition with Efficient Model Scaling and Cloze Self-Distillation》,关于decoder-encoder模型应用于文字识别,利用填空自蒸馏来提升不同数据区间模型的鲁棒性和性能。这个文章通过教师-学生模型对数据进行处理,模型层面可以得到质量更好的真实数据,并且增大编码器的参

#机器学习
数字马力-10.22-java笔试

2.小红在玩大富翁,从第0个城市出发,手中有四张卡牌1,2,3,4,代表可以走的步数,用完所有卡牌后,会得到一样的新的卡牌,每个城市的数值代表可以获得的金币,,小红身上的金币必须大于等于0,不能到达第n个城市输出-1;第一行输入表示n个城市,第二行是从第1到第n个,每个城市可获得的金币;选择题一通乱选,整个9-10月只做了两次笔试,代码也没有刷过力扣,现在复习考研和上学期做区块链的项目,也已经很久

文章图片
#java#开发语言#spring +1
机器学习周报四十一

本周阅读了两篇论文Zero-Shot Styled Text Image Generation, but Make It Autoregressive和Exploring Stroke-Level Modifications for Scene Text Editing,都是关于风格文本的合成,二者之间有着类似的合成路径。这是一篇关于自回归风格文本图片生成的论文,模型的结构如下图:模型结构(a)

文章图片
#机器学习#人工智能
机器学习周报四十

模型跨多种语言的文本图片生成模型,先将输入的文本转换成字形图(glyph),然后把原始图片经过resnet提取特征,通过AdaIN注入生成过程,在最后一层加入背景特征得到生成的图片。自监督:原始图片本身的文本作为文本输入,原始图片作为风格条件,最后由生成结果和原始图片计算损失。这样生成的图片中的文本信息来源只有输入的字形文件。损失函数:L1 Loss:L1∣∣Is−Gc∣∣L1​∣∣Is​−Gc​

文章图片
#机器学习#人工智能
机器学习周报三十九

本周阅读了清华大学的论文《TurboDiffusion: Accelerating Video Diffusion Models by 100–200 Times》,了解了扩散模型新的加速框架和恐怖的加速能力。本周联系之前的内容,在扩散模型的速度问题和计数问题上进行学习。

#机器学习
机器学习周报三十六

本周阅读了一篇关于空间转换器的论文,虽然论文只是在早期的操作,但是也可以是一种轻量化的特征抽取模型。对我的实验有一定的启发。后续将会把空间转换器应用到实验中监督模型的生成,输入[rec2,img1]到一个轻量级的GPT模型f,输出区域权重,然后再对选定的区域应用随机自回归,这样模型的泛化能力和收敛速度都会在理论上有所提升。

文章图片
#机器学习#人工智能
机器学习周报二十六

本周主要阅读了风格迁移方面的三篇论文,内容涉及场景文字编辑、文本驱动风格迁移以及内容与风格组合的图像生成方法。三篇论文分别从文字编辑、文本驱动风格迁移和内容-风格组合三个角度推进了风格迁移领域的发展,在保持内容结构的同时,实现了更精准、多样和高质量的风格化图像生成。本周主要对一些感兴趣方向的论文进行了阅读,从中获取一些应用方向、创新点的启发,为以后的科研提供方向。

文章图片
#机器学习#人工智能#计算机视觉
机器学习周报六

本周学习的是集成学习部分的内容,关于bagging和boosting有了认识,对梯度、方向导数进行学习,解开了理解不充分的地方。本周对集成学习的概念和AdaBoost、GBDT算法和空间代数进行了学习,由于时间问题,还没有通过梯度去解释GBDT算法,下周将会解开GBDT的疑惑。

文章图片
#机器学习#人工智能
    共 11 条
  • 1
  • 2
  • 请选择