
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Pytorch-NLUPytorch-NLU是一个只依赖pytorch、transformers、numpy、tensorboardX,专注于文本分类、序列标注的极简自然语言处理工具包。支持BERT、ERNIE、ROBERTA、NEZHA、ALBERT、XLNET、ELECTRA、GPT-2、TinyBERT、XLM、T5等预训练模型;支持BCE-Loss、Focal-Loss、Circle-Lo
一.概述SWEM(Baseline Needs More Love: On Simple Word-Embedding-Based Models and Associated PoolingMechanisms),基于词向量带有池化的简单方法,是Dinghan Shen等2018年的paper。该方案简单有效,embedding + pooling+ mlp,堪比Fa...
需求: pytorch1.x的模型(.pt文件)转tensorflow1.x/2.x的模型(.pb文件—savedmodel格式);目的: pytorch进行实验等, tf-serving部署最后的模型;
目的: 因为需要对预训练模型等做一些查看、转移操作,不想要乱码,不想频繁下载模型等;
一、python3写一个http接口服务,给别人调用2这次选择flask,Flask是一个用于构建web应用程序的Python微框架,是一个轻量级的WSGI web应用程序框架。它的目的是使web入门变得快速和容易,并能够扩展到复杂的应用程序。它最初是一个围绕Werkzeug和Jinja的简单包装器,现在已经成为最流行的Python web应用程序框架之一。简易而且本地win1...

最近需要用到多模态尤其是CV方面的知识, 所以学习和使用了一下mmdetection和其他CV项目, 总结记录下遇到的各种问题, 以便往后查阅。mmdetection版本为当前最新的2.24.1, 总的安装见mmdetection/requirements.txt, 实际上包括requirements/build.txt/optional.txt/runtime.txt/tests.txt四个文件
pytorch-sequencelabelingpytorch-sequencelabeling是一个支持softmax、crf、span等模型,只依赖pytorch、transformers、tensorboardX和numpy,专注于序列标注(命名实体识别、词性标注、中文分词)的轻量级自然语言处理工具包。目录数据使用方式paper参考Reference数据数据来源免责声明:以下数据集由公开渠道
CSC, 中文经典拼写纠错模型汇总(综述/概述),分类:引入拼音字形信息,检测错误和纠错一体化融合,prompt对齐预训练,训练+微调方式的调整,前处理+后处理, 基于大模型。ReLM, C-LLM, MacBERT4CSC, MaskCorrect, BERT-MFT, ECOPO, SoftMask-BERT, Bi-DCSpell, ChineseBERT, SpellBERT, SCOPE

开放信息抽取(OIE)系统(五)-- 第四代开放信息抽取系统(基于深度学习, deeplearning-based, 抽取式&生成式)一.第四代开放信息抽取系统背景第四代开放信息抽取系统的诞生和发展离不开时代的浪潮,首先是深度学习迅猛发展,word-embedding、seq2seq-attention、attention、bert等技术层出不穷;然后就是前人开源出的各种OIE系统,也给数

一、AutoML简介AutoML(Automated Machine Learning),中文可以翻译为自动机器学习,我比较喜欢叫它“机器学习自动化”,更加接近人们所津津乐道的通用人工智能吧。人们一直有个朴素的想法,可以有一个通用的AI系统,它包罗万象,能够对整个宇宙进行建模,对我们遇到的一切问题,都给出解决办法。这在幻想书籍中数见不新鲜,比如漫威电影中钢铁...