logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型做实体识别任务的原理

对于每个位置的embedding进行T转化生成起始位置的概率分布,同理可生成终止位置的概率分布,在起始的概率分布中找到概率最大对应的位置,作为起始位置,在终止的概率分布中找到概率最大对应的位置,作为终止位置,根据起始位置和终止位置对应的embedding,拼接后进行二分类判断是否为span,整体的loss包含了位置的loss是否是起点和终点以及span的loss是否是对应的起点和终点。将目标词(实

文章图片
#人工智能
tensorflow中的Hooks方法调用顺序

初始化:在创建一个MonitoredSession时,会按顺序执行以下操作:调用[Hooks]列表中每一个Hook的begin()函数通过scaffold.finalize()完成图graph的定义创建会话用Scaffold提供的初始化操作(op)来初始化模型如果给定checkpoint_dir中存在checkpoint文件,则用checkpoint恢复变量启动队列线程调用hook.after_c

tensorflow中sess.run执行原理及常见问题

1、执行原理:首先:对于sess.sun(fetch), 只有fetch里的图元素, 才会被执行, 不在fetch中的图节点是不会执行的;其次:sess.run()里面的执行顺序是按fetch列表中的元素,在计算图中的出现的先后顺序执行一次完后,最后统一输出,不会重复执行即:fetch列表中的节点打乱时, 取出来的值依然是一次流程图计算出来的结果,不是按照fetch列表中出现的先后顺序执行。2、常

Jupyter调试tensorflow多模块代码技巧

背景:现在有一个main模块,main模块引用了不同文件夹下的其他模块,如何在jupyter下快速调试。解决办法:1、将main,引用的其他模块,可以作为单独的cell,复制进去,然后从main入口,run all。2、将main模块在jupyter中重新生成对应的.ipynb文件,可以在jupyter里直接运行,将其他模块可以upload进jupyter里,...

Bert的NSP任务的loss原理

对一个句子的表征可以用CLS的embedding,bert的NSP任务,NSP 是一个预测两段文本是否在原文本中连续出现的二元分类损失。NSP 是一种二进制分类损失,用于预测原始文本中是否有两个片段连续出现,如下所示:通过从训练语料库中。正样本和负样本均以相同的概率 (概率各自为 0.5)采样。NSP任务在单个任务中融合了主题预测和连贯性预测,同一篇文档里的句子,更侧重是一个主题,前后两个句子的连

文章图片
#bert#人工智能#深度学习
linux arm系统安装tensorflow

首先要找跟python版本对应的tensoflow版本,在网上找了很久,没有找到跟2.7相关的aarch64的tf版本whl文件,可以通过编译源码,也可以通过whl进行安装。本篇介绍在python3.7下选用whl文件安装方法。OS为Linux version 4.19.71-arm64-desktop,安装tensorflow,安装通过编译好的whl二进制包进行安装。有些说后面配置环境变量,结果

文章图片
#tensorflow#python#人工智能
腾讯词向量使用

腾讯词向量腾讯词向量主页:https://ai.tencent.com/ailab/nlp/zh/embedding.html词向量下载地址:https://ai.tencent.com/ailab/nlp/zh/data/Tencent_AILab_ChineseEmbedding.tar.gz腾讯词向量(Tencent AI Lab Embedding Corpus for Chinese W

PaddleOCR实现对表格的提取

paddleocr, 图像识别,表格提取

文章图片
数据挖掘算法总结

一、关联规则挖掘1、 Apriori算法(1)Apriori算法原理Apriori算法使用频繁项集的先验知识,使用一种称作逐层搜索的迭代方法,k项集用于探索(k+1)项集。首先,通过扫描事务(交易)记录,找出所有的频繁1项集,该集合记做L1,然后利用L1找频繁2项集的集合L2,L2找L3,如此下去,直到不能再找到任何频繁k项集。最后再在所有的频繁集中找出强规则,即产生用户感兴趣的关联规

#数据挖掘#分类#聚类
    共 20 条
  • 1
  • 2
  • 请选择