zcc_0015 个人主页

@zcc_0015

zcc_0015

2023-03-13 15:54:07 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

mac安装低版本的php

mac安装php

#大数据 #php

大模型做实体识别任务的原理

对于每个位置的embedding进行T转化生成起始位置的概率分布，同理可生成终止位置的概率分布，在起始的概率分布中找到概率最大对应的位置，作为起始位置，在终止的概率分布中找到概率最大对应的位置，作为终止位置，根据起始位置和终止位置对应的embedding，拼接后进行二分类判断是否为span，整体的loss包含了位置的loss是否是起点和终点以及span的loss是否是对应的起点和终点。将目标词（实

#人工智能

tensorflow中的Hooks方法调用顺序

初始化：在创建一个MonitoredSession时，会按顺序执行以下操作：调用[Hooks]列表中每一个Hook的begin()函数通过scaffold.finalize()完成图graph的定义创建会话用Scaffold提供的初始化操作(op)来初始化模型如果给定checkpoint_dir中存在checkpoint文件，则用checkpoint恢复变量启动队列线程调用hook.after_c

tensorflow中sess.run执行原理及常见问题

1、执行原理：首先：对于sess.sun(fetch), 只有fetch里的图元素, 才会被执行, 不在fetch中的图节点是不会执行的；其次：sess.run()里面的执行顺序是按fetch列表中的元素，在计算图中的出现的先后顺序执行一次完后，最后统一输出，不会重复执行即：fetch列表中的节点打乱时，取出来的值依然是一次流程图计算出来的结果，不是按照fetch列表中出现的先后顺序执行。2、常

Jupyter调试tensorflow多模块代码技巧

背景：现在有一个main模块，main模块引用了不同文件夹下的其他模块，如何在jupyter下快速调试。解决办法：1、将main，引用的其他模块，可以作为单独的cell，复制进去，然后从main入口，run all。2、将main模块在jupyter中重新生成对应的.ipynb文件，可以在jupyter里直接运行，将其他模块可以upload进jupyter里，...

Bert的NSP任务的loss原理

对一个句子的表征可以用CLS的embedding，bert的NSP任务，NSP 是一个预测两段文本是否在原文本中连续出现的二元分类损失。NSP 是一种二进制分类损失，用于预测原始文本中是否有两个片段连续出现，如下所示：通过从训练语料库中。正样本和负样本均以相同的概率 (概率各自为 0.5)采样。NSP任务在单个任务中融合了主题预测和连贯性预测，同一篇文档里的句子，更侧重是一个主题，前后两个句子的连

#bert #人工智能 #深度学习

linux arm系统安装tensorflow

首先要找跟python版本对应的tensoflow版本，在网上找了很久，没有找到跟2.7相关的aarch64的tf版本whl文件，可以通过编译源码，也可以通过whl进行安装。本篇介绍在python3.7下选用whl文件安装方法。OS为Linux version 4.19.71-arm64-desktop,安装tensorflow，安装通过编译好的whl二进制包进行安装。有些说后面配置环境变量，结果

#tensorflow #python #人工智能

腾讯词向量使用

腾讯词向量腾讯词向量主页：https://ai.tencent.com/ailab/nlp/zh/embedding.html词向量下载地址：https://ai.tencent.com/ailab/nlp/zh/data/Tencent_AILab_ChineseEmbedding.tar.gz腾讯词向量（Tencent AI Lab Embedding Corpus for Chinese W

PaddleOCR实现对表格的提取

paddleocr，图像识别，表格提取

数据挖掘算法总结

一、关联规则挖掘1、 Apriori算法（1）Apriori算法原理Apriori算法使用频繁项集的先验知识，使用一种称作逐层搜索的迭代方法，k项集用于探索(k+1)项集。首先，通过扫描事务（交易）记录，找出所有的频繁1项集，该集合记做L1，然后利用L1找频繁2项集的集合L2，L2找L3，如此下去，直到不能再找到任何频繁k项集。最后再在所有的频繁集中找出强规则，即产生用户感兴趣的关联规

#数据挖掘 #分类 #聚类

共 20 条

请选择