logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

一文速通:命名实体识别(NER)训练方案与标注方法全解析

本文介绍了命名实体识别(NER)的三种实现方案及数据标注方法。方案一使用深度学习模型(Bert-CRF),适合数据充足的特定领域;方案二通过大模型微调(Qwen),平衡效果与成本;方案三Prompt驱动大模型(GPT-4),适合零标注成本的快速迭代。在数据标注方面,详细说明了实体类型定义、BIO/BIOES标注体系以及JSON/XML格式的处理方法。建议根据具体场景选择方案,并采用兼容大模型和深度

新手教程之使用LLaMa-Factory微调LLaMa3

如果你尝试过微调大模型,你就会知道,大模型的环境配置是非常繁琐的,需要安装大量的第三方库和依赖,甚至需要接入一些框架。但是大模型微调的方法又是非常类似的,那有没有一种工具可以统一这些操作,让大模型微调变成一个简单易上手的事情,LLaMa-Factory就是为了解决这个问题应运而生

文章图片
大模型分布式训练之DeepSpeed优化器并行(ZeRO)原理

由于大模型参数量非常庞大,所以我们常常需要用到分布式训练来解决训练过程中计算资源不足的问题,现在也出现了很多大模型相关的分布式训练框架,但是使用的比较多的还是deepspeed的数据并行,那么deepspeed是怎么实现数据并行的呢。

文章图片
从huggingface上下载数据集具体步骤

最近需要从huggingface上下载一个数据集,发现不能像模型那样能直接点击下载,需要通过代码来获取,很麻烦,谨以此博客作为记录

文章图片
django对数据库中的表进行重新生成

关于详细的数据表生成见博文:https://blog.csdn.net/David_house/article/details/131385460?

文章图片
#数据库#django#python
一文速通:命名实体识别(NER)训练方案与标注方法全解析

本文介绍了命名实体识别(NER)的三种实现方案及数据标注方法。方案一使用深度学习模型(Bert-CRF),适合数据充足的特定领域;方案二通过大模型微调(Qwen),平衡效果与成本;方案三Prompt驱动大模型(GPT-4),适合零标注成本的快速迭代。在数据标注方面,详细说明了实体类型定义、BIO/BIOES标注体系以及JSON/XML格式的处理方法。建议根据具体场景选择方案,并采用兼容大模型和深度

从huggingface上下载数据集具体步骤

最近需要从huggingface上下载一个数据集,发现不能像模型那样能直接点击下载,需要通过代码来获取,很麻烦,谨以此博客作为记录

文章图片
文本向量化

因为文本不能够直接被模型计算,所以需要将其转化为向量。把文本转化为向量有两种方法:①转化为one-hot编码②转化为word embedding

文章图片
#深度学习#机器学习#人工智能
windows平台下Qt Creator的下载与安装流程

下载地址:https://download.qt.io/archive/

文章图片
#c++#qt
vue通过点击事件弹出弹窗页面

步骤一创建一个弹窗页面,我们给该页面命名为dialogComponent,弹窗页面中要设置以下内容:<template><!--1.首先,弹窗页面中要有el-dialog组件即弹窗组件,我们把弹窗中的内容放在el-dialog组件中--><!--2.设置:visible.sync属性,动态绑定一个布尔值,通过这个属性来控制弹窗是否弹出--><el-dial

    共 20 条
  • 1
  • 2
  • 请选择