logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

FinBert模型:金融领域的预训练模型

在本次基线测试中,我们以金融场景中所遇到四类实际业务问题和数据入手进行对比实验,包括金融类短讯类型分类任务、金融文本行业分类、金融情绪分析任务以及金融类实体识别任务。对比 FinBERT 和 Google 原生中文BERT、 BERT-wwm、RoBERTa-wwm-ext 这三种通用领域的预训练模型可知,FinBERT效果提升显著,在 F1-score 上平均可以提升2~5.7个百分点。

文章图片
BloombergGPT—金融领域大模型

在金融领域任务上,BloombergGPT综合表现最好;在通用任务上,BloombergGPT的综合得分优于相同参数量级的其他模型,并且在某些任务上的得分要高于参数量更大的模型。这都说明,开发金融专用的大语言模型在金融领域取得好效果的同时,并没有以牺牲模型通用能力为代价。

文章图片
#金融
基于ChatGLM-Med与HuaTuo的微调部署

如何基于领域知识对类ChatGPT模型进行微调,以提升类ChatGPT模型在领域的问答效果?有下面两个模型,一起来看看微调后的效果如何。: 基于中文医学知识的ChatGLM模型微调:基于中文医学知识的LLaMA微调模型。

文章图片
#人工智能
ChatGLM-6B微调与部署

ChatGPT所展现出的强大能力,足以使许多行业发生翻天覆地的变化,而通过微调及部署较小的模型,在一些垂直领域达到和ChatGPT相近的效果,显得尤为重要。本文从模型参数,中文,微调难度等多角度考虑,选取了ChatGLM-6B模型来进行实验,主要分为3个部分:基于ChatGLM-6B的部署,基于peft框架的LoRA微调ChatGLM-6B,基于P-Tuning v2微调ChatGLM-6B(官方

文章图片
#自然语言处理
基于LoRA微调部署Stable Diffusion【免费试用阿里云】

Stable Diffusion 是一种文本到图像的潜在扩散模型,由 Runway 和慕尼黑大学合作构建,第一个版本于 2021 年发布。目前主流版本包含 v1.5、v2和v2.1。它主要用于生成基于文本描述得详细图像,也应用于其他任务,如修复图像、生成受文本提示引导的图像到图像的转换等。本文主要讲解如何免费在**阿里云交互式建模(PAI-DSW)**中基于LoRA微调并部署 Stable Dif

文章图片
#阿里云#云计算
LLM模型微调方法及经验总结

在现在这大规模语言模型(LLM)盛行的时代,由于模型参数和显卡配置的因素,预训练基本是大公司或者高校可以完成的事情,而对于小公司或个人,则只能对LLM进行微调,也就是说微调少量或额外的模型参数,固定大部分预训练模型(LLM)参数,从而大大降低了计算和存储成本,同时,也尽可能实现与全量参数微调相当的性能。本文总结几种主流的微调方法,主要包括Freeze方法、P-tuning方法、Lora方法和Qlo

文章图片
Hive--sql中的explode()函数和posexplode()函数

实现多列转多行先创建一个txt文件(最好是用notepad++,注意将编码设置为utf-8)如下:将该文件放到hive下的一个目录中(可以自己指定目录),我是将它放在一个data目录中在hive的一个数据库中创建一个表来进行操作,指定表名test.a,加入两个字段id和tim,并在一行中用空格分隔,每行之间用\n进行分隔。create table if not exists tes...

基于LoRA进行Stable Diffusion的微调

微调时只需要使用以下命令运行 train_text_to_image_lora.py 文件即可。需要根据下载的路径文件地址对相应的参数进行修改,如。样本数据量为883,这里设置了train_batch_size为2,max_train_steps为7500,数据集一共883条样本,包含两个部分:image(图)和 text(文),如下图所示。也可以根据GPU资源调整相应的参数,如。显存占用约11个

文章图片
浅谈垂直领域大模型

在谈垂直领域大模型之前,我们先对目前的大模型做一个简单的梳理,看看大模型都有哪些。

文章图片
#人工智能#深度学习
【self-instruct方式生成语料代码实战】

2023年3月14日,斯坦福发布了,该模型是对Meta的LLaMA &B进行了微调,且只花费了不到600美元。其中,微调过程:在8个80GB A100上训练了3个小时,不到100美元;而微调所用数据是使用OpenAI的API,通过self-instruct方式生成的52K指令数据,花费了500美元。self-instruct是一种将预训练语言模型与指令对齐的方法。可以通过模型自己来生成数据,而不需

文章图片
#人工智能#深度学习#机器学习
    共 21 条
  • 1
  • 2
  • 3
  • 请选择