logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

低成本指令数据集构建:《Self-Instruct: Aligning Language Model with Self Generated Instructions》阅读笔记

低成本指令数据集构建:《Self-Instruct: Aligning Language Model with Self Generated Instructions》阅读笔记

文章图片
#语言模型#人工智能#论文阅读
容器Ubuntu 18.04.5 跑通CNdeepdive教程

说明:此文档是在CNdeepdive的教程:“Tutorial: 抽取公司实体间的股权交易关系” ,根据实际使用情况做了一些修改和说明(主要在教程前半部分有一些修改,后面内容是一致的)系统:Ubuntu 18.04.5, 是安装在k8s上的一个容器。0. 环境准备0.1. deepdive安装下载CNdeepdive后解压,进入目录运行install.sh,选择1安装deepdive。说明1: 如

#知识图谱#ubuntu
大模型对齐方法笔记一:DPO及其变种IPO、KTO、CPO

大模型对齐方法DPO及其变种IPO、KTO、CPO原理

文章图片
#机器学习#人工智能
Evol-Instruct:让LLM将指令改写的更复杂

Evol-Instruct方法出自论文 WizardLM: Empowering Large Language Models to Follow Complex Instructions,也是利用大模型生成指令的方法,它可以生成相对复杂和多样的指令数据集。

文章图片
#论文阅读
激活函数小结:ReLU、ELU、Swish、GELU等

激活函数Sigmoid、Tanh、ReLU、Leaky ReLU、PReLU、ELU、SoftPlus、Maxout、Mish、Swish、GELU、SwiGLU、GEGLU 总结

文章图片
#深度学习
LLaMA模型论文《LLaMA: Open and Efficient Foundation Language Models》阅读笔记

meta的LLaMA模型对应的论文《LLaMA: Open and Efficient Foundation Language Models》阅读笔记

文章图片
#语言模型#论文阅读
到底了