logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大语言模型--数据

另外,来自patents.google.com的一些文本是自动生成的,因此可能存在系统性的错误:例如,用外国的官方语言(如日语)提交的专利将自动翻译成英语;也就是说,虽然OpenWebText并非OpenAI直接发布的WebText的副本,但它遵循了WebText的制作思路和方法,目的是尽可能地模拟和复现WebText的数据特性和结构。OpenWebText从Reddit提交的数据集中提取所有UR

#语言模型#人工智能#机器学习
强化学习--稀疏奖励

强化学习--稀疏奖励

#人工智能
强化学习--DQN

强化学习--DQN

#人工智能
大语言模型--引言

语言模型(LM)的经典定义是一种对令牌序列(token)的概率分布。假设我们有一个令牌集的令牌表。的次方,概率分布可能不会加到1。自回归语言模型的特点是它可以利用例如前馈神经网络等方法有效计算出每个条件概率分布。T=∞:然而,从整个表上的均匀分布中采样,如果我们仅仅将概率提高到。观察上,一个好的语言模型应具有语言能力和世界知识。T=0:确定性地在每个位置我选择最可能的代币。T=1:从纯语言模型“正

#语言模型#人工智能#自然语言处理
深入浅出PyTorch - Pytorch进阶训练技巧

PyTorch进阶训练技巧深入浅出PyTorchPyTorch进阶训练技巧动态调整学习率模型微调提示:以下是本篇文章正文内容,下面案例可供参考学习率的选择是深度学习中一个困扰人们许久的问题,学习速率设置过小,会极大降低收敛速度,增加训练时间;学习率太大,可能导致参数在最优解两侧来回振荡。但是当我们选定了一个合适的学习率后,经过许多轮的训练后,可能会出现准确率震荡或loss不再下降等情况,说明当前学

#pytorch
数据分析--模型建立和评估

数据分析–模型建立和评估数据分析数据分析--模型建立和评估一、模型搭建1.1导入数据集1.2读取清洗过的数据集1.3切割训练集和测试集1.4模型创建1.5输出模型预测结果二、模型评估2.1引入库2.2交叉验证2.3混淆矩阵一、模型搭建1.1导入数据集import pandas as pdimport numpy as npimport seaborn as snsimport matplotlib

#python#机器学习
到底了