logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【提示工程】Ch2(续)-提示技术(Prompt Technique)

如果你想亲手体验这棵“思维树”的生长细节,这里有一份非常棒的 Jupyter Notebook,基于论文《Large Language Model Guided Tree-of-Thought》完整复现了 ToT 框架:从树节点扩展、价值评估、到最佳路径回传,每一步都配有可运行代码与可视化,直接点开就能把玩。然而,传统 CoT 采用贪婪解码,一条路走到黑,容易陷入“一着不慎,满盘皆输”的窘境。多模

LiteratureReading:[2020] Exploring the Limits of Transfer Learning with a Unified Text-to-Text Trans

可能是这篇论文的主要作者之一,通常位于列表的首位。另一位主要作者,可能在研究中扮演了重要角色。同样是主要作者之一,参与了研究工作。参与了研究,可能是论文的共同作者。贡献了研究工作,是论文的作者之一。参与了研究,是论文的共同作者。Yanqi Zhou参与了研究,是论文的作者之一。Wei Li贡献了研究工作,是论文的共同作者。参与了研究,是论文的作者之一。此外,论文的编辑是Ivan Titov。这些作

文章图片
大模型-Layer Normalization 篇

有区别。Post LNa. 位置:layernorm 在残差链接之后b. 缺点:PostLN 在深层的梯度范式逐渐增大,导致使用 Post-LN 的深层 Transformer 容易出现训练不稳定的问题Pre-LNa. 位置:layernorm 在残差链接中b. 优点:相比于 Post-LN,Pre-LN 在深层的梯度范式近似相等,所以使用 Pre-LN 的深层 Transformer 训练更稳定

文章图片
#面试
LiteratureReading:[2017] Attention Is All You Need

隶属于Google Brain团队,Google Brain是Google的一个研究项目,专注于人工智能和机器学习的研究。他的电子邮件地址是avaswani@google.com。- 同样隶属于Google Brain团队,电子邮件地址为noam@google.com。- 隶属于Google Research,这是Google的一个研究部门,负责广泛的技术研究,包括机器学习、计算机视觉等。电子邮件

文章图片
自2000-2024年的自然语言处理及大模型相关的18篇经典论文汇总

以上论文涵盖了自然语言处理和大模型领域的关键进展,从词向量到预训练模型,再到多模态和生成式AI,展示了NLP技术的快速演进。如果需要更详细的论文列表或具体内容,可以参考相关资源。

文章图片
#自然语言处理#人工智能
【Python/机器学习/深度学习】学习笔记5——进阶学习Machine-Learning模型与算法应用——机器学习应用案例

局部可解释性:局部解释促进了对单个数据点或分布的一小部分的理解,例如输入记录和其相应预测值的集群,或预测值的十分位数和相应的输入行。局部可解释的模型无关解释(LIME)是一种算法,它提供了一种新颖的技术,以可解释和忠实的方式解释任何预测模型的结果。教程方法是2020年的,我的sklearn是24年最新版的,所以极有可能是新版的sklearn中版本没有了原来的库导致。全局可解释性:全局解释帮助我们理

文章图片
#python#机器学习#深度学习
【深度学习应用】基于Bert模型的中文语义相似度匹配算法[离线模式]

【代码】基于Bert模型的中文语义相似度匹配算法(离线模式)

文章图片
#bert#人工智能#深度学习
【Python/机器学习/深度学习】学习笔记1——零基础入门Python数据分析【Anaconda3-JupyterNotebook&seaborn版】

登录anaconda官网点击免费下载如果不想改盘可以直接无脑安装在C盘安装好后可以使用图形化导航启动(但是不提倡这种方式:一是因为图像化软件占用内存。二是运行缓慢)更推荐下面这种运行方式:命令行窗口启动项目转移到工作目录输入dir指令可以看到文件下面的全部项目目录使用命令行输入指令:jupyter notebook可以看到浏览器端显示出磁盘下面相同的目录解决JuPyter500:Internal

文章图片
#学习
【Python/机器学习/深度学习】学习笔记1——零基础入门Python数据分析【Anaconda3-JupyterNotebook&seaborn版】

登录anaconda官网点击免费下载如果不想改盘可以直接无脑安装在C盘安装好后可以使用图形化导航启动(但是不提倡这种方式:一是因为图像化软件占用内存。二是运行缓慢)更推荐下面这种运行方式:命令行窗口启动项目转移到工作目录输入dir指令可以看到文件下面的全部项目目录使用命令行输入指令:jupyter notebook可以看到浏览器端显示出磁盘下面相同的目录解决JuPyter500:Internal

文章图片
#学习
【深度学习应用】基于Bert模型的中文语义相似度匹配算法[离线模式]

【代码】基于Bert模型的中文语义相似度匹配算法(离线模式)

文章图片
#bert#人工智能#深度学习
    共 51 条
  • 1
  • 2
  • 3
  • 6
  • 请选择