logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【阿里强化学习01】基于强化学习的实时搜索排序策略调控

【背景】让搜索引擎对不同特点的用户做出针对性的排序,以此带动基于搜索引导下的成交。传统方法Learning to Rank(LTR)⽅法主要是在商品维度进⾏学习,根据商品的点击、成交数据构造学习样本,回归出排序权重。Contextual LTR ⽅法可以根据⽤户的上下⽂信息对不同的⽤户给出不同的排序结果,但它没有考虑到⽤户搜索商品是⼀个连续的过程。⽤户最终选择购买或不够买商品...

启发式搜索算法&最短路径搜索算法概述

启发式搜索算法概述随着计算机性能的提高,搜索算法利用计算机的计算资源有目的穷举一个问题解空间的部分或所有的可能情况,从而求解出问题的解。现阶段搜索类算法一般有深度/广度优先搜索、枚举算法、A-Star算法、蒙特卡洛树搜索等,目前众多的搜索算法都从以下几个方面来降低搜索的时间和复杂性;1、搜索前根据条件降低搜索规模2、根据问题的约束条件进行剪枝3、利用搜索过程中的中间解,避免重复计算启发式...

代码提示 | 代码提示在文本+代码LLM中激发条件推理能力

代码提示(Code Prompting)是指将自然语言(NL)问题转化为类似编程语言的伪代码形式,然后将这段代码作为提示输入给语言模型,请其生成最终答案的方法。形式上,代码提示由两部分组成:(1)注释中保留的原始NL描述;(2)代码语句体现的隐含逻辑关系,特别是条件推理逻辑。图1展示了一个NL问题转化为代码提示的例子。代码提示有以下几个显著特点:巧妙地利用了编程语言的语法结构来明确表达NL问题中暗

文章图片
Nature子刊!丹麦全国人口数据投喂大模型,用来预测寿命了(逆天改命有了可能)

该论文提出了一个基于Transformer的life2vec模型,用于处理大规模人口注册数据,并在早期死亡率预测和人格预测两个任务上进行了实验验证。实验主要探究模型预测性能、概念嵌入空间的语义结构以及个体表示向量等方面。本论文针对利用社会经济和医疗数据预测个人生活轨迹和生活结果的问题,提出了一种基于Transformer的life2vec模型。通过将生活事件序列映射到高维嵌入空间,并利用该嵌入表示

文章图片
#人工智能
Nature子刊!丹麦全国人口数据投喂大模型,用来预测寿命了(逆天改命有了可能)

该论文提出了一个基于Transformer的life2vec模型,用于处理大规模人口注册数据,并在早期死亡率预测和人格预测两个任务上进行了实验验证。实验主要探究模型预测性能、概念嵌入空间的语义结构以及个体表示向量等方面。本论文针对利用社会经济和医疗数据预测个人生活轨迹和生活结果的问题,提出了一种基于Transformer的life2vec模型。通过将生活事件序列映射到高维嵌入空间,并利用该嵌入表示

文章图片
#人工智能
一文彻底搞懂信息熵、相对熵、交叉熵和条件熵(含例子)

熵:就是描述信息的不确定的程度,统计学中,对事件的发生情况可以通过概率P定量的描述出来,熵也是一种统计学定量描述,是对信息的不确定程度的描述,这种描述也是通过“概率P”来描述的。对于某个事件的信息熵的计算公式如下:式中X代表事件,事件X的发生存在n中可能性,当我们知道每一种可能性情况下的发生概率值时,就能通过上式子计算得到信息熵值。【例子】序号事件...

#机器学习#深度学习
综述 | 走向图对比学习:综述与展望

本论文针对图表示学习中的图对比学习(GCL)方法进行了全面综述。文章系统总结了GCL的基本原理,包括数据增广策略、对比模式和优化目标等方面。并进一步探讨了GCL在弱监督学习、迁移学习等数据高效学习场景中的扩展应用。最后,讨论了GCL在药物发现、基因组学分析、推荐系统等实际领域的应用,展望了该领域面临的挑战和未来的发展方向。

文章图片
地统计学之变异函数深入理解与分析

【变异函数基本概念】背景:理解变异函数前不得不先了解克里金方法,克里金方法是地统计学中及其重要的一个概念,克里金法通过对已知点的数据进行拟合以确定制定半径或制定数量点内每个位置的输出值(无中生有)。克里金方法是个多步骤过程,包括数据的探索性统计分析、变异函数建模和创建表面、研究方差表面。通过克里金方法得到一个较好的拟合结果是一直以来大家所追求的。理论:邻近事物比远处事物更相似这一假设加...

Tensorflow中k.gradients()和tf.stop_gradient()的深入理解

上周在实验室开荒某个代码,看到中间这么一段,对Tensorflow中的stop_gradient()还不熟悉,特此周末进行重新并总结。y = xx + K.stop_gradient(rounded - xx)这代码最终调用位置在tensoflow.python.ops.gen_array_ops.stop_gradient(input, name=None),关于这段代码...

常见CNN模型 之AlexNet网络

常见CNN模型 之AlexNet网络论文出处《 ImageNet Classification with Deep Convolutional Neural Networks 》AlexNet网络在2012年内的ImageNet比赛中脱颖而出,性能大幅超越传统基于SVM等算法。其作者是多伦多大学的Alex Krizhevsky,因此网络命名为AlexNet网络。当然站在现在看AlexNet网...

    共 16 条
  • 1
  • 2
  • 请选择