logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

风控模型常见问题

1.数据驱动型金融场景下,风控模型的种类有哪些?获客阶段:用户响应模型,风险预筛选模型授信阶段:申请评分模型,反欺诈模型,风险定价模型,收益评分模型贷中阶段:行为评分模型,交易欺诈模型,客户流失模型贷后阶段:预催收模型,早期催收模型,晚期催收模型2.简单描述一些风控建模的流程?前期准备工作阶段:不同的模型针对不同的业务场景,在建模项目开始前需要对业务的逻辑和需求有清晰的理解,明确模型的业务目标和作

#数据挖掘#机器学习
logistic regression--sas逐步回归推导验证

1、逻辑回归定义事件发生的概率为其中:因此对于输入x分类结果为类别1和类别0的概率分别为:(1)式综合起来可以写成:取似然函数为:对数似然函数为:实际求解中通常取 -2log L求解变量系数就是使用梯度下降法求 -2log L 的最小值,sas logistic 采用牛顿法 和Fisher scoring法(默认)。先说几个概念1、似...

清晰易懂,基于pytorch的DeepFM的完整实验代码

DeepFM延续了Wide&Deep的双模型组合的结构,改进之处就在于FM(因子分解机)替换了原来的Wide部分,加强浅层网络部分的特征组合能力。模型结构如下图所示(顶会发这么模糊的图有点不应该),左边的FM部分与右边的DNN共享相同的embedding层,左侧FM对不同特征域的Embedding进行两两交叉,也就是将Embedding向量当做FM中的特征隐向量。隐向量的做法,其实与矩阵分解用隐向

#pytorch#深度学习#机器学习
清晰易懂,基于pytorch的DeepFM的完整实验代码

DeepFM延续了Wide&Deep的双模型组合的结构,改进之处就在于FM(因子分解机)替换了原来的Wide部分,加强浅层网络部分的特征组合能力。模型结构如下图所示(顶会发这么模糊的图有点不应该),左边的FM部分与右边的DNN共享相同的embedding层,左侧FM对不同特征域的Embedding进行两两交叉,也就是将Embedding向量当做FM中的特征隐向量。隐向量的做法,其实与矩阵分解用隐向

#pytorch#深度学习#机器学习
深度学习库DeepCTR-Torch中deepFM

deepFM广泛应用于推荐等稀疏数据的场景,发现一个的三方库,用自有数据测试了下,但是数据集基本上都是连续数据,可能没有体现deepFM的优势。这个数据集的样本分布很均衡,比较容易训练,但最终效果auc不如树模型lgb,后续用其他数据集继续观察。

#深度学习#python#机器学习
sas构建评分卡模型过程详解(二):变量筛选及逻辑回归

上一篇已经将所有变量都转化为woe值的形式,这里再另外补充一个小技巧—dummy变量的使用。    1.有时候我们的数据来源可能不是很真实,如客户自己填写的婚姻状况,假设婚姻状况不会要求客户提供证明,但此时我们想加入这个变量,可以考虑加入”是否未婚或者离异”,此时认为客户填写未婚或者离异的相比填写已婚的较为真实。  2.在上一篇连续变量分箱分箱时有说到,当变量是U型时强行改变变量的趋势可

#机器学习#逻辑回归
python变量衍生apply速度优化及改进

python数据分析生成衍生变量的时候,使用apply的方法速度很慢,尤其是遇到批量生成好几千变量,且数据量比较大的情况下。N = 10A_list = np.random.randint(1, 100, N)B_list = np.random.randint(1, 100, N)df = pd.DataFrame({'A': A_list, 'B': B_list})df.head()#AB#

#python#数据分析
到底了