logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习的一百个概念(12)学习率

🔍【深度解析学习率奥秘】从梯度下降到自适应算法,揭秘最新优化策略!涵盖金融风控、医疗影像、推荐系统等跨领域实战案例,详解Adam优化器原理与认知陷阱,更有贝叶斯调参、量子启发算法等前沿趋势。附梯度裁剪/预热等实用技巧,助你掌握模型训练核心参数!🚀

文章图片
#机器学习#人工智能
机器学习的一百个概念(10)假阳性率

深度解析机器学习核心指标假阳性率(FPR),涵盖医疗诊断到金融风控等真实场景应用,提供Python代码实战、阈值优化技巧及业务成本分析方法,独创自适应阈值技术与多模态融合策略,助数据科学家精准平衡模型性能与业务需求。

文章图片
#机器学习#人工智能
熵与交叉熵详解

🧠【机器学习数学必修课】深度解析熵与交叉熵核心原理!从理论推导到Python实战,揭秘决策树分类与神经网络训练的底层数学逻辑,手把手教你用交叉熵优化模型性能,附可运行代码与可视化案例,助你彻底攻克信息论核心概念!✨

文章图片
#人工智能#机器学习#数学
张量运算全解析

🚀 **深度学习核心解密:张量运算从入门到实战**揭秘多维数据处理的数学本质,详解GPU/TPU硬件加速原理,结合CNN、Transformer等模型实战代码,提供可视化思维导图+内存优化技巧。从张量降维到爱因斯坦求和,助你掌握并行计算精髓!

文章图片
#机器学习#人工智能#数学 +1
概率论基础概念

本文深入解析概率论核心概念在机器学习中的应用,结合垃圾邮件分类、随机森林特征选择等实战案例,通过可视化图表与公式推导,系统阐述从古典概型到贝叶斯定理的数学原理,帮助读者掌握算法底层逻辑,提升模型设计能力。

文章图片
#概率论#机器学习#人工智能 +1
大数据存储架构详解:数据仓库、数据集市、数据湖、数据网格、湖仓一体

本文以文字+思维导图+表格的形式详解了数据库、数据仓库、数据集市、数据湖、数据网格、湖仓一体之间的区别。

文章图片
#大数据#架构#数据仓库
典型的数据仓库模型实施过程详解

Kimball 模型实施过程Kimball 维度建模主要探讨**需求分析、高层模型、详细模型和模型审查**整个过程。构建维度模型一般要经历四个阶段:- 第一个阶段是高层设计时期定义业务过程维度模型的范围,提供每种星形模式的技术和功能描述;- 第二个阶段是详细模型设计时期,对每个星形模型添加属性和度量信息;- 第三个阶段是进行模型的审查、再设计和验证等工作;- 第四个阶段是产生详细设计文档,提交 E

#数据仓库
spark-sql 报错:The root scratch dir: /tmp/hive on HDFS should be writable.

前言本文隶属于专栏《Spark异常问题汇总》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!本专栏目录结构和参考文献请见 Spark异常问题汇总正文执行 spark-sql 脚本的时候报错:[hadoop@node2 ~]$ spark-sqlUsing Spark's default log4j profile: org/apache/spark/log4j-defa

#spark
spark left join 和 right join 的坑

前言本文隶属于专栏《Spark异常问题汇总》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!本专栏目录结构和参考文献请见 Spark异常问题汇总问题描述在开发 Spark SQL 的时候,遇到了一个问题一个小表 3G 左右, 然后需要 left join 两个大表,一个150G 左右,一个 80G 左右。发现没办法left join 的时候广播左表;尝试使用right

#spark
spark.executor.memoryOverhead

前言本文隶属于专栏《Spark 配置参数详解》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!本专栏目录结构和参考文献请见 Spark 配置参数详解正文spark.executor.memoryOverhead在 YARN,K8S 部署模式下,container 会预留一部分内存,形式是堆外,用来保证稳定性,主要存储nio buffer,函数栈等一些开销这部分内存,你不

#spark#yarn
    共 180 条
  • 1
  • 2
  • 3
  • 18
  • 请选择