logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大数据面试题——数据库

文章目录@[toc]MySQL常用的存储引擎有什么区别?为什么要用索引?索引算法有哪些?Hash索引和B+树的区别?B树和B+树的区别?数据库为什么使用B+树而不是B树?索引的种类有哪些?创建索引的原则有哪些?什么是最左匹配原则?什么是聚簇索引,什么是非聚簇索引?数据库的三大范式是什么?索引在什么情况下会失效?什么是数据库的事务?事务的四大特性(ACID)是什么?数据库的并发一致性问题数据库的隔离

文章图片
#数据库#mysql#database
ml-4-1-神经网络-表述( Neural Networks- Representation)

神经网络:表述( Neural Networks: Representation)神经网络:表述Neural Networks: Representation当我们使用 x 1 、x 2 的多次项式进行预测时,我们可以应用的很好。之前我们已经看到过,使用非线性的多项式项,能够帮助我们建立更好的分类模型。假设我们有非常多的特征,例如大于 100 个变量,我们希望用这 100 个特征来构建一个非线性的

#神经网络#算法#python +2
ml-5-1-神经网络的学习( Neural Networks Learning)

神经网络的学习( Neural Networks Learning)Cost Function代价函数首先引入一些便于稍后讨论的新标记方法:假设神经网络的训练样本有 m 个,每个包含一组输入 x 和一组输出信号 y,L 表示神经网络层数,S l 表示每层的 neuron 个数(SL 表示输出层神经元个数),S L 代表最后一层中处理单元的个数。将神经网络的分类定义为两种情况:二类分类和多类分类,二

#神经网络#算法#python +2
大数据进阶之路——Spark SQL基本配置

文章目录Spark安装编译失败环境搭建Standalone本地IDEHiveContextAPPSparkSessinonSpark ShellSpark Sqlthriftserver/beeline的使用jdbcMapReduce的局限性:1)代码繁琐;2)只能够支持map和reduce方法;3)执行效率低下;4)不适合迭代多次、交互式、流式的处理;框架多样化:1)批处理(离线):MapRed

文章图片
#spark#sql#big data
ml-6-2-机器学习系统的设计Machine Learning System Design

机器学习系统的设计Machine Learning System DesignPrioritizing What to Work On本周以一个垃圾邮件分类器算法为例进行讨论。为了解决这样一个问题,我们首先要做的决定是如何选择并表达特征向量 x。我们可以选择一个由 100 个最常出现在垃圾邮件中的词所构成的列表,根据这些词是否有在邮件中出现,来获得我们的特征向量(出现为 1,不出现为 0),尺寸为

#大数据#编程语言#神经网络 +1
数据仓库设计规范(更新中)

文章目录设计规范逻辑架构技术架构分层设计主题划分分级管理命名规范层级任务表字段模型规范建模方法建模工具血缘关系维度退化元数据管理开发规范脚本注释字段别名脚本格式流程规范设计规范逻辑架构数据采集数据存储数据计算数据展现技术架构数据采集→Kafka→hdfs→Flink→HBase分层设计ods→dw→dws→sh→主题划分面向主题域管理为了提高指标管理的效率,你需要按照业务线,主题域,和业务过程三级

文章图片
#big data
003.精读《MapReduce: Simplified Data Processing on Large Clusters》

综上所述,MapReduce编程模型通过用户定义的map和reduce函数,将复杂的数据处理任务转化为直观的操作,并自动并行化处理,极大提高了计算效率,尤其在大规模集群环境中表现出色。其内置的容错机制确保了数据处理的可靠性,使得MapReduce在文本分析、数据挖掘和网页索引等多个领域得到广泛应用。更重要的是,MapReduce降低了大数据技术的使用门槛,推动了数据处理效率的提升,并促进了大数据生

文章图片
#mapreduce#大数据
数据仓库核心:揭秘事实表与维度表的角色与区别

在本篇博文中,我们深入探讨了数据仓库中事实表和维度表的关键角色与它们之间的显著差异。事实表,作为数据仓库的心脏,承载着量化的业务度量,而维度表则为这些度量提供了必要的上下文和解释。这种精心设计的结构不仅使我们能够高效地存储和检索数据,而且还能更加灵活和深入地进行数据分析,为企业的决策提供强有力的支持。最终,理解事实表和维度表的真正价值在于它们如何共同作用,帮助我们从数据中提取出有意义的洞察,推动业

文章图片
#数据仓库#大数据#数据库架构 +2
[特殊字符] DeepSeek使用手册:轻松驾驭AI的终极指南

大家好!今天我们要介绍一套非常实用的DeepSeek使用手册合集。无论你是AI新手还是有一定经验的用户,这些资料都将帮助你从零开始,逐步掌握DeepSeek的使用技巧!

文章图片
#人工智能
ml-10-2-应用实例-图片 文字识别( ( Application Example-Photo OCR) )

应用实例-图片 文字识别( ( Application Example-Photo OCR) )问题描述和流程图Problem Description and Pipeline图像文字识别应用所作的事是,从一张给定的图片中识别文字。这比从一份扫描文档中识别文字要复杂的多为了完成这样的工作,需要采取如下步骤:文字侦测(Text detection)——将图片上的文字与其他环境对象分离开来字符切分(C

#机器学习#人工智能#深度学习
    共 38 条
  • 1
  • 2
  • 3
  • 4
  • 请选择