
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
什么库是Databricks公司发布的基于Spark平台的并行图计算库A. GraphFramesB. Spark StreamingC. DataFrameD. GraphX

6. (单选题)协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度(),并将这些用户喜欢的项推荐给有相似兴趣的用户。7. (单选题)通过数据收集和展示数据背后的(),运用丰富的、具有互动性的可视化手段,数据新闻学成为新闻学作为一门新的分支进入主流媒体,即用数据报道新闻。1 面包、牛奶 2 面包、尿布、啤酒、鸡蛋 3

Spark控制日志输出内容的方式有修改log4j.properties(或者)代码中使用setLogLevel(logLevel)控制日志输出

在搜索框中输入题目。

什么提供用于构建,评估和调整 ML Pipelines 的工具。A. UtilitiesB. FeaturizationC. PipelinesD. ML Algorithms

SparkStreaming除了从套接字端口,监控HDFS外,还可以从kafka、flum等数据源接收并处理数据

Spark的共享变量,分为累加器accumulator与广播变量 Broadcast

(单选题)下面哪个不是Spark 的四大组件A.Spark StreamingB.park RC.GraphxD.Mlib

简答题)解释代码:df.insert(2,'insert_t',list('abcdef'))在第3列插入一列,列名为‘inser_t’,列值为a,b,c,d,e,f正确答案:

在Ubuntu系统中,软件的安装是通过什么命令加软件名这种方式进行的A. apt-get upgradeB.apt-get updateC. apt-get uninstallD.apt-get install
