海阔天空&沫语个人主页

@healthsun

海阔天空&沫语

2022-10-24 18:31:50 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

zeppelin连接 phoenix 注意事项

zepplelin 连接 phoenix 时，Phoenix 报错：Error: ERROR 726 (43M10): Inconsistent namespace mapping properties. Cannot initiate connection as SYSTEM:CATALOG is found but client does not have phoenix.schema.isN

#hbase #数据库 #database

机器学习及flinkML算法学习

机器学习及flinkML算法机器学习概念机器学习算法根据训练数据(training data)使得表示算法行为的数学目标最大化，并以此来进行预测或者做出决定。机器学习分为分类、回归、聚类等，每种都有不一样的目标。应用场景和处理流程所有的算法都需要定义每个数据点的特征(feature)集->输入；正确的定义特征才是机器学习中最有挑战的部分。大多数算法都是专为数据特征(就是一...

hive数据仓库-bucket分桶

hive中table可以拆分成partition， table和partition可以通过CLUSTERED BY 进一步分bucket，bucket中的数据可以通过SORT BY排序。bucket主要作用：数据sampling提升某些查询操作效率，例如mapside join 需要特别注意的是：clustered by和sorted by不会影响数据的导入，这意味着，用户必须自己负责数据如何如何

#大数据 #hive

用JADE创建多agent系统

1、代理平台 FIPA定义的一个agent平台的标准模型，如下图所示：AMS是管理控制进出和使用AP的agent，一个平台只有一个AMS，它提供百页和生命周期服务，维护AID目录和agent状态，为了获取有效的AID，每个agent都必须在AMS上注册。DF是平台上提供默认黄页服务的agent。消息传输系统也叫agent通信通道(ACC），有软

文本特征提取方法研究

一、课题背景概述文本挖掘是一门交叉性学科,涉及数据挖掘、机器学习、模式识别、人工智能、统计学、计算机语言学、计算机网络技术、信息学等多个领域。文本挖掘就是从大量的文档中发现隐含知识和模式的一种方法和工具,它从数据挖掘发展而来,但与传统的数据挖掘又有许多不同。文本挖掘的对象是海量、异构、分布的文档(web);文档内容是人类所使用的自然语言,缺乏计算机可理解的语义。传统数据挖掘所处

机器学习及flinkML算法学习

到底了