小基基o_O 个人主页

@Yellow_python

小基基o_O

2022-09-29 17:27:40 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

前程无忧——爬虫+数据分析

项目介绍主要目标：1、了解与IT行业的就业市场信息，打造自身的职业规划路线2、根据市场的主流技术和需求，不断完善自身技能树环境：Linux、Python、Pycharm技术：1、网页数据采集：scrapy、urllib、re2、数据存储：MySQL3、文字切割、词频统计：pandas、jieba、collections4...

记一些女装数据分析

服装维度尺码：XS、S、M、L、XL一级分类：上半身、下半身、全身季节：春、夏、秋、冬价格类型：正价、特价、折扣价、降价、优惠券…价格段：廉、贵年龄段：婴儿、儿童、少年、青年、中年面料：棉布、麻布、丝绸、、呢绒、皮革、化纤、混纺、莫代尔厚度：厚、薄长度：长、中、短、超短是否展陈（通常，贵价连衣裙会用衣架挂起展示，甚至穿假人身上，而便宜T恤则折叠堆放）季节状态：季前、当季、过季服装的重要特

#数据分析 #数据挖掘

大数据（8o）流计算SparkStreaming

Spark Streaming简介环境准备入门示例队列（本地测试用，方便！）消费Kafka（工作环境常用，重点！）Spark Streaming：流式数据实时处理框架特点：低延时、高吞吐discretized stream：离散化流可从Kafka、TCP套接字等源摄入数据，经SparkStreaming处理，最终送到文件系统、数据库、实时仪表板…小批处理方式，会有少量延时

创建钉钉群聊机器人，使用Python发送消息，使用DolphinScheduler发送告警

1.1、创建群（然后将别人移出群聊）1.2、单击群设置>智能群助手1.3、在机器人管理页面选择自定义机器人1.4、输入机器人名字1.5、创建完成，要记下Webhook(就是消息发送的地址)1.6、机器人创建完成后会在群报道，点击机器人头像也可查看Webhook。使用DolphinScheduler发送告警

#python #机器人

Python+gensim-文本相似度分析（小白进）

from gensim import corpora, models, similaritiesimport jieba# 生成分词列表def cut(sentence):generator = jieba.cut(sentence)words = [word for word in generator]print(words)return word...

sklearn各聚类算法比较

数据读取import requests, re, pandas as pddef download():url = 'https://blog.csdn.net/Yellow_python/article/details/81240395'header = {'User-Agent': 'Opera/8.0 (Windows NT 5.1; U; en)'}...

Python【jieba】词性标注表

Python、jieba、0.39版flagcne.g.a形容词高明尖诚粗陋冗杂丰盛顽皮很贵挺好用 …ad副形词努目完全努力切面严实慌忙明确仓惶详细 …ag形语素详笃睦奇洋裸渺忤虐黢怠峻悫鄙秀 …an名形词麻生猥琐腐生困苦危难负疚刚愎危险悲苦 …b区别词...

大数据（8n）图解Spark行转列pivot数据透视表

文章目录1、透视1.1、SQL1.2、Spark2、逆透视2.1、SQL2.2、Spark3、Appendix1、透视1.1、SQLSELECT * FROM tPIVOT (SUM(d) FOR c IN ('c1' as c1,'c2'as c2,'c3' as c3));1.2、Sparkimport org.apache.spark.sql.SparkSessionimport org.a

大数据（8i）Spark练习之TopN

需求：每个城市的广告点击Top2SparkCore实现SparkSQL实现需求：省份点击数Top2数据方法1：reduceBy省份方法2：先reduceBy城市，再reduceBy省份打印自定义分区器求TopN

#spark #scala

大数据（9b）Flink集群部署YARN模式

文章目录

#flink

共 19 条

请选择