logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

使用matlab预处理数据,读取,转置,切分,存储,导入

%先直接使用excel切分数据,然后读入matlab进行处理%从excel中读取数据[FEATURES,TXT,RAW] = xlsread('features');[LABElS,TXT,RAW] = xlsread('labels');%转置矩阵,得到的矩阵每一列为一条数据,每一行为某个特征FEATURES_T = FEATURES';LABElS_T = LABElS';[

大数据面试题

1、给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?1)   可以估计每个文件安的大小为50G×64=320G,远远大于内存限制的4G。所以不可能将其完全加载到内存中处理。考虑采取分而治之的方法。2)   遍历文件a,对每个url求取 ,然后根据所取得的值将url分别存储到1000个小文件(记为 )中。这样每个小文件的大约为

python27使用jieba分词,去除停用词

# -*- coding: utf-8 -*-import jiebaimport jieba.analyseimport sysimport codecsreload(sys)sys.setdefaultencoding('utf-8')#使用其他编码读取停用词表#stoplist = codecs.open('../../file/stopword.txt','r',enco

opencv-python 提取sift特征并匹配

# -*- coding: utf-8 -*-import cv2import numpy as npfrom find_obj import filter_matches,explore_matchfrom matplotlib import pyplot as pltdef getSift():'''得到并查看sift特征'''img_pat

UndefinedMetricWarning: Precision is ill-defined and being set to 0.0 due to no predicted samples.

# -*- coding: utf-8 -*-import jieba, osimport codecsfrom gensim import corpora, models, similaritiesfrom pprint import pprintfrom collections import defaultdictimport sysimport picklefrom src.

Python机器学习——如何shuffle一个数据集(ndarray类型)

取 shuffle 的过程其实可看做从全排列中随机选择一个的过程。稍微比较麻烦的是实现特征向量与类别标签的同步shuffle。如果这里数据集既包含特征向量又包括标签值,可直接调用np.random.shuffle()方法:>>> np.random.shuffle(training_data)>>> X = training_data[:, :-1]>>> y = tr

使用python+机器学习方法进行情感分析(详细步骤)

原文地址不是有词典匹配的方法了吗?怎么还搞多个机器学习方法。因为词典方法和机器学习方法各有千秋。机器学习的方法精确度更高,因为词典匹配会由于语义表达的丰富性而出现很大误差,而机器学习方法不会。而且它可使用的场景更多样。无论是主客观分类还是正负面情感分类,机器学习都可以完成任务。而无需像词典匹配那样要深入到词语、句子、语法这些层面。回复此公众号

常见聚类算法分类

聚类划分:(1)划分聚类  k-means、k-medoids、k-modes、k-medians、kernel k-means(2)层次聚类  Agglomerative、divisive、BIRCH、ROCK、Chameleon(3)密度聚类 DBSCAN、OPTICS(4)网格聚类  STING(5)模型聚类  GMM(6)图聚类  Spectral Cluste

【干货】Kaggle 数据挖掘比赛经验分享

【干货】Kaggle 数据挖掘比赛经验分享2017-05-09 陈成龙 腾讯全球高校算法大赛简介Kaggle 于 2010 年创立,专注数据科学,机器学习竞赛的举办,是全球最大的数据科学社区和数据竞赛平台。笔者从 2013 年开始,陆续参加了多场 Kaggle上面举办的比赛,相继获得了 CrowdFlower 搜索相关性比赛第一名(1326支队伍)和 Hom

    共 18 条
  • 1
  • 2
  • 请选择