logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

计算机科学的理论基础

    计算机基础理论采用数学和逻辑学并吸收语言学,生理学,心理学等基础科学的理论和方法研究计算机领域的基础问题。这一领域有许多景点问题和不断产生的新问题,其中有一些估计会在新世纪取得突破并导致整个计算机科学技术的巨大发展。本文将分计算理论,程序理论和计算机中的逻辑与代数三部分概述其主要研究内容和发展趋势。一、计算理论    计算理论研究各种计算模型、可计算性、计算的复杂性等计算的固有

#算法#活动#测试
向量空间模型(VSM)在文档相似度计算上的简单介绍

 向量空间模型(VSM:Vector space model)是最常用的相似度计算模型,在自然语言处理中有着广泛的应用,这里简单介绍一下其在进行文档间相似度计算时的原理。 假设共有十个词:w1,w2,......,w10,而共有三篇文章,d1,d2和d3。统计所得的词频表(杜撰的,为了便于演示用法)如下:  常用的向量空间公式见下图:   假设计算d1和d2

#自然语言处理
元胞自动机与相关理论和方法

元胞自动机与相关理论和方法的发展有着千丝万缕的联系,一方面,元胞自动机的发展得益于相关理论的研究,如逻辑数学、离散数学、计算机中的自动机理论,图灵机思想;另一方面,元胞自动机的发展也促进了一些相关学科和理论(如人工智能、非线性科学、复杂性科学)的发展,甚至还直接导致了人工生命科学的产生。另外,在表现上,元胞自动机模型还与一些理论方法存在着较大的相似性,或者相

#网络
交叉验证(Cross Validation)方法思想简介

交叉验证(CrossValidation)方法思想以下简称交叉验证(Cross Validation)为CV.CV是用来验证分类器的性能一种统计分析方法,基本思想是把在某种意义下将原始数据(dataset)进行分组,一部分做为训练集(train set),另一部分做为验证集(validation set),首先用训练集对分类器进行训练,在利用验证集来测试训练得到的模型(model),以此来

#测试
数据挖掘的一个完整过程

     在现代社会中,公司大多数商务流程的核心部分是数据。而数据挖掘的任务就是在如此海量的数据中发现有用的数据。但是仅仅发现数据那是不够的。我们必须对这种模型做出一定的反应,并采取行动,最后将有用的数据转换成信息,信息变成行动,行动转换成价值。这个就是数据挖掘在商业应用上的一个完整的流程。下面给出一个完整数据挖掘过程的四个步骤:鉴别商业问题 使用数据挖掘技术将数据转换成可以采

#数据挖掘#活动
XML与Web数据挖掘

 面向Web的数据挖掘是一项复杂的技术,由于Web数据挖掘比单个数据仓库的挖掘要复杂的多,因而面向Web的数据挖掘成了一个难以解决的问题。而XML的出现为解决Web数据挖掘的难题带来了机会。   面向Web的数据挖掘面临的挑战Web 上有海量的数据信息,怎样对这些数据进行复杂的应用成了现今数据库技术的研究热点。数据挖掘就是从大量的数据中发现隐含的规律性的内容,解决数据的应用质量问题

#xml#数据挖掘#数据库 +1
数据挖掘——我们能从股市数据得出什么,以及一些算法

数据挖掘——我们能从股市数据得出什么,以及一些算法//一个备忘录了,写给我们金融信息系统项目小组的同学。没有列出参考文献,因为都是大白话。有些删节。数据挖掘/机器学习大概处理以下几个问题:分类 ,这是有很多非常成熟的算法,非常直观,按照一个分类属性,把样本分为不同的类别。聚类 ,聚类与分类的差别在于,分类分析有一个分类属性作为输出,比如“好”、“坏”之类,但聚类没有。聚类

#算法#数据挖掘#网络 +2
数据集-用于数据挖掘、信息检索、知识发现等

1、气候监测数据集 http://cdiac.ornl.gov/ftp/ndp026b2、几个实用的测试数据集下载的网站http://www.cs.toronto.edu/~roweis/data.htmlhttp://www.cs.toronto.edu/~roweis/data.htmlhttp://kdd.ics.uci.edu/summary.task.type.h

#数据挖掘#microsoft#测试
数据挖掘

数据收集和数据存储技术的快速进步使得各组织机构可以积累海量数据。然而,提取有用的信息已经成为巨大的挑战。通常,由于数据量太大,无法使用传统的数据分析工具和技术处理它们。有时,即使数据集相对较小,由于数据本身的非传统特点,也不能使用传统的方法处理。在另外一些情况下,需要回答的问题不能使用已有的数据分析技术来解决。这样,就需要开发新的方法。数据挖掘是一种技术,它将传统的数据分析方法与处理大量数据的

#数据挖掘#数据分析#算法
十大数据挖掘算法

国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART.不仅仅是选中的十大算法,其实参加评选的18种算法,实际

#算法#数据挖掘
    共 44 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择