logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

[转]Earth Mover's Distance (EMD)

转自:http://www.sigvc.org/bbs/forum.php?mod=viewthread&tid=981Earth Mover's Distance (EMD)原文:http://d.hatena.ne.jp/aidiary/20120804/1344058475作者: sylvan5翻译: Myautsai和他的朋友们(Google Translate、s...

#php#人工智能
[转]目前互联网上公布出来的正文提取算法

目前互联网上公布出来的正文提取算法,大家可以综合比较下,一起来测试下哪个更好用。 词网--北京词网科技有限公司http://demo.cikuu.com/cgi-bin/cgi-contex猎兔网页正文提取http://www.lietu.com/extract/PHP版网页正文提取http://www.woniu.us/get_co...

#java#javascript#c#
Hadoop 2.0 上深度学习的解决方案

原文连接:https://www.paypal-engineering.com/tag/data-science/摘要:伴随着数据的爆炸性增长和成千上万的机器集群,我们需要使算法可以适应在如此分布的环境下运行。在通用的分布式计算环境中运行机器学习算法具有一系列的挑战。本文探讨了如何在一个Hadoop集群中实现和部署深度学习。波士顿的数据科学团队正在利用尖端工具和算法...

#人工智能#数据库#大数据
[转]机器学习相关数据库 备份

原文地址:http://www.cppblog.com/cdy20/archive/2012/10/10/193134.html资料库KDD杯的中心,所有的数据,任务和结果。UCI机器学习和知识发现研究中使用的大型数据集KDD数据库存储库。UCI机器学习数据库。AWS(亚马逊网络服务)公共数据集,提供了一个集中的资料库,可以无缝集成到基于AWS的云应用程序的公...

#数据库#人工智能#大数据
[转]20个你不得不知的Linux服务器性能调优技巧

Linux是一种开源操作系统,它支持各种硬件平台,Linux服务器全球知名,它和Windows之间最主要的差异在于,Linux服务器默认情况下一般不提供GUI(图形用户界面),而是命令行界面,它的主要目的是高效处理非交互式进程,响应时间并不是那么重要,相反,能够长时间处理高负载才是最关键的。Linux高可用服务器集群解决方案让IT系统管理员可以从容应对许多常见的硬件和软件故障,允许多台计...

#数据库#网络#操作系统
【转】计算文档相似度(英文)

转自:http://blog.chinaunix.net/uid-26548237-id-3541783.html1、向量空间模型向量空间模型作为向量的标识符,是一个用来表示文本文件的代数模型。它应用于信息过滤、信息检索、索引以及相关规则。文档和问题都用向量来表示。每一维都相当于一个独立的词组。如果这个术语出现在文档中,那它在向量中的值就非零。已经有很...

人脸识别概述

一人脸识别系统结构图1显示了人脸识别系统所包含的各个模块,其中,图像采集模块用于采集包含人脸的图像;人脸检测跟踪模块用于确定视频中人脸的位置和大小,并确定同一个人在帧间的对应关系;而特征点定位模块用于定位眼睛、嘴巴等脸部特征点的位置;图像质量评估模块,用于从采集的同一个人的多张人脸图像中,根据人脸姿态和光照条件选择最适合识别的一张或者几张人脸进行人脸识别/认证;人脸特征提取模块用于...

#数据结构与算法#人工智能#数据库
GitHub上最热门的11款开源安全工具

恶意软件分析、渗透测试、计算机取证——GitHub托管着一系列引人注目的安全工具、足以应对各类规模下计算环境的实际需求。  作为开源开发领域的基石,“所有漏洞皆属浅表”已经成为一条着名的原则甚至是信条。作为广为人知的Linus定律,当讨论开源模式在安全方面的优势时,开放代码能够提高项目漏洞检测效率的理论也被IT专业人士们所普遍接受。  现在,随着GitHub等高人气代码共享站点的相继...

#大数据#操作系统#嵌入式
到底了