
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
一、背景新闻分类是文本挖掘领域较为常见的场景。目前很多媒体或是内容生产商对于新闻这种文本的分类常常采用人肉打标的方式,消耗了大量的人力资源。本文尝试通过智能的文本挖掘算法对于新闻文本进行分类。无需任何人肉打标,完全由机器智能化实现。本文通过PLDA算法挖掘文章的主题,通过主题权重的聚类,实现新闻自动分类。包括了分词、词型转换、停用词过滤、主题挖掘、聚类等流程。二、数据集介绍具体字段如下:字
作为开源代码库以及版本控制系统,Github目前拥有140多万开发者用户。随着越来越多的应用程序转移到了云上,Github已经成为了管理软件开发以及发现已有代码的首选方法。 下面将分布讲解如何在github上发布个人网站。1.首先登陆github,网址https://github.com/。进行注册。(注意:你的用户名将作为未来网站域名的一部分)2.下载并安装
1.背景最近参加了一个评测,是关于新闻个性化推荐。说白了就是给你一个人的浏览记录,预测他下一次的浏览记录。花了一周时间写了一个集成系统,可以一键推荐新闻,但是准确率比较不理想,所以发到这里希望大家给与一些建议。用到的分词部分的代码借用的jieba分词。数据集和代码在下面会给出。2.数据集一共五个字段,以tab隔开。分别是user编号,news编...
长期以来楼主一直被一个问题困扰,就是win8进入界面,输密码时开大写其实是小写,开小写是大写。进入系统以后shift键是默认按下的。一直以为是电脑中毒了。上网查了一些东西,发现可能是因为键盘硬件方面的东西。这时不要盲目重装系统。 解决方案有两个,一是去维修店更换键盘。二是外接键盘,且禁用原键盘。 下面讲下如何禁用原键盘。 比基本电脑键盘容易因年久失修,
综述因为我个人最近在从事可能是AI领域对性能挑战最大的方向,自动驾驶领域,所以对整个深度学习训练的优化尤为关注,最近一直在学习相关内容,谨以此篇文章做一个总结。我一直很看好深度学习训练优化这个方向,因为从大的环境上来看,似乎大模型会成为未来的一个趋势,目前以Google、OpenAI、阿里等厂商为代表的一系列头部的AI研究机构,已经把模型尺寸做到十万亿参数级别,明年应该可以达到百万亿参数,总体呈指

背景概述今天看了一篇论文我觉得挺有意思,一方面是讲的股票预测相关,另一方面是把深度学习和知识图谱相结合解决一个问题。通常知识图谱和深度学习很少有交集,一般是独立发展的两个人工智能领域解决问题的手段,两者如何一起解决问题呢?这个也引发了我的好奇心,因为一直对知识图谱这个领域念念不忘,在《机器学习实践应用》最后一章还要特意加入知识图谱的内容。论文的名字叫:<Knowledge-Driven St
作为一个多年的微信公众号作者,了解微信公众号文章打分的机制是十分有必要的。微信在后台其实有一整套的打分机制,今天基于腾讯的这篇Paper《Cognitive Representation Learning of Self-Media Online Ariticle Quality》为大家介绍下文章质量打分背后的算法理论。在这篇paper中其实重点分享了两个方面,一方面是文章质量分的深度学习模型设计
最近特别忙,工作日几乎没什么时间学习。平时攒了一堆推荐相关的文章,趁周末整体学习了一下。主要是参考了网上的一篇技术文章(迄今为止我看到的比较好的推荐Embedding总结)以及我自己的一些理解。Embedding概念首先一些概念性的内容要科普下。推荐系统分召回和排序,召回为将每个用户找出他可能喜欢的物品的候选集,排序是对候选集按照用户的喜爱程度进行排序,最终得出给用户推荐的结果。在推荐系统的召回
概述首先自动驾驶技术从业务流程上分为3个核心的流程,分别是环境感知定位、决策规划、执行控制。这3个核心流程的具体价值如下:环境感知定位:主要是通过传感器技术和摄像头、GPS等技术获取汽车行驶过程中的环境指标,并且将数据采集决策规划:通过收集的数据,对车辆的下一步行为作出判断和指导执行决策:目前大部分车辆都采用线控设计,如何将决策通过信号指令控制汽车的油门、制动等相关系统以上3个流程,每一个步骤都包
候选人欢迎投递我的邮箱:594167264@qq.com团队介绍计算平台是阿里巴巴集团数据平台的基础技术设施,提供一站式数据采集、加工、分析、挖掘的平台服务,及完善的配套数据开发、数据管理工具,支持离线分布式计算、在线流计算、图计算、实时多维分析、机器学习、深度学习等多种业界领先的计算服务。对外支撑阿里云全套大数据服务,对内作为集团统一的数据仓库支撑阿里巴巴集团、蚂蚁金服、菜鸟的数据集市,是业界排







