logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

处理数据不平衡

这几年来,机器学习和数据挖掘非常火热,它们逐渐为世界带来实际价值。与此同时,越来越多的机器学习算法从学术界走向工业界,而在这个过程中会有很多困难。数据不平衡问题虽然不是最难的,但绝对是最重要的问题之一。一、数据不平衡在学术研究与教学中,很多算法都有一个基本假设,那就是数据分布是均匀的。当我们把这些算法直接应用于实际数据时,大多数情况下都无法取得理想的结果。因为实际数据往往分布得很不均匀,都...

准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measure

https://www.cnblogs.com/sddai/p/5696870.html准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measureyu Code 15 Comments 机器学习(ML),自然语言处理(NLP),信息检索(IR)等领域,评估(Evaluation)是一个必要的 工作,而其评价指标往往有如下几点:准确率(Accuracy

迁移学习 (Transfer Learning)

什么是/为什么要迁移学习?迁移学习(Transfer learning) 顾名思义就是就是把已学训练好的模型参数迁移到新的模型来帮助新模型训练。考虑到大部分数据或任务是存在相关性的,所以通过迁移学习我们可以将已经学到的模型参数(也可理解为模型学到的知识)通过某种方式来分享给新模型从而加快并优化模型的学习效率不用像大多数网络那样从零学习(starting from scratch,tabula ..

序列标注-命名实体识别

   三个月之前 NLP 课程结课,我们做的是命名实体识别的实验。在MSRA的简体中文NER语料(我是从这里下载的,非官方出品,可能不是SIGHAN 2006 Bakeoff-3评测所使用的原版语料)上训练NER模型,识别人名、地名和组织机构名。尝试了两种模型:一种是手工定义特征模板后再用CRF++开源包训练CRF模型;另一种是最近两年学术界比较流行的 BiLSTM-CRF 模型。      ..

数据挖掘十大算法

本文主要分析皆来自其他资料,借用较为权威的总结来对我已经学习的这些经典算法做一个极为精简的概述(根据自身经验有一定修改),另外同时附上机器学习实战中作者对各种算法的评价。另外机器学习实战这本书是本人看了这么多书籍或者资料中唯一一本坚持从头看到尾,看完了的书籍,包括其中的代码皆实践运行过,收获颇多,个人认为虽然这本书时间上已经算是老资料了,但其中作者的各种总结和代码的演练都由浅入深(前提还是要有一点

二维数组的输入

不像二维数组那样,可以直接对arr[i][j]进行循环赋值。在vector<vector<int>>中,因为vector是一个容器,最外层的vector容器中放着更小的vector,而里层的vector里面放的是int型的数字。所以我们首先要对里层的vector容器赋值,然后再把里层的vector作为元素插入到外层的vector中。代码如下#

对象 |字典|json|yaml|字符串 相互转化

在研究 k8s 的yaml 配置文件的时候,我总担心自己一不小心 会写错,所以我向往 使用将对象 序列化 yaml 的形式,其实 python object 可以 直接 转 yaml ,甚至也可以 直接 转成yaml文件!!!这里 会经常用到几个 函数 vars() ast.importastdict_str='****'real_dict=ast.literal_eval(...

k8s中部署发布应用

1.项目迁移到K8S平台是怎样的流程制作镜像:使用dockerfile制作docker 镜像镜像分为基础镜像:centos,ubuntu服务镜像:openjdk,nginx,mysql项目镜像:项目代码打包在服务镜像里,最终交付物java或者go的应用需要编译,php的可以不用编译。控制器管理podDeployment:无状态部署,例如Web,微服...

聊天机器人chatbox

整理者:我爱机器学习本文将持续更新,烦请留言告知遗漏的高质量资源Awesome Chatbot链接:https://github.com/shaohua/awesome-chatbotDEEP LEARNING FOR CHATBOTS链接:DEEP LEARNING FOR CHATBOTS聊天机器人技术的研究进展链接:聊天机器人技术的研究进展使用深度学习...

到底了