logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Word2vec原理及参数详解

Word2Vec有两种主要的模型架构:连续词袋模型(Continuous Bag of Words,简称CBOW)和跳字模型(Skip-gram)。训练Word2Vec的核心目标是通过调整单词向量的权重,使得模型能够最小化实际上下文单词的预测误差,得到的词向量可用于文本分类、文本相似度、推荐等下游任务。通过多次迭代,模型将学习到单词向量,这些向量在向量空间中能够捕获单词之间的语义关系,使得具有相似

文章图片
#word2vec#人工智能#自然语言处理
2024上半年数学建模比赛汇总

(1)大数据统计分析方向涉及内容包含:数据的清洗、数据的预测、数据之间的。

文章图片
模型可解释性-shap value

Shap值衡量特征的边际贡献度,是当前模型解释的最佳方法之一,对于模型进行可视化的全局解释、局部解释,可以在一定程度上满足业务对于模型解释性的要求。本文通过实例对shap原理进行讲解,帮助初学者、从业人员快速理解,并以代码进行全流程实战和结果展示、帮助大家上手使用。............

文章图片
#机器学习#python
tf-idf原理 & TfidfVectorizer参数详解及实战

tf-idf作为文体特征提取的常用统计方法之一,适合用于文本分类任务,本文从原理、参数详解及实战全方位详解tf-idf,掌握本篇即可轻松上手并用于文本数据分类。tf 表示(某单词在某文本中的出现次数/该文本中所有词的词数),idf表示(语料库中包含某单词的文本数、的倒数、取log),tf-idf则表示,tf-idf认为词的重要性随着它在文本中出现的次数成正比增加,但同时会随着它在整个语料库中出现的

文章图片
#机器学习#python#人工智能
catboost参数详解及实战(强推)

catboost参数详解(史上最细),以及实战贝叶斯调参

文章图片
#python#机器学习#数据分析
tf-idf原理 & TfidfVectorizer参数详解及实战

tf-idf作为文体特征提取的常用统计方法之一,适合用于文本分类任务,本文从原理、参数详解及实战全方位详解tf-idf,掌握本篇即可轻松上手并用于文本数据分类。tf 表示(某单词在某文本中的出现次数/该文本中所有词的词数),idf表示(语料库中包含某单词的文本数、的倒数、取log),tf-idf则表示,tf-idf认为词的重要性随着它在文本中出现的次数成正比增加,但同时会随着它在整个语料库中出现的

文章图片
#机器学习#python#人工智能
catboost参数详解及实战(强推)

catboost参数详解(史上最细),以及实战贝叶斯调参

文章图片
#python#机器学习#数据分析
到底了