logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

NLP 梳理02 — 标点符号和大小写

本系列文总结了在NLP处理中,进行文本预处理的一些内容、步骤、处理工具包应用。本篇专门谈论大小写文本和标点符号处理,对于初学者具有深刻学习和实验指导意义。

文章图片
#自然语言处理#人工智能
NLP 梳理03 — 停用词删除和规范化

前文我们介绍了标点符号删除、文本的大小写统一,本文介绍英文文章的另一些删除内容,停用词删除。还有规范化处理。

文章图片
#自然语言处理
高效特征选择:优化机器学习的嵌入式方法指南

假设您正在处理一个大型数据集,并且想要训练一个机器学习算法。挑战在于决定从众多变量中应该考虑哪些特征来构建有效的模型。这就是特征选择发挥作用的地方,它使我们能够筛选数据混乱并创建更易于解释和更强大的模型。

文章图片
#机器学习#人工智能
Qt布局管理详解(5种布局控件)

实际开发中,一个界面上可能包含十几个控件,手动调整它们的位置既费时又费力。作为一款成熟的 GUI 框架,本文介绍五个基本布局对象。

文章图片
#qt#开发语言
使用无监督机器学习算法进行预测性维护

作者在发电行业研究数据科学几年后,意识到最有效的预测性维护工具是无监督的机器学习算法。本篇从若干机器学习方法种,提取非监督学习算法的种种优缺点,展开进行分析。

文章图片
#机器学习#算法#人工智能
使用 Python 和 HuggingFace Transformers 进行对象检测

在本文中,您将了解这种类型的 Transformer 模型。你还将学习如何使用 Python、默认 Transformer 模型和 HuggingFace Transformers 库构建自己的对象检测管道。事实上,这将非常简单,所以让我们一起来看看吧!

文章图片
#人工智能#目标检测
ML 系列:机器学习和深度学习的深层次总结( 20)— 离散概率分布 (Bernoulli 分布)

离散概率分布,最早的杰出任务是贝努力,而贝努力分布是最早的离散概率模型,至今依然是重要的概率理论,在物理学的热力学、量子理论均有巨大意义。

文章图片
#概率论
强化学习,第 6 部分:n 步 Bootstrapping

为此,唯一需要做的更改是调整他们的更新公式,以使用不是来自下一个状态的信息,而是来自。,我们还强调了一步式 TD 算法相对于 MC 方法的优势,以及它们如何实现更快的收敛。代理的目标是找到到 X 的最短路径。将一步 TD 和蒙特卡洛方法推广到 n 步算法中,在强化学习中起着重要作用,因为 n 的最佳值通常位于这两个极端之间。在一步 TD 中,我们分析收到的奖励与状态值如何变化之间的差异,从当前状态

文章图片
#代理模式
Scikit-LLM:Scikit-Learn 与大型语言模型的结合

作为 Python 和 ML 的初学者,我经常依赖 scikit-learn 完成几乎所有项目。它的简单性和多功能性使实现各种算法成为一种迷人的体验。现在,令人兴奋的是,scikit-learn 通过“Scikit-LLM”引入了 LLM 功能,从而得到了进一步发展。这种集成将 GPT、Vertex、Gemma、Mistral、Llama 等大型语言模型的强大功能带入了 scikit-learn

文章图片
#scikit-learn#语言模型#python
深度学习的正则化深入探讨

在训练机器学习模型时,模型很容易过拟合或欠拟合。为了避免这种情况,我们在机器学习中使用正则化来使模型正确地拟合到我们的测试集。正则化技术有助于减少过拟合的可能性,并帮助我们获得最优模型。

文章图片
#深度学习#人工智能
    共 119 条
  • 1
  • 2
  • 3
  • 12
  • 请选择