logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

一个非常流行的机器学习库 Scikit-learn(简称 sklearn)的简单应用

Scikit-learn(简称 sklearn)是 Python 中一个非常流行的机器学习库。scikit-learn 提供了多种机器学习算法:线性回归、支持向量机、决策树等。模型超参调优

文章图片
#sklearn#scikit-learn#python +1
【elasticsearch】tasks 查看任务

节点信息(nodes) & 任务信息(tasks)某个任务正在执行一个跨集群的 reindex 操作,数据从远程集群的 source_index 索引复制到本地集群的 destination_index 索引任务信息。

文章图片
#elasticsearch#搜索引擎
一个非常流行的机器学习库 Scikit-learn(简称 sklearn)的简单应用

Scikit-learn(简称 sklearn)是 Python 中一个非常流行的机器学习库。scikit-learn 提供了多种机器学习算法:线性回归、支持向量机、决策树等。模型超参调优

文章图片
#sklearn#scikit-learn#python +1
【jieba】 jieba 库中 cut_for_search 方法的实现详解

cut_for_search 该函数的作用是对输入的sentence进行更细致的分词,主要用于搜索引擎。HMM=True是用于控制是否使用**隐马尔可夫模型(HMM)**来处理未登录词(即词典中没有的词)。在标准分词结果的基础上,对长度较大的词进一步生成 2-gram 和 3-gram 子词,并检查这些子词是否存在于词典中。存在的话,就将这些子词作为额外的分词结果输出。这种处理方式可以在搜索引擎中

文章图片
#自然语言处理
一种用于大规模向量搜索的算法 DiskANN(Disk-based Approximate Nearest Neighbor)

DiskANN通过图索引、层次化存储、实时更新和过滤器支持等技术,实现了在大规模向量数据集上的高效、准确和成本效益高的近似最近邻搜索。其实现方式结合了内存和磁盘管理技术,使其能够在处理大规模数据时仍能保持高性能和灵活性。

文章图片
#算法#python#人工智能
到底了