logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

KAN 2.0: 科尔莫哥洛夫-阿诺德网络与科学的结合

Github:https://github.com/KindXiaoming/pykan.git论文:https://arxiv.org/abs/2408.10205AI + 科学的一个主要挑战在于它们固有的不兼容性:当今的人工智能主要基于连接主义,而科学依赖于符号主义。为了弥合这两个世界,我们提出了一个框架,以无缝协同科尔莫哥洛夫-阿诺德网络 (KANs) 和科学。该框架强调 KAN 在科学发现

文章图片
#人工智能#深度学习
数据预处理系列:资源匮乏下数据处理_Pandas内存优化和加速

生成的文件将不会有相同的大小减小,但仍然会更小。当使用一个新的数据集时,我通常会创建一个第一个笔记本来加载所有相关的文件,转换数据类型,将DataFrame保存为pickle文件,然后只在主要的特征工程笔记本中加载它。,应该被转换为分类列。这种特殊的数据类型基本上将所有唯一值保存在字典中,然后在每一列中放置内存高效的整数,并在使用DataFrame时显示相应的文本值。在某些情况下,先将列连接起来,

文章图片
#pandas#机器学习#人工智能
数据预处理系列:特征工程介绍_异常值、缺失值、编码、特征提取

什么是特征工程特征工程是将数据进行转换和丰富,以提高使用该数据训练模型的机器学习算法的性能的过程。特征工程包括诸如缩放或标准化数据、对非数值数据(如文本或图像)进行编码、按时间或实体聚合数据、合并来自不同来源的数据,甚至从其他模型中转移知识等步骤。这些转换的目标是增加机器学习算法从数据集中学习的能力,从而进行更准确的预测。为什么特征工程很重要?特征工程之所以重要有几个原因。首先,正如前面提到的,机

文章图片
#机器学习
金融欺诈:异常检测技术及最新进展综述Financial Fraud: A Review of Anomaly Detection Techniques and Recent Advances

随着技术的发展和现代社会持续的经济增长,金融行业中的欺诈行为变得更加普遍,每年给机构和消费者造成数百亿美元的损失。欺诈者不断改进他们的手法,以利用当前防范措施的漏洞,其中许多人瞄准了金融领域。这些犯罪行为包括信用卡欺诈、医疗和汽车保险欺诈、洗钱、证券和商品欺诈以及内幕交易。单独使用欺诈预防系统无法提供足够的安全防范来抵御这些犯罪行为。因此,检测系统对于在犯罪行为发生后检测到欺诈行为以及潜在的成本节

文章图片
#深度学习
Scikit-Learn 1.4使用指南:有监督学习 最近邻算法 Nearest Neighbors

sklearn.neighbors 提供了无监督和有监督的基于最近邻的学习方法。无监督最近邻是许多其他学习方法的基础,尤其是流形学习和谱聚类。有监督的基于最近邻的学习有两种类型:分类适用于具有离散标签的数据,回归适用于具有连续标签的数据。最近邻方法的原理是找到与新点距离最近的预定义数量的训练样本,并根据这些样本预测标签。样本数量可以是用户定义的常数(k最近邻学习),也可以根据点的局部密度变化(基于

文章图片
#scikit-learn#近邻算法#机器学习
多Agent协作工具CrewAI使用指南——工具使用

默认情况下,该工具使用 OpenAI 进行嵌入和摘要生成。llm=dict(provider="ollama", # 或 google, openai, anthropic, llama2, ...# top_p=1,),),),),默认情况下,该工具同时使用 OpenAI 进行嵌入和摘要生成。llm=dict(provider="ollama", # 或 google, openai, anth

文章图片
#语言模型#人工智能
大模型系列:OpenAI使用技巧_使用基于文本向量embedings的搜索进行问答

在这个特定的案例中,通过查看下面的文本,看起来模型所给出的第一篇文章确实包含了所有三个事件的奖牌得主,但后来的结果更加强调了男子和女子比赛,这可能使模型分散了注意力,无法给出更完整的答案。一般来说,基于搜索的系统在需要简单查找的问题上表现最佳,在需要组合和推理多个部分来源的问题上表现最差。对于2022年冬季奥运会没有任何了解,但我们的搜索系统能够检索到供模型阅读的参考文本,使其能够正确列出男子和女

文章图片
#人工智能#语言模型
用 TATR 做表检测与转换,让数据处理变得轻松又高效!

这种新方法将物体检测作为直接的集合预测问题,标志着与传统方法的不同。通过简化检测流程,这种模型消除了手工设计的各种组件,如非极大值抑制和锚点生成,这些组件通常编码了特定任务的先验知识。在这个新框架的核心,即 DEtection TRansformer (DETR),存在一个基于集合的全局损失,通过二分匹配和包含 Transformer 编码器-解码器层的架构,确保唯一性预测。使用一组预定义的学习对

文章图片
异常检测系列:异常检测基本介绍

例如,我们之前提到的火灾索赔示例,一种欺诈类型是策划的军火库犯罪,另一种类型是火灾损失的夸大。正如其GitHub页面(https://github.com/yzhao062/pyod)上的标语所说,“Python异常值检测模块是一个全面且可扩展的Python库,用于异常值检测(异常检测)”。标记的异常值可以来自多种类型的异常值。首先,异常值是与其他值相距较远的罕见事件,一种直观的方法是测量数据点之

文章图片
#人工智能#机器学习#数据挖掘
时间序列预训练模型 Chronos:学习时间序列的语言 Chronos: Learning the Language of Time Series

我们介绍了Chronos,这是一个简单而有效的预训练概率时间序列模型框架。Chronos使用缩放和量化将时间序列值标记为固定词汇,并通过交叉熵损失训练现有的基于Transformer的语言模型架构。我们在大量公开可用数据集上预训练了基于T5系列(参数范围从20M到710M)的Chronos模型,同时通过高斯过程生成了一个合成数据集,以提高泛化能力。在包含42个数据集的全面基准测试中,涵盖了传统的本

文章图片
    共 98 条
  • 1
  • 2
  • 3
  • 10
  • 请选择