logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

法尔斯新闻社1398年波斯语新闻数据集_29万条_多领域分类_完整文本内容_自然语言处理_文本挖掘_机器学习训练数据

法尔斯新闻社1398年波斯语新闻数据集是2019-2020年伊朗最具影响力的新闻媒体发布的大规模波斯语新闻语料库,包含294,023条完整新闻记录。该数据集涵盖政治、经济、体育、文化等多领域内容,每条记录包含标题、摘要、正文、分类标签等结构化信息。作为当前最大的波斯语新闻数据集之一,其高质量标注和广泛领域覆盖使其成为波斯语NLP研究、文本挖掘和机器学习模型训练的理想资源。数据集采用JSON格式存储

文章图片
#机器学习#分类#自然语言处理
财务报表欺诈检测数据集_170条完整财务文档文本标注数据_机器学习_NLP文本分类研究应用

摘要 本数据集包含170条完整财务文档文本数据,专为财务报表欺诈检测研究设计。数据源自SEC的10-K、10-Q等财务报告,涵盖财务报表、管理层讨论、审计报告等完整内容。每条记录均标注欺诈标签(yes/no),正负样本均衡分布(各占50%)。文本长度从1.6K到5.7M字符不等,平均128万字符,呈现真实财务文档的多样性。数据集采用CSV格式存储,包含Fillings(完整文本)和Fraud(标签

文章图片
#机器学习#自然语言处理#分类
140万行网络流量数据集分析报告-包含正常流量与僵尸网络流量的多维度特征数据-适用于网络安全分析、机器学习模型训练、入侵检测系统开发的高质量数据集

本文分析了两个网络流量数据集(总计140万行数据),包含正常流量和僵尸网络流量的多维特征。数据集来自CIC和ISCX联合创建,具有协议类型、端口信息、数据包特征等80多个字段,完整率达99.99%。主要优势包括:大规模样本量(1.14亿数据点)确保模型训练效果,高质量标注数据(72.71%正常流量,27.29%僵尸流量)支持精准分类,多维特征(流量持续时间、数据包数量等)满足不同分析需求。该数据集

文章图片
#web安全#机器学习#安全
原创电子邮件垃圾邮件过滤算法优化与深度学习模型训练数据集,高质量CSV格式邮件分类数据,包含二元分类标签、自然语言处理样本和GDPR合规处理,适用于BERT微调实验、钓鱼邮件识别、多语言NLP

本文介绍了一个高质量的电子邮件分类数据集,包含10,000条经过人工标注的邮件样本(垃圾邮件/正常邮件),采用CSV格式存储。数据集具有标注可靠性高(标注一致率98.2%)、场景多样(覆盖12种邮箱格式)等特点,适用于垃圾邮件过滤算法优化、邮件安全威胁建模和多语言NLP研究。该数据集支持BERT、LSTM等模型的训练与微调,在独立测试中准确率达92%,并能有效降低误判率。数据集保留HTML标签和特

文章图片
#算法#深度学习#自然语言处理
原创北美鸟类图像识别数据集:200种物种11,788张高质量图像深度学习分类训练资源,计算机视觉算法研发智能观鸟应用开发生物多样性监测生态保护研究环境教育科普推广农业林业智能监测系统CNN ViT模型

摘要: 北美鸟类图像识别数据集包含200种鸟类11,788张高质量标注图像,覆盖北美代表性物种,平均每类59张图像,确保数据平衡性与多样性。图像经专业标注,涵盖不同季节、栖息地及行为状态,适用于深度学习模型训练(如CNN、ViT)。该数据集支持计算机视觉算法研发、智能观鸟应用开发、生物多样性监测及环境教育,兼具科研与实用价值。其标准化格式与丰富场景覆盖可提升模型泛化能力,为生态保护、农业监测及科普

文章图片
#深度学习#算法#分类
猫狗识别数据集:34,441张高质量标注图像,深度学习二分类任务训练数据集,计算机视觉算法研发,CNN模型训练,图像识别分类,机器学习实践项目完整数据资.md

猫狗识别数据集是计算机视觉领域的经典二分类数据集,包含34,441张图像(训练集23,208张,测试集11,233张),类别分布均衡。该数据集具有图像多样、标注准确、格式标准等优势,适用于深度学习模型训练、算法研发、教学实践等场景。作为迁移学习和边缘计算的研究平台,它能够验证模型压缩、数据增强等技术效果,并应用于智能相册、内容审核等实际系统。该数据集为计算机视觉研究提供了标准化基准,是深度学习入门

文章图片
#深度学习#算法#机器学习
餐饮行业评论数据集:93,286条正面评价与7,921条负面评价的完整中文语料库,可用于情感分析,AI评论生成训练,助力AI情感识别模型训练与餐饮行业智能分析应用

在人工智能快速发展的今天,情感分析技术已成为自然语言处理领域的重要分支,而高质量的中文情感分析数据集则是推动该技术发展的关键基础。餐饮行业作为与人们日常生活息息相关的服务行业,其用户评价数据蕴含着丰富的情感信息和商业价值。本数据集收集整理了超过10万条真实的中文餐饮评价数据,为情感分析算法研究、机器学习模型训练以及餐饮行业智能分析提供了宝贵的语料资源。该数据集不仅能够支持传统的情感分类任务,更能为

文章图片
#人工智能
原创北美鸟类图像识别数据集:200种物种11,788张高质量图像深度学习分类训练资源,计算机视觉算法研发智能观鸟应用开发生物多样性监测生态保护研究环境教育科普推广农业林业智能监测系统CNN ViT模型

摘要: 北美鸟类图像识别数据集包含200种鸟类11,788张高质量标注图像,覆盖北美代表性物种,平均每类59张图像,确保数据平衡性与多样性。图像经专业标注,涵盖不同季节、栖息地及行为状态,适用于深度学习模型训练(如CNN、ViT)。该数据集支持计算机视觉算法研发、智能观鸟应用开发、生物多样性监测及环境教育,兼具科研与实用价值。其标准化格式与丰富场景覆盖可提升模型泛化能力,为生态保护、农业监测及科普

文章图片
#深度学习#算法#分类
猫狗识别数据集:34,441张高质量标注图像,深度学习二分类任务训练数据集,计算机视觉算法研发,CNN模型训练,图像识别分类,机器学习实践项目完整数据资.md

猫狗识别数据集是计算机视觉领域的经典二分类数据集,包含34,441张图像(训练集23,208张,测试集11,233张),类别分布均衡。该数据集具有图像多样、标注准确、格式标准等优势,适用于深度学习模型训练、算法研发、教学实践等场景。作为迁移学习和边缘计算的研究平台,它能够验证模型压缩、数据增强等技术效果,并应用于智能相册、内容审核等实际系统。该数据集为计算机视觉研究提供了标准化基准,是深度学习入门

文章图片
#深度学习#算法#机器学习
Aiarty_image_matting_2.6-Portable 全解析:专业智能抠图与图像处理工具深度指南

文章摘要 《Aiarty_image_matting_2.6-Portable全解析》深度剖析了这款专业智能抠图工具。文章从基础认知入手,详细介绍了该软件的定位、版本特性(2.6便携版)、系统适配要求及六大核心优势。第二章重点解析2.6版本的更新内容,包括智能抠图算法优化(毛发识别、复杂背景处理等)、功能增强(背景替换、批量处理等)以及性能提升(启动速度优化30%)。通过版本对比表,明确展示2.6

文章图片
#图像处理#人工智能
    共 23 条
  • 1
  • 2
  • 3
  • 请选择