
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本数据集包含34,298张寄生虫和血细胞的显微镜图像,涵盖8个类别(6种寄生虫和2种血细胞类型)。数据规模约227MB,包含JPG和PNG两种格式,图像分辨率从9x9到989x967像素不等。该数据集具有多类别覆盖、真实临床样本、完整原始文件等特点,为寄生虫自动检测和医学影像分析提供了重要数据支撑。特别适用于深度学习模型的训练,可用于开发智能诊断辅助系统,帮助提升寄生虫感染的识别效率和准确性。

摘要 孟加拉语OCR数据集包含19,610个文件,主要涵盖手写单词图像(.bmp)和文本检测图像(.jpg)及标注文件(.txt)。数据覆盖40个地区,具有显著的地理多样性特征。该数据集为孟加拉语OCR技术研发提供了重要基础,可用于手写识别模型训练、文本检测与识别、自然语言处理等应用场景。数据集包含完整原始文件和高质量标注,支持深度学习模型的充分训练。其大规模(19,000+手写样本)和多模态(图

摘要 本报告分析了2022年1-8月纽约市出租车运营数据,包含570万条记录(黄色出租车占97.8%,绿色出租车2.2%)。数据详细记录了行程时间、地点、费用等信息,覆盖纽约五大区。分析显示:1月黄色出租车高峰时段为15-19点(占比28.5%),主要支付方式为信用卡(76.1%),热门上车区域集中在曼哈顿(如Upper East Side占9.8%)。该数据集完整度高、时空覆盖广,适用于交通流量

纽约市房产估值与评估数据集包含超过984万条详细记录,覆盖全市房地产信息。该数据集包含8个核心字段,完整记录率高达100%,包括建筑分类、税级、地块尺寸和评估价值等关键指标。数据集覆盖238个邮编区域,最大邮编区域包含223,410条记录(10314)。这些数据支持房地产价格预测模型训练、市场趋势分析和投资决策,其大规模特性(984万条记录)和高质量(字段完整率100%)为机器学习应用提供了坚实基

12643张人脸活体检测图像数据集包含5120张真实人脸和7523张伪造人脸,涵盖15个真实身份和16个伪造身份。该数据集具有真实伪造全覆盖、多身份多场景、标准索引结构等优势,适用于活体检测模型训练、身份认证算法评测、伪造攻击分析及智能安防系统开发。数据量适中(约385MB),提供完整原始图像和标准化索引文件,支持快速下载部署和实验复现,对提升身份认证系统的安全性具有重要价值。

印度国家证券交易所(NSE)2022年2月完整交易数据集包含约80,000条记录,涵盖股票、债券、期权等多种金融工具。数据包含46个字段,详细记录每日开盘价、最高价、最低价、收盘价、交易量等核心指标,以及52周高低价、公司行动等辅助信息。该数据集具有高完整性(关键字段100%完整)、多资产覆盖和标准化格式三大优势,为量化交易策略开发、市场趋势分析和算法模型训练提供可靠数据基础。特别适合用于开发高频








