18910140161

六个经典机器学习数据集 3w用户精选 推荐收藏

顺晟科技

2023-02-23 09:59:38

145

内容列表:本期总结了超级神经下载量排名众多的六个数据集,涵盖图像识别、机器翻译、遥感图像等领域。这些数据集质量高,数据量大,经过流行度认证,值得收集编码。

关键词:数据集机器翻译机器视觉

本文由微信微信官方账号首发:HyperAI神经数据集是机器学习模型训练的基础,高质量的公共数据集对模型训练效果和研究结果的可靠性具有重要意义。

HyperAI自上线以来,已经为数据科学从业者提供了大量高质量的公共数据集。在这一期的内容分享中,我们筛选出了六个热门数据集,总下载量已经达到了32569次。希望这些数据集能进一步为开发者服务~

注:本文梳理的数据集均来自网站:

https://hyper.ai/datasets

bVc6smL bVc6sm4

Tanks Temple图像数据集提供了高分辨率的视频,研究人员可以从视频中收集图像并进行三维重建。数据集包括训练数据和测试数据,其中测试数据分为中级组和高级组。

bVc6sm6 bVc6sm7

DOTA,全称是航拍图像中物体检测的大规模数据集,是一个包含2806张航拍图像的图像数据集,用于在航拍图像中检测目标、寻找和评估物体。

这些图像源包括不同的传感器和平台。每幅图像的像素大小在800800到40004000的范围内,包含了不同比例、方向、形状的物体。

有关过去的推送,请访问:

DOTA数据集:2806幅遥感影像,近19万个标注实例。

bVc6sm9 bVc6sna

VGG-Face2是一个人脸图像数据集,共包含9131个人脸数据,全部来自谷歌的图像搜索。数据集中的人在体态、年龄、种族和职业上差异很大。该数据集由牛津大学工程科学系视觉几何组于2015年发表,相关论文为《Deep Face Recognition》。

bVc6snC bVc6snV

UCAS-AOD是一个遥感图像数据集,用于探测飞机和车辆。该数据集由国科大于2014年首次发布,2015年补充,相关论文从0755篇到79000篇不等。

bVc6snW bVc6snZ

OpenMantra是针对日本漫画的机器翻译评测数据集,包含五种不同风格的漫画(fantacy、言情、战斗、玄机、切片生活)。该数据集包含1593个句子,848个场景和214页漫画,由东京大学的Mantra团队发布。

请检查之前的推送:

漫画翻译,嵌入式人工智能,东京大学论文被AAAI 21。

bVc6sn0 bVc6sn5

ImageNet是世界上最大的图像识别数据库,由斯坦福大学教授李菲菲等人创建。它主要用于机器视觉领域中的图像分类和目标检测。

数据集是根据WordNet层次结构组织的,其中每个节点(也称为类别)由数百甚至数千幅图像组成。该数据集包含22,000个图像类别和大约1,500万个图像。

有关过去的推送,请访问:

这个决定使李菲菲成为人工智能江湖的女王。

以上是本期推荐的hyper.ai的六个高频下载数据集。更多数据科学高质量公共数据集,请点击文末阅读原文,或访问以下链接下载:

[https://hyper.ai/datasets

](https://hyper.ai/datasets)

——完成了——

相关文章
随机推荐
我们已经准备好了,你呢?
2024我们与您携手共赢,为您的企业形象保驾护航