如何在亚马逊上搜索数百万的公共文档,图像等

Amazon Web Services(AWS)是云计算的蓝鲸。您可能没有意识到,但是大多数网站和Web服务都在此平台上运行。实际上,AWS的公共云比微软,谷歌和IBM的总和还大。

就像任何其他大型云平台一样,AWS托管着各种可公开访问的数据。例如,您可以从Flickr中找到巨大的1亿个强大的Creative Commons图像和视频数据集。借助YFCC100m浏览器进行访问。

尝试使用Google进行搜索。您会惊讶于在AWS上可以找到的大量公共文档。在AWS上搜索PDF文件最快的方法之一是使用老旧的Google及其高级搜索运算符之一。

[Keyword] filetype:PDF site:amazonaws.com

当然,文件对公众开放,可以从搜索中获得在AWS上托管它们的网站的门户。但是,这种关键字方法是一种“实验搜索",可帮助您立即挖掘巨大的干草堆,而不是前往每个站点。

您还可以使用Google的“高级搜索"页面来更精确地构建查询,并且然后执行它以搜索亚马逊的云。我更喜欢一个名为Advangle的小型搜索工具,该工具可以帮助您以可视方式构建搜索查询。

网络研究的“隐形"场所

搜索引擎是通向搜索引擎的大门网络。但是,有很多方法可以搜索深层数据并增强您的研究技能。当然,不要盲目使用这些信息(尤其是图片)。找到拥有该信息的网站,并检查其版权限制。

我认为Google的高级搜索运营商应该成为我们研究习惯的一部分。你怎么看?提及一些您想进行在线研究的打开目录。

标签: Amazon Web Services Google搜索 Web搜索