StumbleUpon如何工作? [技术解释]

在最近几年出现的所有基于Web的应用程序中,StumbleUpon无疑是我使用最多的应用程序。通过单击该小按钮,我发现了很多很棒的网站,甚至更多的信息,而这是传统搜索方法无法找到的。

As a former web-developer, one of the things I do is try to figure out how neat web apps work. Now, before I get rolling, I have to say that EXACTLY how StumbleUpon works is a trade secret and they certainly aren’t going to reveal that info to me. Also, a comprehensive overview of how it might work would make for an article that is far longer than this format allows for. What follows is a simplified theory on how it works based on my years of web developing and some probing around the application.

任何大型Web应用程序的核心都是数据库。如果您不熟悉什么是数据库,那么我能提供的最好的日常示例就是电话簿。电话簿只是很多数据记录,这些记录按地区,企业或住宅,城镇,然后按姓氏字母顺序排列。由于电话簿的结构已成为常识,因此我们可以轻松找到所需的数据。先了解该区域,然后确定我们想要的电话号码是住宅还是公司,然后再查询城镇,然后快速转到字母顺序部分,我们就会知道John Q. Public的号码将是-在< em> P 。该过程可能被称为查找电话号码的算法。

我希望StumbleUpon有一个非常大型数据库!

注册时对于StumbleUpon,他们要求您定义一些您感兴趣的类别。这可以帮助他们将您定向到属于这些类别的网页。

按下按钮时,一条消息将发送到StumbleUpon数据库,该消息很可能只是您的用户ID。数据库将查找您注册时选择的类别。从那里,应用程序很可能会随机选择这些类别之一。然后,应用程序遍历该类别,并在该类别中找到一个您不熟悉的网页,并将您的浏览器定向到该页面。

现在,由于提出了某些问题,它变得更加复杂。对我而言,第一个出现的是,他们如何知道该网站对我来说是新的?好吧,我想您可以跟踪通过StumbleUpon访问的网站。我之所以这样说,是因为我在某些StumbleUpon类别中已经讲到了重点,其中StumbleUpon告诉我在该类别中没有更多我可以看到的内容。 (是的,我跌倒了很多。)

现在,我想知道它如何知道某个类别的网页类型。这就是竖起大拇指竖起大拇指按钮的作用。

如果我给页面竖起大拇指,它可能会增加一点不仅与该页面有关,而且与该页面相关联的关键字也一样,因此,与该页面关键字具有高度相关性的其他页面将被加权,以便显示在我的用户ID下。

“非我" 是此按钮的基本功能。 报告垃圾邮件向StumbleUpon发送一条消息,指出所提供的页面与应有的内容完全不同,而且只是垃圾邮件! 重复内容可帮助StumbleUpon知道何时多次为您提供页面。如果页面被添加到多个类别下,则可能会发生这种情况。 阻止网站将阻止提供该页面的整个网站。这是当我遇到另一种语言的页面或者完全不适合我的页面时使用的。

下面是一个小图表,可以直观地显示简化的过程,因为我相信它会发生。

这就是StumbleUpon的简单基础。当您移至StumbleUpon工具栏的右侧时,可以使用不同的选项来完善Stumbling并增加页面排名的质量。

标签: