数据库 – 以适度扩展的方式提供活动Feed项

我正在开发的应用程序有一个活动Feed,每个用户可以看到他们的朋友的活动(很像Facebook)。我正在寻找一种适度扩展的方式来显示给定用户的活动流。我说“适度”,因为我只是想通过一个数据库(Postgresql)和memcached来做到这一点。例如,我想要这个解决方案扩展到200k个用户,每个100个朋友。

目前,存在一个主活动表,用于存储给定活动的呈现的HTML(Jim添加了一个朋友,George安装了一个应用程序等)。此主活动表保留源用户,html和时间戳。

然后,有一个单独的(‘join’)表,只需保留一个指针,该对象应该在其朋友Feed中看到此活动,并指向主活动表中对象的指针。

所以,如果我有100个朋友,我做3个活动,那么连接表将会增长到300个项目。

显然这张桌子会很快成长。它具有不错的属性,但是,提取活动以向用户显示单个(相对)廉价的查询。

另一个选择是保持主活动表,并通过以下方式进行查询:

select * from activity where source_user in (1,2,44,2423,... my friend list)

这样做的缺点是,您正在查询可能永远不会处于活动状态的用户,随着朋友列表的增长,此查询可能变得越来越慢。

我看到双方的利弊,但是我想知道一些SO的人是否可以帮助我衡量选项,并提出一种方式或其他方式。我也对其他解决方案开放,虽然我想保持简单,不能安装像CouchDB等。

非常感谢!

解决方法

我正在倾向于拥有主活动表。如果你这样做,这是我会考虑实施的:

>您可以创建多个活动表,并在从数据库中获取数据时执行UNION ALL。例如,滚动他们每月 – 活动_2010_02等。只要你的例子 – 200K用户x 100个朋友x 3个活动= 60万行。对于PostgreSQL来说,并不是性能方面的关注,但是您可能会考虑到纯粹为了方便起见,最终也是为了轻松的未来扩展。
>

This has the disadvantage that you’re querying for users who may never be active,and as your friend list grows,this query can get slower and slower.

您是否要显示整个活动Feed,回溯到时间的开始?你在原始问题中没有提供太多的细节,但是我会猜测你会显示最后10/20/100个按时间戳排序的项目。一些索引和LIMIT子句应该足以提供即时响应(因为我刚刚在大约2000万行的表上测试)。在繁忙的服务器上可能会更慢,但这应该是硬件和缓存解决方案,Postgres不会成为瓶颈。

即使您提供的活动馈送回到时间的黎明,分页输出! LIMIT子句将会保存在那里。如果基于LIMIT的基本查询是不够的,或者如果您的用户有一长串不再活跃的朋友,您可以考虑将查找限制为最后一天/每周/月,然后提供列表朋友ids:

select * from activity 
  where ts <= 123456789 
    and source_user in (1,... my friend list)

如果您有几个月或几年的表格,搜索的朋友ID将只能在第一个WHERE子句选择的行中执行。

只要我选择你现在考虑的两个解决方案之一。我也会看看像:

>重新考虑你对桌子的非正规化。是否存储预生成的HTML输出真的最好的办法?通过查找表的活动而不是在运行中生成模板输出,你会更好地表现出来吗?预先生成的HTML一开始就可以看起来更好,但是考虑像磁盘存储,API,未来的布局更改和存储HTML这样的东西毕竟不会那么有吸引力。查找表可能包含您可能的活动 – 添加好友,更改状态等,活动日志将引用该朋友的身份,如果其他用户参与活动,则可以参考该朋友的身份。
>预先生成HTML,但不将其存储在数据库中。将磁盘上的内容保存为预生成的页面。然而,这不是一个银弹,而且在很大程度上取决于您的站点上的写入 – 读取的比例。即公共论坛上的一个典型的讨论话题可能有十几条消息,但可以查看数百次 – 这是缓存的好候选人。而如果您的应用程序更加适应立即状态更新,并且您必须重新生成HTML页面,并在每次视图之后再次将其保存在磁盘上,那么这种方法没有任何价值。

希望这可以帮助。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


本篇内容主要讲解“sqlalchemy的常用数据类型怎么使用”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“sqlalche...
今天小编给大家分享一下sqlServer实现分页查询的方式有哪些的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家
这篇文章主要介绍“sqlmap之osshell怎么使用”,在日常操作中,相信很多人在sqlmap之osshell怎么使用问题上存在疑惑,小编查阅了各式资料,整理出
本篇内容介绍了“SQL注入的知识点有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧...
1. mssql权限sa权限:数据库操作,文件管理,命令执行,注册表读取等system。是mssql的最高权限db权限:文件管理,数据库操作等 users-administratorspublic权限:数据库操作 guest-users2、sql server注入执行命令查
sql执行计划如何查看?在SPL庞大的数据中我们不知道如何查看实际数据库中发生了什么事情,有必要定期进行查询优化和索引否则会影响我们后期的SQL的查询速度。那么针对这样的问题我们必须要知道SQL执行的计划,在本文中winwin7小编给大家分享下SQL执
SQL Server 是Microsoft 公司推出的关系型数据库管理系统。具有使用方便可伸缩性好与相关软件集成程度高等优点应用非常广泛。不过在使用中,我们会遇到非常多的错误,面对这么庞大的数据库环境,当然会有精确的错误代码的对照季,下面小编分享的
SQL Server本地账户无法登陆出现错误提示:error:40-Could not open a connenction to SQL Server的问题很常见,对于初学者来说可能不知道如何解决,一起来看看下面的解决方案。解决步骤如下:1、这种情况需要开启 SQL Server service
微软推出的SQL2008是一款非常好用的数据库软件,它稳定、功能强大,为众多企业提供了最佳的数据库解决方案,那么我们如何在Windows中安装它呢,一些朋友对SQL Server 2008的安装过程还不是很熟悉,下面就一起来看看SQL Server 2008详细安装图解...
本页概要如果您使用的是 SQL Server 2005备份和还原Sp_detach_db 和 Sp_attach_db 存储过程关于排序规则的说明导入和导出数据(在 SQL Server 数据库之间复
DBCC CHECKIDENT 检查指定表的当前标识值,如有必要,还对标识值进行更正。 语法 DBCC CHECKIDENT ( &#39;table_name&#39; [ , { NORESEED
这里对 SQL Server 字符串函数进行分门别类地列出,便于查阅和记忆,相信大家都在其它方面有高深的编程基础,从字面上来说大家都知道这些函数的意义,就不对这些函数作过多的解释了,主要谈些经验,具体
查询及删除重复记录的方法 1、查找表(people)中多余的重复记录,重复记录是根据单个字段(peopleId)来判断select*frompeoplewherepeopleIdin(selectpe
微软发SQL Server 2008第二个CTP预览版from: http://news.csdn.net/n/20070807/107158.html8月7日消息,微软公司本周发布了SQL Serv
症状当您将数据库备份恢复到另一台服务器时,可能会遇到孤立用户的问题。SQL Server 联机丛书中的孤立用户疑难解答主题中没有讲述解决此问题的具体步骤。本文介绍了如何解决孤立用户问题。更多信息虽然术
当登录SQL Server 2005时可能碰到错误: &#39;No Process is on the Other End of the Pipe&#39;。解决方法:(1)Open up SQL
概要本文描述如何映射标准登录和集成登录来解决在运行 SQL Server 的服务器之间移动数据库时的权限问题。更多信息当您将数据库从一个运行 SQL Server 的服务器移到另一个运行 SQL Se
----------------------------------------问题:该用户与可信的SQL SERVER 连接无关联使用sa用户或自建用户使用“SQL SERVER 身份认证”连接数据
更新日期: 2007 年 5 月 20 日 使用下表可以确定各种版本的 Microsoft SQL Server 2005 支持哪些功能。有关 SQL Server 2005 Enterprise E
当从Excel导入数据到Sql Sever中,可能会出现以下问题:&#xD;&#xA;对于指定的缓冲区大小而言,源列的数据太大