如何解决MYSQL-比较1个表是否具有n个分区和n个表具有相同的结构
我是一名学生,在研究mysql分区时遇到一个问题。
示例我有一个表“ Label”,其中按哈希(TaskId)有10个分区
resourceId (PK)
TaskId (PK)
...
我有10个表,名称表是“ label”:+ taskId:
tables:
task1(resourceId,...)
task2(resourceId,...)
...
能否请您介绍一下两者之间的优缺点? 谢谢
解决方法
欢迎使用堆栈溢出。我希望您在问题中提出了第三种选择:“只是一个没有分区的表”。到目前为止,这是现实世界中几乎所有情况下处理数据的最佳方法。例如,它仅需要维护和查询每个索引的一个副本。如果您的数据接近数十亿行,那么该考虑分区等东西了。
但是没关系。您的问题是将十个表与一个具有十个分区的表进行比较。您的十张表方法通常称为分片您的数据。
首先,这是两者的共同点:它们都由存储设备(ssd或磁盘)上的十个不同的表表示。对可能在十个位置中的任何位置的数据行的查询涉及使用任何可用的索引或其他技术来搜索所有十个数据。这十个表中的每一个都消耗服务器上的资源:打开文件描述符,RAM缓存等。
有一些区别:
- 将一行插入到分区表中时,MySQL会找出要使用的分区。使用分片时,您的应用程序必须找出要使用的表,并为该表编写INSERT查询。
- 查询分区表几行时,MySQL自动从查询的
WHERE
条件中找出必须搜索的分区。另一方面,当您搜索分片数据时,您的应用程序会弄清楚要搜索哪个表。 - 在本例中,您提出了-通过主键上的哈希进行分区-使MySQL仅搜索一个分区的 only 方法是搜索PK的特定值。在您的情况下,该值为
WHERE resourceId = foo AND TaskId = bar
。如果您基于其他条件(WHERE customerId = something
进行搜索-MySQL必须搜索所有分区。这需要时间。在分片的情况下,您的应用程序可以使用自己的逻辑来找出要搜索的表。 - 如果系统变得非常大,则可以将每个分片移动到在自己的硬件上运行的自己的MySQL服务器。然后,当然,您的应用程序将需要为每次访问选择正确的服务器以及正确的分片表。这不适用于分区。
- 如果插入的分区表在每行上都具有自动递增的id值,那么无论行位于哪个分区,每一行都将具有自己的唯一id。在分片的情况下,每个表都有其自己的自动递增的id序列。来自不同表的行将具有重复的ID。
- 用于分区的数据定义语言(DDL:CREATE TABLE等)比分片更为简单。将DDL添加到分区表中比向一堆分片表中添加列或索引要容易和重复的少。利用证明分片或分区合理的数据量,您 将需要添加和修改索引,以便将来满足应用程序的需求。
这些有一些实际差异。 专业提示,除非您有非常好的理由,否则不要分区和共享数据。
请记住,服务器硬件,磁盘硬件和MySQL软件正在积极开发中。如果您的数据要花几年的时间才能增长,那么新的硬件和新的软件版本可能会很快改进,与此同时您不必担心分区/分片。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。