如何解决复合主键?还是具有唯一复合索引的自动递增主键?
我有两个名为 Student 和 Course 的表,以及一个名为 StudentCourse 的联接表。 学生和课程都具有自动递增整数 Id 。
StudentCourse 表将最多具有10,000条记录(不多!),在大多数情况下,我将使用该表来选择一些数据。 现在,插入性能不再是我关注的问题,我只是想快速获取数据!
我的查询形式为:
select * from studentcourse where studentid == sid and courseid == cid
select * from studentcourse where studentid == sid
以下哪个实现更好?为什么?它总是比另一个更好吗?还是取决于? 对于我的senario是否有更好的解决方案?
1 :使用自动递增 Id 列作为 StudentCourse 的主键,并设置唯一的复合索引,例如(StudentId, CourseId)。
2 :使用复合主键,例如(StudentId,CourseId)
3 :创建没有主键的表,只使用唯一的复合索引,例如(StudentId,CourseId)。
更新
如果我们还有一些其他属性仅在建立关系时才重要!将Score
或Grade
视为 StudentCourse 表中的第三列。在这种情况下,我们应该使用第一个选项吗?我的意思是,假设我们正在使用ORM,并且应该在我们的 Student 类(实体)中引用 StudentCourse 类(实体)。
解决方法
前两个选项很好。重要的部分是在(studentid,courseid)
上具有唯一索引。唯一性保证了数据的完整性(同一名学生不能两次参加同一门课程),并且索引可以提高查找效率。
是否应该使用代理主键进行讨论。如果您需要以某种方式唯一地标识每个记录(例如:例如从另一个表中引用该表),则单列主键可能会派上用场。
我不建议使用第三个选项,因为它不强制执行完整性约束。
最后:在大多数数据库中,索引中键的顺序确实很重要。对于您显示的两个查询,您希望studentid
位于索引的第一位置,因此在此列上进行过滤的查询仍然只能使索引受益。
2 是最好的。
它比 1 好,因为它的索引少了一个(因此占用的空间/缓存更少,并且索引维护的开销也较小)。代理键(例如Id
)在联结表中通常是无用的。
根据您的DBMS,它可能比 3 更好:某些DBMS不允许您cluster使用唯一索引(仅在主键上)的表 1 。即使在允许它的DBMS(例如SQL Server)上,我也会选择 1 来实现更直接和更简单的语法。
1 并且有些不允许您从FOREIGN KEY引用唯一索引(只是PRIMARY KEY或UNIQUE约束),尽管这可能与此处无关。如果是这样,那么您将考虑使用代理密钥Id
。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。