关系数据库范式理论是在数据库设计过程中要依据的准则,数据库结构必须要满足这些准则,才能确保数据的准确性和可靠性。这些准则被称为规范化形式,即范式。
第一范式,是最基本的范式。如果关系模式中的所有属性值都是不可再分解的原子值,那么就称关系是第一范式的关系模式。不是第一范式的关系称为非规范化的关系,满足第一范式的关系简称为关系。在关系数据库管理系统中,涉及到的研究对象都是满足第一范式的规范化关系。但是关系中的属性是否都是原子的取决于实际研究对象的重要程度。如对于地址可以用字段address表示,但是当研究对象很重要时,地址也可以分为city,block等。
如果一个数据表已经满足第一范式,而且该数据表中的任何一个非主键字段的数值都依赖于该数据表的主键字段,那么该数据表就满足第二范式。
2NF在1NF的基础之上,消除了非主属性对于码的部分函数依赖。
如果一个数据表已经满足第二范式,而且该数据表中的任何两个非主键字段的数据值之间不存在函数依赖关系,那么该数据表满足第三范式。实际上第三范式就是要求不要在数据库中存储可以通过简单计算得出的数据。这样,不但可以节省存储空间,而且在拥有函数依赖的一方发生变动时,避免了修改成倍数据的麻烦,同时也避免了在这种修改过程中可能造成的人为错误。
3NF在2NF的基础之上,消除了非主属性对于码的传递函数依赖
数据表规范的程度越高,数据冗余就越少,同时造成人为错误的可能性也就越小;同时,规范化的程度越高,在查询检索时需要做的关联等工作就越多,数据库在操作过程中需要要访问的数据表及其之间的关联也就越多。