数据库正规化和设计技巧
2008-04-02 10:46:08来源:互联网 阅读 ()
简单说来,正规化就是在表格设计时,消除冗余性和不协调的从属关系。在本文中,我将通过五个渐进的过程来告诉您在设计中应该了解的正规化技巧。从而建立一个可行而且效率高的数据库。本文也会周详分析一下能够利用的关系类型。
这里假定我们要建立一个用户信息的表格,其中要存储用户的名字、公司、公司地址和一些个人的收藏夹或url。在开始时,您可能定义一个如下的表格结构:
零状态形式
users
name company company_address url1 url2
Joe ABC 1 Work Lane abc.com xyz.com
Jill XYZ 1 Job Street abc.com xyz.com
由于没有进行任何的正规化处理,我们将这种形式的表称为零状态形式的表。留意其中的url1和url2字段---假如我们在应用中需要第三个url呢?这样您就要在表格中多加一列,很明显,这不是个好办法。假如您要创建一个富有扩展性的系统,您就要考虑使用第一个正规化的形式,并且应用到该表格中。
第一级正规化形式
1.消除每个表格中重复的组
2.为每套相关的数据建立一个单独的表格
3.使用一个主键来标识每套相关的数据
以上的表格明显违反了上面第一条的规定,那么第三条的主键又是什么意思呢?很简单,他只是在每个记录中加入一个唯一的、自动增加的整型值。通过这个值,就能够将两个姓名相同的记录区分开来。通过应用第一级正规化形式,我们得到了以下的表格:
users
userId name company company_address url
1 Joe ABC 1 Work Lane abc.com
1 Joe ABC 1 Work Lane xyz.com
2 Jill XYZ 1 Job Street abc.com
2 Jill XYZ 1 Job Street xyz.com
现在我们的表格能够说已处在第一级正规化的形式了,他已解决了url字段的限制问题,但是这样的处理后又带来了一个新的问题。每次在user表中插入一条记录的时候,我们都必须重复任何的公司和用户数据。这样不但令数据库比以前大了,而且很容易出错。因此还要经过第二级正规化处理。
第二级正规化形式
1.为应用在多条记录的字段建立单独的表格
2.通过一个foreign key来关联这些表格的值
我们将url的值放在一个单独的表格中,这样我们就能够在以后加入更多的数据,而无需担心产生重复的值。我们还通过主键值来关联这些字段:
users
userId name company company_address
1 Joe ABC 1 Work Lane
2 Jill XYZ 1 Job Street
urls
urlId relUserId url
1 1 abc.com
2 1 xyz.com
3 2 abc.com
4 2 xyz.com
如上所示,我们创建了单独的表格,users表中的主键userid现在和url表中的foreign key relUserId关联。现在的情况好象已得到了明显的改善。但是,假如我们要为ABC公司加入一个员工记录呢?或更多,200个?这样我们就必须重复使用公司名和地址,这明显不够冗余。因此我们将应用第三级正规化方法:
第三级正规化形式
1.消除不依赖于该键的字段
公司名及地址和User Id都是没有关系的,因此他们应用拥有自己的公司Id:
users
userId name relCompId
1 Joe 1
2 Jill 2
companies
compId company company_address
1 ABC 1 Work Lane
2 XYZ 1 Job Street
urls
urlId relUserId url
1 1 abc.com
2 1 xyz.com
3 2 abc.com
4 2 xyz.com
这样我们就将companies表中的主键comId和users表中名字为relCompId的foreign key关联起来,就算为ABC公司加入200个员工,在companies中也只有一条记录。我们的users和urls表能够不断地扩大,而无需担心插入不必要的数据。大部分的研发者都认为经过三步的正规化就足够了,这个数据库的设计已能够很方便地处理整个企业的负担,此看法在大多数的情况下是正确的。
我们能够留意一下url的字段--您注意到数据的冗余了吗?假如给用户用户输入这些url数据的HTML页面是个文本框,可任意输入的话,这并没有问题,两个用户输入同样收藏夹的概率较少,但是,假如是通过一个下拉式的菜单,只让用户选择两个url输入,或更多一点。这种情况下,我们的数据库还能够进行下一级别的优化--第四步,对于大多数的研发者来说,这一步都是忽略的,因为他要依赖一个很特别的关系--一个多对多的关系,这在我们的应用中是还没有碰到过的。
数据关系
在定义第四个正规化的形式前,我想首先提一下三种基本的数据关系:一对一,一对多和多对多。我们回头看一下经过第一个正规化的users表。要是我们将url的字段放在一个单独的表中,每次在users表中插入一个记录,我们就会在urls表中插入一行。我们将得到一个一对一的关系:用户表中的每一行,都将在urls表中找到相应的一行。对于我们的应用来说,这既不实用也不标准。
然后看看第二个正规化的例子。对于每个用户记录,我们的表格允许有多个urls的记录和之关联。这是个一对多的关系,这是个很常见的关系。
对于多对多的关系来说,就有点复杂了。在我们的第三个正规化形式的例子中,我们的一个用户和很多的url有关,而我们想将该结构变为允许多个用户和多个的urls有关,这样我们就能够得到一个多对多的结构。在讨论前,我们先看看表格结构会有些什么变化
users
userId name relCompId
1 Joe 1
2 Jill 2
companies
compId company company_address
1 ABC 1 Work Lane
2 XYZ 1 Job Street
urls
urlId url
1 abc.com
2 xyz.com
url_relations
relationId relatedUrlId relatedUserId
1 1 1
2 1 2
3 2 1
4 2 2
为了进一步减低数据的冗余,我们运用第四级正规化形式。我们创建了一个颇奇怪的url_relations表,里面的字段均为主键或foreign key。通过这个表,我们就能够消除urls表中的重复项目。以下是第四个正规化形式的具体需要:
标签:
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有
上一篇: 使用MS SQL7的LINKED SERVER(四)
下一篇: IDENTITY列的一个有用操作
IDC资讯: 主机资讯 注册资讯 托管资讯 vps资讯 网站建设
网站运营: 建站经验 策划盈利 搜索优化 网站推广 免费资源
网络编程: Asp.Net编程 Asp编程 Php编程 Xml编程 Access Mssql Mysql 其它
服务器技术: Web服务器 Ftp服务器 Mail服务器 Dns服务器 安全防护
软件技巧: 其它软件 Word Excel Powerpoint Ghost Vista QQ空间 QQ FlashGet 迅雷
网页制作: FrontPages Dreamweaver Javascript css photoshop fireworks Flash