这是我很早以前看过的微软的一篇文章,最近,一些网友问的问题很多理论都在里面,所以,整理一下放在这里,大家可以参考一下。
简介
本文为您提供了在 microsoft ado.net 应用程序中实现和获得最佳性能、可伸缩性以及功能的最佳解决方案;同时也讲述了使用 ado.net 中可用对象的最佳实践;并提出一些有助于优化 ado.net 应用程序设计的建议。
本文包含:
• |
有关 .net 框架包含的 .net 框架数据提供程序的信息。 |
• |
dataset 和 datareader 之间的比较,以及这些对象中每个对象最佳用法的解释。 |
• |
解释如何使用 dataset、commands 和 connections。 |
• |
有关与 xml 集成的信息。 |
• |
通用的技巧和问题。 |
使用 datareader、dataset、dataadapter 和 dataview
ado.net 提供以下两个对象,用于检索关系数据并将其存储在内存中:dataset 和 datareader。dataset 提供一个内存中数据的关系表示形式,一整套包括一些表在内的数据(这些表包含数据、对数据进行排序并约束数据),以及表之间的关系。datareader 提供一个来自数据库的快速、只进、只读数据流。
当使用 dataset 时,经常会利用 dataadapter(也可能是 commandbuilder)与数据源进行交互。当使用 dataset 时,也可以利用 dataview 对 dataset 中的数据应用排序和筛选。也可以从 dataset 继承,创建强类型 dataset,用于将表、行和列作为强类型对象属性公开。
下列主题包括的信息涉及:使用 dataset 或 datareader 的最佳时机、如何优化访问它们所包含数据、以及如何优化使用 dataadapter(包括 commandbuilder)和 dataview 的技巧。
dataset 与 datareader
当设计应用程序时,要考虑应用程序所需功能的等级,以确定使用 dataset 或者是 datareader。
要通过应用程序执行以下操作,就要使用 dataset:
• |
在结果的多个离散表之间进行导航。 |
• |
操作来自多个数据源(例如,来自多个数据库、一个 xml 文件和一个电子表格的混合数据)的数据。 |
• |
在各层之间交换数据或使用 xml web 服务。与 datareader 不同的是,dataset 能传递给远程客户端。 |
• |
重用同样的行组,以便通过缓存获得性能改善(例如排序、搜索或筛选数据)。 |
• |
每行执行大量处理。对使用 datareader 返回的每一行进行扩展处理会延长服务于 datareader 的连接的必要时间,这影响了性能。 |
• |
使用 xml 操作对数据进行操作,例如可扩展样式表语言转换(xslt 转换)或 xpath 查询。 |
对于下列情况,要在应用程序中使用 datareader:
• |
不需要缓存数据。 |
• |
要处理的结果集太大,内存中放不下。 |
• |
一旦需要以只进、只读方式快速访问数据。 |
注填充 dataset 时,dataadapter 使用 datareader。因此,使用 dataadapter 取代 dataset 提升的性能表现为节省了 dataset 占用内存和填充 dataset 需要的循环。一般来说,此性能提升只是象征性的,因此,设计决策应以所需功能为基础。
使用强类型 dataset 的好处
dataset 的另一个好处是可被继承以创建一个强类型 dataset。强类型 dataset 的好处包括设计时类型检查,以及 microsoft visual studio .net 用于强类型 dataset 语句结束所带来的好处。修改了 dataset 的架构或关系结构后,就可以创建一个强类型 dataset,把行和列作为对象的属性公开,而不是作为集合中的项公开。例如,不公开客户表中行的姓名列,而公开 customer 对象的 name 属性。类型化 dataset 从 dataset 类派生,因此不会牺牲 dataset 的任何功能。也就是说,类型化 dataset 仍能远程访问,并作为数据绑定控件(例如 datagrid)的数据源提供。如果架构事先不可知,仍能受益于通用 dataset 的功能,但却不能受益于强类型 dataset 的附加功能。
处理强类型 dataset 中的空引用
使用强类型 dataset 时,可以批注 dataset 的 xml 架构定义语言 (xsd) 架构,以确保强类型 dataset 正确处理空引用。nullvalue 批注使您可用一个指定的值 string.empty 代替 dbnull、保留空引用或引发异常。选择哪个选项取决于应用程序的上下文。默认情况下,如果遇到空引用,就会引发异常。
有关更多信息,请参阅 working with a typed dataset。
刷新 dataset 中的数据
如果想用服务器上的更新值刷新 dataset 中的值,就使用 dataadapter.fill。如果有在 datatable 上定义的主键,dataadapter.fill 会根据主键进行新行匹配,并且当更改到现有行时应用服务器上的值。即使刷新之前修改了它们,刷新行的 rowstate 仍被设置为 unchanged。注意,如果没有为 datatable 定义主键,dataadapter.fill 就用可能重复的主键值添加新行。
如果想用来自服务器的当前值刷新表,并同时保留对表中的行所做的任何更改,必须首先用 dataadapter.fill 填充表,并填充一个新的 datatable,然后用 preservechanges 值 true 把 datatablemerge 到 dataset 中。
在 dataset 中搜索数据
在 dataset 中查询与特定条件相匹配的行时,可以利用基于索引的查找提高搜索性能。当把 primarykey 值赋给 datatable 时,会创建一个索引。当给 datatable 创建 dataview 时,也会创建一个索引。下面是一些利用基于索引进行查找的技巧。
• |
如果对组成 datatable 的 primarykey的列进行查询,要使用 datatable.rows.find 而不是 datatable.select。 |
• |
对于涉及到非主键列的查询,可以使用 dataview 为数据的多个查询提高性能。当把排序顺序应用到 dataview 时,就会建立一个搜索时使用的索引。dataview 公开 find 和 findrows 方法,以便查询基础 datatable 中的数据。 |
• |
如果不需要表的排序视图,仍可以通过为 datatable 创建 dataview 来利用基于索引的查找。注意,只有对数据执行多个查询操作时,这样才会带来好处。如果只执行单一查询,创建索引所需要的处理就会降低使用索引所带来的性能提升。 |
dataview 构造
如果创建了 dataview,并且修改了 sort、rowfilter 或 rowstatefilter 属性,dataview 就会为基础 datatable 中的数据建立索引。创建 dataview 对象时,要使用 dataview 构造函数,它用 sort、rowfilter 和 rowstatefilter 值作为构造函数参数(与基础 datatable 一起)。结果是创建了一次索引。创建一个“空”dataview 并随后设置 sort、rowfilter 或 rowstatefilter 属性,会导致索引至少创建两次。
分页
ado.net 可以显式控制从数据源中返回什么样的数据,以及在 dataset 中本地缓存多少数据。对查询结果的分页没有唯一的答案,但下面有一些设计应用程序时应该考虑的技巧。
• |
避免使用带有 startrecord 和 maxrecords 值的 dataadapter.fill 重载。当以这种方式填充 dataset 时,只有 maxrecords 参数(从 startrecord 参数标识的记录开始)指定的记录数量用于填充 dataset,但无论如何总是返回完整的查询。这就会引起不必要的处理,用于读取“不需要的”记录;而且为了返回附加记录,会耗尽不必要的服务器资源。 |
• |
用于每次只返回一页记录的技术是创建 sql 语句,把 where 子句以及 order by 子句和 top 谓词组合起来。此技术取决于存在一种可唯一标识每一行的办法。当浏览下一页记录时,修改 where 子句使之包含所有唯一标识符大于当前页最后一个唯一标识符的记录。当浏览上一页记录时,修改 where 子句使之返回所有唯一标识符小于当前页第一个唯一标识符的记录。两种查询都只返回记录的 top 页。当浏览上一页时,需要以降序为结果排序。这将有效地返回查询的最后一页(如果需要,显示之前也许要重新排序结果)。有关这个技术的一个示例,请参阅 paging through a query result。 |
• |
另一项每次只返回一页记录的技术是创建 sql 语句,把 top 谓词和嵌入式 select 语句的使用结合在一起。此技术并不依赖于存在一种可唯一标识每一行的办法。使用这项技术的第一步是把所需页的数量与页大小相乘。然后将结果传递给 sql query 的 top 谓词,该查询以升序排列。再把此查询嵌入到另一个查询中,后者从降序排列的嵌入式查询结果中选择 top 页大小。实质上,返回的是嵌入式查询的最后一页。例如,要返回查询结果的第三页(页大小是 10),应该书写如下所示的命令: select top 10 * from (select top 30 * from customers order by id asc) as table1 order by id desc 注意,从查询中返回的结果页以降序显示。如果需要,应该重新排序。 |
• |
如果数据不经常变动,可以在 dataset 中本地维护一个记录缓存,以此提高性能。例如,可以在本地 dataset 中存储 10 页有用的数据,并且只有当用户浏览超出缓存第一页和最后一页时,才从数据源中查询新数据。 |
有关更多信息,请参阅 .net data access architecture guide。
用架构填充 dataset
当用数据填充 dataset 时,dataadapter.fill 方法使用 dataset 的现有架构,并使用从 selectcommand 返回的数据填充它。如果在 dataset 中没有表名与要被填充的表名相匹配,fill 方法就会创建一个表。默认情况下,fill 仅定义列和列类型。
通过设置 dataadapter 的 missingschemaaction 属性,可以重写 fill 的默认行为。例如,要让 fill 创建一个表架构,并且还包括主键信息、唯一约束、列属性、是否允许为空、最大列长度、只读列和自动增量的列,就要把 dataadapter.missingschemaaction 指定为 missingschemaaction.addwithkey。或者,在调用 dataadapter.fill 前,可以调用 dataadapter.fillschema 来确保当填充 dataset 时架构已到位。
对 fillschema 的调用会产生一个到服务器的额外行程,用于检索附加架构信息。为了获得最佳性能,需要在调用 fill 之前指定 dataset 的架构,或者设置 dataadapter 的 missingschemaaction。
使用 commandbuilder 的最佳实践
假设 selectcommand 执行单一表 select,commandbuilder 就会以 dataadapter 的 selectcommand 属性为基础自动生成 dataadapter 的 insertcommand、updatecommand、和 deletecommand 属性。下面是为获得最佳性能而使用 commandbuilder 的一些技巧。
• |
commandbuilder 的使用应该限制在设计时或即席方案中。生成 dataadapter 命令属性所必需的处理会影响性能。如果预先知道 insert/update/delete 语句的内容,就显式设置它们。一个比较好的设计技巧是,为 insert/update/delete 命令创建存储过程并显式配置 dataadapter 命令属性以使用它们。 |
• |
commandbuilder 使用 dataadapter 的 selectcommand 属性确定其他命令属性的值。如果 dataadapter 的 selectcommand 本身曾经更改过,确保调用 refreshschema 以更新命令属性。 |
• |
如果 dataadapter 命令属性为空(命令属性默认情况下为空),commandbuilder 仅仅为它生成一条命令。如果显式设置了命令属性,commandbuilder 不会重写它。如果希望 commandbuilder 为以前已经设置过的命令属性生成命令,就把命令属性设置为空。 |
批处理 sql 语句
很多数据库支持把多条命令合并或批处理成一条单一命令执行。例如,sql server 使您可以用分号 (;) 分隔命令。把多条命令合并成单一命令,能减少到服务器的行程数,并提高应用程序的性能。例如,可以把所有预定的删除在应用程序中本地存储起来,然后再发出一条批处理命令调用,从数据源删除它们。
虽然这样做确实能提高性能,但是,当对 dataset 中的数据更新进行管理时,可能会增加应用程序的复杂性。要保持简单,可能要在 dataset 中为每个 datatable 创建一个 dataadapter。
用多个表填充 dataset
如果使用批处理 sql 语句检索多个表并填充 dataset,第一个表用指定给 fill 方法的表名命名。后面的表用指定给 fill 方法的表名加上一个从 1 开始并且增量为 1 的数字命名。例如,如果运行下面的代码:
visual basic dim da as sqldataadapter = new sqldataadapter("select * from customers; select * from orders;", myconnection) dim ds as dataset = new dataset() da.fill(ds, "customers") //c# sqldataadapter da = new sqldataadapter("select * from customers; select * from orders;", myconnection); dataset ds = new dataset(); da.fill(ds, "customers");
来自 customers 表的数据放在名为 “customers” 的 datatable 中。来自 orders 表的数据放在名为 “customers1” 的 datatable 中。
填充完 dataset 之后,可以很容易地把 “customers1” 表的 tablename 属性改为 “orders”。但是,后面的填充会导致 “customers” 表被重新填充,而 “orders” 表会被忽略,并创建另外一个 “customers1” 表。为了对这种情况作出补救,创建一个 datatablemapping,把 “customers1” 映射到 “orders”,并为其他后面的表创建其他的表映射。例如:
visual basic dim da as sqldataadapter = new sqldataadapter("select * from customers; select * from orders;", myconnection) da.tablemappings.add("customers1", "orders") dim ds as dataset = new dataset() da.fill(ds, "customers") //c# sqldataadapter da = new sqldataadapter("select * from customers; select * from orders;", myconnection); da.tablemappings.add("customers1", "orders"); dataset ds = new dataset(); da.fill(ds, "customers");
使用 datareader
下面是一些使用 datareader 获得最佳性能的技巧,同时还回答了一些关于使用 datareader 的常见问题。
• |
在访问相关 command 的任何输出参数之前,必须关闭 datareader。 |
• |
完成读数据之后总是要关闭 datareader。如果使用 connection 只是用于返回 datareader,那么关闭 datareader 之后立刻关闭它。 另外一个显式关闭 connection 的方法是把 commandbehavior.closeconnection 传递给 executereader 方法,以确保相关的连接在关闭 datareader 时被关闭。如果从一个方法返回 datareader,而且不能控制 datareader 或相关连接的关闭,则这样做特别有用。 |
• |
不能在层之间远程访问 datareader。datareader 是为已连接好的数据访问设计的。 |
• |
当访问列数据时,使用类型化访问器,例如,getstring、getint32 等。这使您不用进行将 getvalue 返回的 object 强制转换成特定类型所需的处理。 |
• |
一个单一连接每次只能打开一个 datareader。在 ado 中,如果打开一个单一连接,并且请求两个使用只进、只读游标的记录集,那么 ado 会在游标生存期内隐式打开第二个、未池化的到数据存储区的连接,然后再隐式关闭该连接。对于 ado.net,“秘密”完成的动作很少。如果想在相同的数据存储区上同时打开两个 datareaders,就必须显式创建两个连接,每个 datareader 一个。这是 ado.net 为池化连接的使用提供更多控制的一种方法。 |
• |
默认情况下,datareader 每次 read 时都要把整行加载到内存。这允许在当前行内随机访问列。如果不需要这种随机访问,为了提高性能,就把 commandbehavior.sequentialaccess 传递给 executereader 调用。这将 datareader 的默认行为更改为仅在请求时将数据加载到内存。注意,commandbehavior.sequentialaccess 要求顺序访问返回的列。也就是说,一旦读过返回的列,就不能再读它的值了。 |
• |
如果已经完成读取来自 datareader 的数据,但仍然有大量挂起的未读结果,就在调用 datareader 的 close 之前先调用 command 的 cancel。调用 datareader 的 close 会导致在关闭游标之前检索挂起的结果并清空流。调用 command 的 cancel 会放弃服务器上的结果,这样,datareader 在关闭的时候就不必读这些结果。如果要从 command 返回输出参数,还要调用 cancel 放弃它们。如果需要读取任何输出参数,不要调用 command 的 cancel,只要调用 datareader 的 close 即可。 |
二进制大对象 (blob)
用 datareader 检索二进制大对象 (blob) 时,应该把 commandbehavior.sequentialaccess 传递给 executereader 方法调用。因为 datareader 的默认行为是每次 read 都把整行加载到内存,又因为 blob 值可能非常大,所以结果可能由于单个 blob 而使大量内存被用光。sequentialaccess 将 datareader 的行为设置为只加载请求的数据。然后还可以使用 getbytes 或 getchars 控制每次加载多少数据。
记住,使用 sequentialaccess 时,不能不按顺序访问 datareader 返回的不同字段。也就是说,如果查询返回三列,其中第三列是 blob,并且想访问前两列中的数据,就必须在访问 blob 数据之前先访问第一列的值,然后访问第二列的值。这是因为现在数据是顺序返回的,并且 datareader 一旦读过该数据,该数据就不再可用。
有关如何在 ado.net 中访问 blob 的详细描述,请参阅 obtaining blob values from a database。
使用命令
ado.net 提供了几种命令执行的不同方法以及优化命令执行的不同选项。下面包括一些技巧,它们是关于选择最佳命令执行以及如何提高执行命令的性能。
使用 oledbcommand 的最佳实践
不同 .net 框架数据提供程序之间的命令执行被尽可能标准化了。但是,数据提供程序之间仍然存在差异。下面给出一些技巧,可微调用于 ole db 的 .net 框架数据提供程序的命令执行。
• |
按照 odbc call 语法使用 commandtype.text 调用存储过程。使用 commandtype.storedprocedure 只是秘密地生成 odbc call 语法。 |
• |
一定要设置 oledbparameter 的类型、大小(如果适用)、以及精度和范围(如果参数类型是 numeric 或 decimal)。注意,如果不显式提供参数信息,oledbcommand 会为每个执行命令重新创建 ole db 参数访问器。 |
使用 sqlcommand 的最佳实践
使用 sqlcommand 执行存储过程的快速提示:如果调用存储过程,将 sqlcommand 的 commandtype 属性指定为 storedprocedure 的 commandtype。这样通过将该命令显式标识为存储过程,就不需要在执行之前分析命令。
使用 prepare 方法
对于重复作用于数据源的参数化命令,command.prepare 方法能提高性能。prepare 指示数据源为多次调用优化指定的命令。要想有效利用 prepare,需要彻底理解数据源是如何响应 prepare 调用的。对于一些数据源(例如 sql server 2000),命令是隐式优化的,不必调用 prepare。对于其他(例如 sql server 7.0)数据源,prepare 会比较有效。
显式指定架构和元数据
只要用户没有指定元数据信息,ado.net 的许多对象就会推断元数据信息。下面是一些示例:
• |
dataadapter.fill 方法,如果 dataset 中没有表和列,dataadapter.fill 方法会在 dataset 中创建表和列。 |
• |
commandbuilder,它会为单表 select 命令生成 dataadapter 命令属性。 |
• |
commandbuilder.deriveparameters,它会填充 command 对象的 parameters 集合。 |
但是,每次用到这些特性,都会有性能损失。建议将这些特性主要用于设计时和即席应用程序中。在可能的情况下,显式指定架构和元数据。其中包括在 dataset 中定义表和列、定义 dataadapter 的 command 属性、以及为 command 定义 parameter 信息。
executescalar 和 executenonquery
如果想返回像 count(*)、sum(price) 或 avg(quantity) 的结果那样的单值,可以使用 command.executescalar。executescalar 返回第一行第一列的值,将结果集作为标量值返回。因为单独一步就能完成,所以 executescalar 不仅简化了代码,还提高了性能;要是使用 datareader 就需要两步才能完成(即,executereader + 取值)。
使用不返回行的 sql 语句时,例如修改数据(例如insert、update 或 delete)或仅返回输出参数或返回值,请使用 executenonquery。这避免了用于创建空 datareader 的任何不必要处理。
有关更多信息,请参阅 executing a command。
测试 null
如果表(在数据库中)中的列允许为空,就不能测试参数值是否“等于”空。相反,需要写一个 where 子句,测试列和参数是否都为空。下面的 sql 语句返回一些行,它们的 lastname 列等于赋给 @lastname 参数的值,或者 lastname 列和 @lastname 参数都为空。
select * from customers where ((lastname = @lastname) or (lastname is null and @lastname is null))
把 null 作为参数值传递
对数据库的命令中,当把空值作为参数值发送时,不能使用 null(visual basic庐 .net 中为 nothing)。而需要使用 dbnull.value。例如:
visual basic dim param as sqlparameter = new sqlparameter("@name", sqldbtype.nvarchar, 20) param.value = dbnull.value //c# sqlparameter param = new sqlparameter("@name", sqldbtype.nvarchar, 20); param.value = dbnull.value;
执行事务
ado.net 的事务模型已经更改。在 ado 中,当调用 starttransaction 时,调用之后的任何更新操作都被视为是事务的一部分。但是,在 ado.net 中,当调用 connection.begintransaction 时,会返回一个 transaction 对象,需要把它与 command 的 transaction 属性联系起来。这种设计可以在一个单一连接上执行多个根事务。如果未将 command.transaction 属性设置为一个针对相关的 connection 而启动的 transaction,那么 command 就会失败并引发异常。
即将发布的 .net 框架将使您可以在现有的分布式事务中手动登记。这对于对象池方案来说很理想;在该方案中,一个池对象打开一次连接,但是在多个独立的事务中都涉及到该对象。.net 框架 1.0 发行版中这一功能并不可用。
有关事务的更多信息,请参阅 performing transactions 以及 .net data access architecture guide。
使用连接
高性能应用程序与使用中的数据源保持最短时间的连接,并且利用性能增强技术,例如连接池。下面的主题提供一些技巧,有助于在使用 ado.net 连接到数据源时获得更好的性能。
连接池
用于 odbc 的 sql server、ole db 和 .net 框架数据提供程序隐式缓冲连接。通过在连接字符串中指定不同的属性值,可以控制连接池的行为。有关如何控制连接池的行为的详细信息,请参阅 connection pooling for the sql server .net data provider 和 connection pooling for the ole db .net data provider。
用 dataadapter 优化连接
dataadapter 的 fill 和 update 方法在连接关闭的情况下自动打开为相关命令属性指定的连接。如果 fill 或 update 方法打开了连接,fill 或 update 将在操作完成的时候关闭它。为了获得最佳性能,仅在需要时将与数据库的连接保持为打开。同时,减少打开和关闭多操作连接的次数。
如果只执行单个的 fill 或 update 方法调用,建议允许 fill 或 update 方法隐式打开和关闭连接。如果对 fill 和/或 update 调用有很多,建议显式打开连接,调用 fill 和/或 update,然后显式关闭连接。
另外,当执行事务时,显式地在开始事务之前打开连接,并在提交之后关闭连接。例如:
visual basic public sub runsqltransaction(da as sqldataadapter, myconnection as sqlconnection, ds as dataset) myconnection.open() dim mytrans as sqltransaction = myconnection.begintransaction() mycommand.transaction = mytrans try da.update(ds) mytrans.commit() console.writeline("update successful.") catch e as exception try mytrans.rollback() catch ex as sqlexception if not mytrans.connection is nothing then console.writeline("an exception of type " & ex.gettype().tostring() & _ " was encountered while attempting to roll back the transaction.") end if end try console.writeline("an exception of type " & e.gettype().tostring() & " was encountered.") console.writeline("update failed.") end try myconnection.close() end sub //c# public void runsqltransaction(sqldataadapter da, sqlconnection myconnection, dataset ds) { myconnection.open(); sqltransaction mytrans = myconnection.begintransaction(); mycommand.transaction = mytrans; try { da.update(ds); mycommand.transaction.commit(); console.writeline("update successful."); } catch(exception e) { try { mytrans.rollback(); } catch (sqlexception ex) { if (mytrans.connection != null) { console.writeline("an exception of type " + ex.gettype() + " was encountered while attempting to roll back the transaction."); } } console.writeline(e.tostring()); console.writeline("update failed."); } myconnection.close(); }
始终关闭 connection 和 datareader
完成对 connection 或 datareader 对象的使用后,总是显式地关闭它们。尽管垃圾回收最终会清除对象并因此释放连接和其他托管资源,但垃圾回收仅在需要时执行。因此,确保任何宝贵的资源被显式释放仍然是您的责任。并且,没有显式关闭的 connections 可能不会返回到池中。例如,一个超出作用范围却没有显式关闭的连接,只有当池大小达到最大并且连接仍然有效时,才会被返回到连接池中。
注 不要在类的 finalize 方法中对 connection、datareader 或任何其他托管对象调用 close 或 dispose。最后完成的时候,仅释放类自己直接拥有的非托管资源。如果类没有任何非托管资源,就不要在类定义中包含 finalize 方法。
在 c# 中使用 “using” 语句
对于 c# 程序员来说,确保始终关闭 connection 和 datareader 对象的一个方便的方法就是使用 using 语句。using 语句在离开自己的作用范围时,会自动调用被“使用”的对象的 dispose。例如:
//c# string connstring = "data source=localhost;integrated security=sspi;initial catalog=northwind;"; using (sqlconnection conn = new sqlconnection(connstring)) { sqlcommand cmd = conn.createcommand(); cmd.commandtext = "select customerid, companyname from customers"; conn.open(); using (sqldatareader dr = cmd.executereader()) { while (dr.read()) console.writeline("{0}\t{1}", dr.getstring(0), dr.getstring(1)); } }
using 语句不能用于 microsoft庐 visual basic庐 .net。
避免访问 oledbconnection.state 属性
如果连接已经打开,oledbconnection.state 属性会对 dbprop_connectionstatus 属性的 datasourceinfo 属性集执行本地 ole db 调用 idbproperties.getproperties,这可能会导致对数据源的往返行程。也就是说,检查 state 属性的代价可能很高。所以仅在需要时检查 state 属性。如果需要经常检查该属性,监听 oledbconnection 的 statechange 事件可能会使应用程序的性能好一些。有关 statechange 事件的详细信息,请参阅 working with connection events。
与 xml 集成
ado.net 在 dataset 中提供了广泛的 xml 集成,并公开了 sql server 2000 及其更高版本提供的部分 xml 功能。还可以使用 sqlxml 3.0 广泛地访问 sql server 2000 及其更高版本中的 xml 功能。下面是使用 xml 和 ado.net 的技巧和信息。
dataset 和 xml
dataset 与 xml 紧密集成,并提供如下功能:
• |
从 xsd 架构中加载 dataset 的架构或关系型结构。 |
• |
从 xml 加载 dataset 的内容。 |
• |
如果没有提供架构,可以从 xml 文档的内容推断出 dataset 的架构。 |
• |
把 dataset 的架构写成 xsd 架构。 |
• |
把 dataset 的内容写成 xml。 |
• |
同步访问使用 dataset 的数据的关系表示,以及使用 xmldatadocument 的数据的层次表示。 |
注 可以使用这种同步把 xml 功能(例如,xpath 查询和 xslt 转换)应用到 dataset 中的数据,或者在保留原始 xml 保真度的前提下为 xml 文档中数据的全部或其中一个子集提供关系视图。
关于 dataset 提供的 xml 功能的详细信息,请参阅 xml and the dataset。
架构推断
从 xml 文件加载 dataset 时,可以从 xsd 架构加载 dataset 架构,或者在加载数据前预定义表和列。如果没有可用的 xsd 架构,而且不知道为 xml 文件的内容定义哪些表和列,就可以在 xml 文档结构的基础上对架构进行推断。
架构推断作为迁移工具很有用,但应只限于设计阶段应用程序,这是由于推断处理有如下限制。
• |
对架构的推断会引入影响应用程序性能的附加处理。 |
• |
所有推断列的类型都是字符串。 |
• |
推断处理不具有确定性。也就是说,它是基于 xml 文件内容的,而不是预定的架构。因此,对于两个预定架构相同的 xml 文件,由于它们的内容不同,结果得到两个完全不同的推断架构。 |
有关更多信息,请参阅 inferring dataset relational structure from xml。
用于 xml 查询的 sql server
如果正从 sql server 2000 for xml 返回查询结果,可以让用于 sql server 的 .net 框架数据提供程序使用 sqlcommand.executexmlreader 方法直接创建一个 xmlreader。
sqlxml 托管类
.net 框架中有一些类,公开用于 sql server 2000 的 xml 的功能。这些类可在 microsoft.data.sqlxml 命名空间中找到,它们添加了执行 xpath 查询和 xml 模板文件以及把 xslt 转换应用到数据的能力。
sqlxml 托管类包含在用于 microsoft sql server 2000 的 xml (sqlxml 2.0) 发行版中,可从 xml for microsoft sql server 2000 web release 2 (sqlxml 2.0) ??μ?。
更多有用的技巧
下面是一些编写 ado.net 代码时的通用技巧。
避免自动增量值冲突
就像大多数数据源一样,dataset 使您可标识那些添加新行时自动对其值进行递增的列。在 dataset 中使用自动增量的列时,如果自动增量的列来自数据源,可避免添加到 dataset 的行和添加到数据源的行之间本地编号冲突。
例如,考虑一个表,它的主键列 customerid 是自动增量的。两个新的客户信息行添加到表中,并接收到自动增量的 customerid 值 1 和 2。然后,只有第二个客户行被传递给 dataadapter 的方法 update,新添加的行在数据源接收到一个自动增量的 customerid 值 1,与 dataset 中的值 2 不匹配。当 dataadapter 用返回值填充表中第二行时,就会出现约束冲突,因为第一个客户行已经使用了 customerid 值 1。
要避免这种情况,建议在使用数据源上自动增量的列以及 dataset 上自动增量的列时,把 dataset 中的列创建为 autoincrementstep 值等于 -1 并且 autoincrementseed 值等于 0,另外,还要确保数据源生成的自动增量标识值从 1 开始,并且以正阶值递增。因此,dataset 为自动增量值生成负数,与数据源生成的正自动增量值不冲突。另外一个选择是使用 guid 类型的列,而不是自动增量的列。生成 guid 值的算法应该永远不会使数据源中生成的 guid 值与 dataset 中生成的 guid 值一样。
如果自动增量的列只是用作唯一值,而且没有任何意义,就考虑使用 guid 代替自动增量的列。它们是唯一的,并且避免了使用自动增量的列所必需的额外工作。
有关从数据源检索自动增量的列值的示例,请参阅 retrieving identity or autonumber values。
检查开放式并发冲突
按照设计,由于 dataset 是与数据源断开的,所以,当多个客户端在数据源上按照开放式并发模型更新数据时,需要确保应用程序避免冲突。
在测试开放式并发冲突时有几项技术。一项技术涉及在表中包含时间戳列。另外一项技术是,验证一行中所有列的原始值是否仍然与通过在 sql 语句中使用 where 子句进行测试时在数据库中找到的值相匹配。
有关包含代码示例的该主题的详细讨论,请参阅 optimistic concurrency。
多线程编程
ado.net 对性能、吞吐量和可伸缩性进行优化。因此,ado.net 对象不锁定资源,并且必须只用于单线程。一个例外是 dataset,它对多个阅读器是线程安全的。但是,在写的时候需要把 dataset 锁定。
仅在需要的时候才用 com interop 访问 ado
ado.net 的设计目的是成为许多应用程序的最佳解决方案。但是,有些应用程序需要只有使用 ado 对象才有的功能,例如,ado 多维 (adomd)。在这些情况下,应用程序可以用 com interop 访问 ado。注意使用 com interop 访问具有 ado 的数据会导致性能降低。在设计应用程序时,首先在实现用 com interop 访问 ado 的设计之前,先确定 ado.net 是否满足设计需求。