首页 > > 网络编程 > Mssql >

Microsoft SQL Server 2000 的国际化功能(1)

2008-04-02 10:47:00来源：互联网阅读 ()

简介

Microsoft® SQL Server™ 2000 包括各种支持国际化操作和环境的强大功能。扩展的多种语言功能使 SQL Server 2000 成为一种引人注目的数据库产品和应用程式平台。本文将完整地概述在全球范围内使用这些功能的方法。除了列出一系列功能外，本文还将解释国际化/多种语言需要会怎样影响项目的各个方面。chin a i t p oe er . co msZSXwpB

什么是 Unicode？如何使用 Unicode？

Unicode 支持是 SQL Server 2000 多种语言支持的基础。Unicode 是一种标准，旨在支持全球任何的脚本。无论是何种平台、程式还是语言，Unicode 为每个字符提供了一个唯一的代码数据点。支持 Unicode 的程式能够处理任何语言的数据。Unicode 3.0 能够处理多达 1,114,112 个字符。chin a i t p oe er . co msZSXwpB

Unicode 是由 Unicode Consortium 管理的行业标准。该组织认识到任何语言具备单一字符集的重要性。Microsoft 是 Unicode Consortium 的成员。大部分参加的公司和 Microsoft 都有相同的动机：在创建全球软件解决方案之际，呈现多种语言数据能力的重要性是显而易见的。其他许多公司和个人的加入是为了了解多种语言数据处理方面的问题和技巧。chin a i t p oe er . co msZSXwpB

现在的 Unicode Standard 3.01 版等同于 ISO-10646，后者是继 Unicode 1.1 发布之后和 Unicode 中任何代码数据点匹配的国际化标准。行业标准和国际化标准的有效结合后，能够防止任何个人因个人利益而违反这两种标准的目标：建立适用于任何人的字符集！chin a i t p oe er . co msZSXwpB

有关周详信息，请访问 Unicode Consortium 的 Web 站点。chin a i t p oe er . co msZSXwpB

编码

Unicode 将代码数据点映射到字符，但实际上对数据在内存、数据库中或 Web 页上的表示方式并不作具体说明。这就是实际的 Unicode 数据编码的作用。Unicode 具备多种不同的编码。本节将说明以下几种常用的编码： chin a i t p oe er . co msZSXwpB

UCS-2
UTF-16
UTF-8

利用本文提供的有关编码的信息，您能够更好地了解 Unicode 连同存储 Unicode 的一些方法。通常情况下，只需选择一种 Unicode 数据类型即可，而不必考虑这些细节。但在下列情况下，了解编码都是相当重要的： chin a i t p oe er . co msZSXwpB

正在处理可能用其他方式对 Unicode 进行编码的应用程式
必须向其他平台（非 Microsoft Windows®）或 Web 服务器发送数据
必须管理数据和其他编码之间的导入或导出

UCS-2

UCS-2 是 Microsoft Windows NT® 4.0、Microsoft® SQL Server™ 7.0 版和 Microsoft SQL Server 2000 所使用的主要 Unicode 编码。UCS-2 允许对 65,536 个不同代码点进行编码。存储在 SQL Server 2000 的 Unicode 中的任何信息均以这种编码进行存储，即无论所使用的是什么字符，都会用两个字节表示每一个字符。因此，拉丁字母“A”的处理方式和以下字母相同： chin a i t p oe er . co msZSXwpB

chin a i t p oe er . co msZSXwpB

西里尔字母 Sha
chin a i t p oe er . co msZSXwpB

chin a i t p oe er . co msZSXwpB
希伯来字母 Lamed
chin a i t p oe er . co msZSXwpB

chin a i t p oe er . co msZSXwpB
泰米尔字母 Rra
chin a i t p oe er . co msZSXwpB

chin a i t p oe er . co msZSXwpB
日文平假名字母 E

chin a i t p oe er . co msZSXwpB

每个字母都有一个唯一的代码数据点（对于这些字母，代码数据点分别是 U 0041、U 0248、U 05DC、U 0BB1 和 U 3048，其中每个四位 16 进制数字都表示 UCS-2 所使用的两个字节）。chin a i t p oe er . co msZSXwpB

字节的排序在操作系统级中是至关重要的。由于 SQL Server 在 Windows 平台上运行，他使用的是 Little Endian 编码系统（指“小数在前”）。因此，象 0x1234 这样的 16 进制词将在内存中存储为 0x34 0x12。chin a i t p oe er . co msZSXwpB

UTF-16

UTF-16 是 Microsoft Windows 2000 所使用的主要 Unicode 编码。即使在 Unicode 2.0 发布之前，人们都已清楚地认识到，仅用 65,536 个字符不能实现 Unicode 的目标（即支持每种语言中每个字符对应一个代码数据点）。对于有些语言（如中文），仅是对罕用字符进行编码，就需要这么多的字符。因此，人们添加了对代理范围的支持，以处理额外的 1,048,576 个字符。UTF-16 是完全支持对原始标准进行这种扩展的编码。有关代理范围的信息，请参见主题什么是代理？chin a i t p oe er . co msZSXwpB

标签：

版权申明：本站文章部分自网络，如有侵权，请联系：west999com@outlook.com
特别注意：本站所有转载文章言论不代表本站观点，本站所提供的摄影照片，插画，设计作品，如需使用，请与原作者联系，版权归原作者所有