Microsoft SQL Server 2000 的国际化功能(1)
2008-04-02 10:47:00来源:互联网 阅读 ()
简介
Microsoft® SQL Server™ 2000 包括各种支持国际化操作和环境的强大功能。扩展的多种语言功能使 SQL Server 2000 成为一种引人注目的数据库产品和应用程式平台。本文将完整地概述在全球范围内使用这些功能的方法。除了列出一系列功能外,本文还将解释国际化/多种语言需要会怎样影响项目的各个方面。chin a i t p oe er . co msZSXwpB
什么是 Unicode?如何使用 Unicode?
Unicode 支持是 SQL Server 2000 多种语言支持的基础。Unicode 是一种标准,旨在支持全球任何的脚本。无论是何种平台、程式还是语言,Unicode 为每个字符提供了一个唯一的代码数据点。支持 Unicode 的程式能够处理任何语言的数据。Unicode 3.0 能够处理多达 1,114,112 个字符。chin a i t p oe er . co msZSXwpB
Unicode 是由 Unicode Consortium 管理的行业标准。该组织认识到任何语言具备单一字符集的重要性。Microsoft 是 Unicode Consortium 的成员。大部分参加的公司和 Microsoft 都有相同的动机:在创建全球软件解决方案之际,呈现多种语言数据能力的重要性是显而易见的。其他许多公司和个人的加入是为了了解多种语言数据处理方面的问题和技巧。chin a i t p oe er . co msZSXwpB
现在的 Unicode Standard 3.01 版等同于 ISO-10646,后者是继 Unicode 1.1 发布之后和 Unicode 中任何代码数据点匹配的国际化标准。行业标准和国际化标准的有效结合后,能够防止任何个人因个人利益而违反这两种标准的目标:建立适用于任何人的字符集!chin a i t p oe er . co msZSXwpB
有关周详信息,请访问 Unicode Consortium 的 Web 站点。chin a i t p oe er . co msZSXwpB
编码
Unicode 将代码数据点映射到字符,但实际上对数据在内存、数据库中或 Web 页上的表示方式并不作具体说明。这就是实际的 Unicode 数据编码的作用。Unicode 具备多种不同的编码。本节将说明以下几种常用的编码: chin a i t p oe er . co msZSXwpB
- UCS-2
- UTF-16
- UTF-8
利用本文提供的有关编码的信息,您能够更好地了解 Unicode 连同存储 Unicode 的一些方法。通常情况下,只需选择一种 Unicode 数据类型即可,而不必考虑这些细节。但在下列情况下,了解编码都是相当重要的: chin a i t p oe er . co msZSXwpB
- 正在处理可能用其他方式对 Unicode 进行编码的应用程式
- 必须向其他平台(非 Microsoft Windows®)或 Web 服务器发送数据
- 必须管理数据和其他编码之间的导入或导出
UCS-2
UCS-2 是 Microsoft Windows NT® 4.0、Microsoft® SQL Server™ 7.0 版和 Microsoft SQL Server 2000 所使用的主要 Unicode 编码。UCS-2 允许对 65,536 个不同代码点进行编码。存储在 SQL Server 2000 的 Unicode 中的任何信息均以这种编码进行存储,即无论所使用的是什么字符,都会用两个字节表示每一个字符。因此,拉丁字母“A”的处理方式和以下字母相同: chin a i t p oe er . co msZSXwpB
chin a i t p oe er . co msZSXwpB
- 西里尔字母 Sha
chin a i t p oe er . co msZSXwpB
chin a i t p oe er . co msZSXwpB
- 希伯来字母 Lamed
chin a i t p oe er . co msZSXwpB
chin a i t p oe er . co msZSXwpB
- 泰米尔字母 Rra
chin a i t p oe er . co msZSXwpB
chin a i t p oe er . co msZSXwpB
- 日文平假名字母 E
chin a i t p oe er . co msZSXwpB
每个字母都有一个唯一的代码数据点(对于这些字母,代码数据点分别是 U 0041、U 0248、U 05DC、U 0BB1 和 U 3048,其中每个四位 16 进制数字都表示 UCS-2 所使用的两个字节)。chin a i t p oe er . co msZSXwpB
字节的排序在操作系统级中是至关重要的。由于 SQL Server 在 Windows 平台上运行,他使用的是 Little Endian 编码系统(指“小数在前”)。因此,象 0x1234 这样的 16 进制词将在内存中存储为 0x34 0x12。chin a i t p oe er . co msZSXwpB
UTF-16
UTF-16 是 Microsoft Windows 2000 所使用的主要 Unicode 编码。即使在 Unicode 2.0 发布之前,人们都已清楚地认识到,仅用 65,536 个字符不能实现 Unicode 的目标(即支持每种语言中每个字符对应一个代码数据点)。对于有些语言(如中文),仅是对罕用字符进行编码,就需要这么多的字符。因此,人们添加了对代理范围的支持,以处理额外的 1,048,576 个字符。UTF-16 是完全支持对原始标准进行这种扩展的编码。有关代理范围的信息,请参见主题什么是代理?chin a i t p oe er . co msZSXwpB
标签:
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有
- Microsoft SQL Server 2000 的国际化功能(2) 2008-04-02
IDC资讯: 主机资讯 注册资讯 托管资讯 vps资讯 网站建设
网站运营: 建站经验 策划盈利 搜索优化 网站推广 免费资源
网络编程: Asp.Net编程 Asp编程 Php编程 Xml编程 Access Mssql Mysql 其它
服务器技术: Web服务器 Ftp服务器 Mail服务器 Dns服务器 安全防护
软件技巧: 其它软件 Word Excel Powerpoint Ghost Vista QQ空间 QQ FlashGet 迅雷
网页制作: FrontPages Dreamweaver Javascript css photoshop fireworks Flash