XML编码

编码是Unicode字符转换为等效的二进制表示的过程。当XML处理器读取XML文档,它编码依赖于编码的类型的文件。因此,我们需要指定XML声明的编码类型.

编码类型

主要有两种类型的编码:

  • UTF-8
  • UTF-16

UTF代表UCS转换格式,但UCS的意义是通用字符集。编号8或16中的指用来表示一个字符的比特数。它们或者是8(一个字节)或16(两个字节)。对于没有编码信息的文件,UTF-8的默认设置.

句法

编码类型被包括在XML文档的序言部分。句法为UTF-8编码方式如下图所示:

<?xml version=1.0 encoding=UTF-8 standalone=no ?>

UTF-16 编码的句法

<?xml version=1.0 encoding=UTF-16 standalone=no ?>

例子

下面的例子显示的声明编码:

<?xml version=1.0 encoding=UTF-8 standalone=no ?>
<contact-info>
   <name>Tanmay Patil</name>
   <company>YiiBai</company>
   <phone>(011) 123-4567</phone>
</contact-info>

在上面的例子中的编码=“UTF-8”,则指定的8位被用于表示字符。来表示的16位字符,UTF-16编码可使用.

UTF-8编码的XML文件比UTF-16格式的文件更小.