20070703

字库分类(GBK PS CID TrueType OpenType)

Author:  WinkCategories:  Design, Windows

GB、GBK之类的概念和TrueType、PostScript之类的概念并非同类,这里并列列举出来,只是为了方便阅读。另外,最后一段关于OpenType的概念,基本上是援引维基百科中的内容,详细内容请参考维基百科中的OpenType字条

1. GB字库

全称GB2312或GB2312-80,是一个简体中文字符集的中国国家标准,全称为《信息交换用汉字编码字符集——基本集》,由中国国家标准总局发布,1981年5月1日实施。GB2312编码通行于大陆;新加坡等地也采用此编码。几乎所有的中文系统和国际化的软件都支持GB2312。

GB2312标准共收录6763个汉字,GB2312中对所收汉字进行了“分区”处理,每区含有94个汉字/符号。这种表示方式也称为区位码。

01-09区为特殊符号。16-55区为一级汉字共有汉字3755个,按拼音排序;56-87区为二级汉字共有汉字3008个,按部首/笔画排序;10-15区及88-94区则未有编码。

2. GBK字库

GBK全名为汉字内码扩展规范,英文名Chinese Internal Code Specification。K即是“扩展”所对应的汉语拼音(KuoZhan)中“扩”字的声母。1993年,Unicode1.1版本推出,收录了中国大陆、台湾、日本及韩国通用字符集的汉字,总共有20,912个。中国大陆订定了等同于Unicode 1.1版本的“GB13000.1-93”“信息技术通用多八位编码字符集(UCS)第一部分:体系结构与基本多文种平面”。

由于GB2312-80只收录了6763个汉字,有不少汉字,如部分于GB2312-80推出后才简化的汉字(如“啰”)、部分人名用字(如中国前总理朱镕基的“镕”字)、台湾及香港使用的繁体字、日语及朝鲜语汉字等,并未有收录在内。中国大陆于是利用了GB2312-80未有使用的编码空间,收录了所有出现于Unicode 1.1及GB13000.1-93之中的汉字,制定了GBK编码。微软在它出品的Windows 98中,即采用了GBK编码。在微软的系统内称为CP936字码表。

根据西方资料,GBK最初是由微软对GB2312的扩展,也就是CP936,最初出现于Windows 95简体中文版中,由于Windows产品的流行在大陆广泛使用,国家有关部门将其作为技术规范。注意GBK并非国家正式标准,只是国家技术监督局标准化司、电子工业部科技与质量监督司发布的“技术规范指导性文件”。虽然GBK收录了所有Unicode 1.1及GB13000.1-93之中的汉字,但是编码方式与Unicode 1.1及GB13000.1-93不同。仅仅是GB2312到GB13000.1-93之间的过渡方案。

中国国家标准总局于2000年推出了GB18030-2000标准,以取代GBK。GB18030-2000除了保留了全部GBK编码的汉字外,还增加了大约一百个汉字及四位元组编码空间。请参看《GB18030介绍及其与相关标准的比较》

3. 748字库

748字库是方正特有的字库,是在GB字库基础上又增加了一些常用字。748编码是指方正系统在长期应用过程中实施、制定的简体字库和繁体字库编码方式。简体兼容GB2312且有所扩展,共7156字;繁体兼容GB12345并扩展全部BIG-5汉字,共计14943字,去掉繁简共用字4954个,748编码的简繁体共收字16144个。此外,方正748编码还含有丰富的符号库。748编码仅用于方正电子出版系统。

4. TrueType字库

TrueType(简称TT)是由美国Apple公司和Microsoft公司联合提出的一种新型数字化字形描述技术。TT是一种彩色数字函数描述字体轮廓外形的一套内容丰富的指令集合,这些指令中包括字型构造、颜色填充、数字描述函数、流程条件控制、栅格处理器(TT处理器)控制,附加提示信息控制等指令。

TT采用几何学中的二次B样条曲线及直线来描述字体的外形轮廓,二次B样条曲线具有一阶连续性和正切连续性。抛物线可由二次B样条曲线来精确表示,更为复杂的字体外形可用B样长曲线的数学特性以数条相接的二次B样条曲线及直线来表示。描述TT字体的文件(内含TT字体描述信息、指令集、各种标记表格等)可能通用于Mac和PC平台。在Mac平台上,它以“Sfnt”资源的形式存放,在Windows平台上以TTF文件出现。为保证TT的跨平台兼容性,字体文件的数据格式采用Motorola式数据结构(高位在前,低位在后)存放。所有Intel平台的TT解释器在执行之前,只要进行适当的预处理即可。Windows的TT解释器已包含在其GDI(图形设备接口)中,所以任何Windows支持的输出设备,都的TT解释器已包含在其GDI(图形设备接口)中,所以任何Windows支持的输出设备,都能用TT字体输出。

TT技术具有以下优势:

(1) 真正的所见即所得效果。

由于TT支持几乎所有的输出设备,因而对于目标输出设备而言,无论系统的屏幕、激光打印机或激光照排机,所有在操作系统中安装了TT字体均能在输出设备上以指定的分辨率输出,所以多数排版类应用程序可以根据当前目标输出设备的分辨率等参数,来对页面进行精确的布局。

(2) 支持字体嵌入技术,保证文件的跨系统传递性。

TT技术嵌入技术解决了跨系统间的文件和字体的一致性问题。在应用程序中,存盘的文件可将文件中使用的所有TT字体采用嵌入方式一并存入文件。使整个文件及其所使用的字体可方便地传递到其他计算机的同一系统中使用。字体嵌入技术保证了接收该文件的计算机即使未安装所传送文件使用的字体,也可通过装载随文件一同嵌入的TT字体来对文件进行保持原格式,使用原字体的打印和修改。

(3) 操作系统平台的兼容性。

目前Mac和Windows平台均提供系统级的TT支持。所以在不同操作系统平台间的同名应用程序文件有跨平台兼容性。如在Mac机上的PageMaker可以使用在如果已安装了文件中所用的所有TT字体,则该文件在Mac上产生的最终输出效果将与在Windows下的输出保持高度一致。

(4) ABC字宽值。

在TT字体中的每个字符都有其各自的字宽值,TT所用的字宽描述方法比传统的PS的Type 1更为完善和科学。它采用ABC字宽表,即将传统上的一个字符的字宽值划分为三部分:A宽度为在放置字符轮廓前的空白间距,B宽度为字符轮廓本身的间距,C为字符轮廓右方的空白间距。A+B+C即相当于传统的字宽值,同时A或C间距可以分别为负值,以产生特殊的排字效果。采用ABC字宽值可避免传统上使用整字字宽值而引起的累积舍入误差。同时可以避免由此产生的行尾的最后一个字符移至下一行,或行左首字符无法对齐等输出时不可预料的后果。排版应用程序在计算一行的累积字宽时所产生的舍入误差,可以分散到整行中每一字符的A和C间距中,保证了断行的高度准确性和用户定义的左右边界尺寸的精确性。

(5) 精确的字体轮廓描述。

TT技术采用2048×2048的格点空间来定义一个传统的字母M空间(理论上笛卡尔坐标系统所允许的最大空间范围为32767×32767格点),并在此格点空间内对字体原稿轮廓进行数字化,因此更适合于高分辨率输出设备。其性能完全可满足一般应用的需要。即便当未来输出设备的分辨率大幅度提高时,也只要改用更高的格点空间(4096×4096或更高)重新数字化字体即可,从而在理论上保证了TT技术不会落后。

在Windows 98中,系统使用得最多的就是*.TTF(TrueType)轮廓字库文件,它既能显示也能打印,并且支持无极变倍,在任何情况下都不会出现锯齿问题。而*.FOT则是与*.TTF文件对应的字体资源文件,它是TTF字体文件的资源指针,指明了系统所使用的TTF文件的具体位置,而不用必须指定到FONTS文件夹中。*.FNT(矢量字库)和*.FON (显示字库)的应用范围都比较广泛。另外,那些使用过老版本的WPS的用户可能对*.PS文件还有一定的印象,*.PS实际上是DOS下轮廓字库的一种形式,其性能与*.TTF基本类似,采用某些特殊方法之后,我们甚至还可以实现在Windows中直接使用这些*.PS字库(*.PS1、*.PS2都是PS字库)。

5. PostScript字库

也叫做PostScript语言(简称PS),PostScript是由Adobe公司在从前的一种面向三维图形的语言基础上重新整理制作,而于1985年开发的页面描述语言,它是桌面系统向照排设备输出的界面语言,专门为描述图象及文字而设计。作用是将页面上的图象文字,用数字公式的方法记录及在电脑上运行,最后通过PostScript解码器,翻译成所需的输出,比如显示在屏幕上,或在打印机、激光照排机上输出。

PostScript语言是国际上最流行的页面描述语言形式,它拥有大量,可以任意组合使用的图形算符,可以对文字,几何图形和外部输入的图形进行描述和处理,从理论上来说可以描述任意复杂的版面。其设计之成功使用这种页面描述语言成为许多厂家的选择。其丰富的图形功能、高效率地描述复杂的版面,吸引了众多出版系统的排版软件和图形软件对它的支持,几乎所有的印前输出设备都支持PS语言,而PS语言的成功,也使开放式的电子出版系统在国际上广泛流行。80年代末也成为事实的行业标准。经过多年经验的积累和许多PS产品的反馈,1990年推出PS2,在1990年进而推出PS3。

6. OpenType

penType,是一种可缩放字型(scalable font)电脑字体类型,采用PostScript格式,是美国微软公司及Adobe公司开发的,用来替代TrueType字体的新字体类型。这类字体的文件扩展名为“.otf”,类型代码是OTTO,现行标准为OpenType 1.4。

最初发表于1996年,之后在2000年左右才出现大量字体。OpenType源自于微软公司的TrueType Open字型,而TrueType Open字型更早是源自于TrueType字型。OpenType font更包括了Adobe CID-Keyed font技术。Adobe公司已经在2002年末将其字体库全部转向OpenType,到2005年大概有一万多种OpenType字体,其中Adobe产品占了三分之一。

You can follow any responses to this entry through the RSS 2.0 feed. Both comments and pings are currently closed.

Comments are closed.

Back to Page Top