在石油石化行业的上中下游产业链中,量和单位是科研、生产、采购、销售等业务活动中广泛使用的信息交流要素,本文结合其中的一些实例,探讨在石油石化行业的信息系统中常见的量和单位的表达问题。
一、量和单位的标准规范
IEC60027《电工技术中使用的字母符号》标准是国际电工委员会的单位符号标准,在ISO31标准的基础上增加了许多电气行业的单位及符号定义,例如:随着IT技术中二进制的广泛应用,IEC定义了专门的二进制倍数词头,以避免在二进制数值中错误地使用SI中的十进制倍数词头。如词头Ki用于表示二进制的倍数(210)1=1024,词头k表示十进制倍数103=1000。
目前,ISO/IEC80000已取代ISO31标准的各部分内容,取代了IEC60027系列的一部分内容,如ISO/IEC80000-13:2008取代了IEC60027-2:2005中的3.8和3.9章节,具体取代情况如表1所示。
<CTSM>表1ISO/IEC80000取代标准情况</CTSM>
但遗憾的是,尽管量和单位国际标准十几年来更新或新增了数个版本,我国量和单位的系列标准却从1993年后一直没有按照标准中规定的5年一更新的惯例进行同步更新。从国家标准委员会的国家标准计划查询网站检索的结果显示,该系列标准中的GB3100-1993、GB3101-1993、GB3102.1-1993、GB3102.3-1993、GB3102.4-1993、GB3102.5-1993和GB3102.7-1993,原计划在2008年发布更新版本,然而不知何故,至今显示仍处于起草阶段。
二、二进制数值使用十进制倍数词头
在1999年以前,由于国际单位制只定义了十进制的倍数词头,没有规定二进制的倍数词头。在表示信息系统中的二进制数值时,往往出现错误使用十进制倍数词头的现象。如表示内存的存储容量时,“1GB”实际上指的是1073741824=1024×1024×1024字节,按照IEC60027-2的规定,正确的表示方法应为“1GiB”。而常见的硬盘、U盘、光盘上标注的500GB、2GB、4.7GB则实际表示的是十进制下的字节数值。由于在微软的操作系统中是按照二进制倍数计算存储容量,用十进制词头显示存储容量,这一错误导致了在微软的操作系统下看到的硬盘、U盘和光盘的存储容量比标称容量“缩水”。
为了避免使用中的错误,ISO/IEC80000-13规定了一组二进制倍数词头,分别表示210到280。如表2所示。
<CTSM>表2二进制倍数词头</CTSM>
三、不按规定符号表示量和单位的符号
不管是在GB2312字符集还是Unicode字符集中,许多符号在字符集中有相似的字符,如与希腊字母“Φ”相似的符号有“Ф”、“φ”或“?准”。在使用时应严格按照标准的规定使用字符,不应使用相似字符替代。常见相似字符对比如表3所示。
<CTSM>表3常见相似字符对比</CTSM>
需要指出的是,现在计算机系统中使用的各种字符集,对于每个字符的斜体、上下标格式不存在单独的字符编码,也就是这种格式的使用,完全依赖信息系统中的文本格式编辑来实现。
四、信息系统数据中量和单位的表示问题
虽然采用国际单位制具有先进、实用、简单、科学等诸多优点,而且在科学技术领域中已经获得独有的地位,但是由于长期的习惯,一些不正确的表达方式和一些应废止使用的量和单位仍常出现在主数据的描述中。除了前面总结的一些不应发生的错误外,在信息系统中表示量和单位时,还会遇到一些继续需要解决的问题:
1.格式问题
按照规定,量和单位的符号有大小写、正斜体、上下标格式,其中的数字符号也存在正斜体、上下标格式,但在纯文字的非格式文本环境下,除大小写外,正斜体、上下标均为格式设置,在字符集中不存在单独的字符编码。比如在SAP系统中,数据的表示只支持字符集文本,不支持格式输入,因此无法在数据文本中表示符号的正斜体、上下标格式。因此,在保证不产生歧义的情况下,建议按照字符的书写顺序依次表示,并建立一个无格式文本和有格式文本对照表,来弥补由此带来的格式问题。
如水的量浓度n(H2O)在SAP系统中只能表示为n(H2O),材质的强度1447N/mm2,在SAP系统中只能表示为1447N/mm2。
2.数据的同义不同样表示的问题
当数据中表示的量可以采用多种单位表示,同一个量在选择不同单位的时候,有不同表示结果,因此有必要选择统一的、合适的单位来表示,以减少单位不同带来的数据重复。比如:同一类包装箱的规格分别有1m以上和1m以下时,选用m和mm做单位都可以,但选用唯一的单位符号时,将会避免1.1m和1100mm带来的数据同义不同样的情形。
尽管GB3100-1993规定:“SI单位的倍数单位根据使用方便的原则选取。通过适当的选择,可使数值处于实用范围内。一般应使量的数值处于0.1~1000之间”。既要以取值范围不改变有效数字的位数为度,又要解决数据相互之间比对的需要。
3.数据的长度问题
在信息系统中,数据的字段一般是有长度限制的,因此,在将主要内容表述清楚和正确的同时,必须考虑数据的总体字符串长度。在不产生歧义的前提下,建议采取以下办法:
省略量和单位的符号表示中的间隙,如长数字的分组间隙,数值和单位之间的间隙等。
对两个相除构成的组合单位使用相除的斜线表示比用相乘表示要减少使用的字符数量。比如:kg/m3比kg·m-3要少一个字符。
在适合使用倍数词头时,尽量使用,如6000A可以表示为6kA,但1000h不能表示为1kh。
量值的乘、除、和、差组合应视选用的单位符号的字符数量和量值数量灵活选择,如(100×200×300)mm比100mm×200mm×300mm少两个字符,而t=28.4℃±0.2℃比t=(28.4±0.2)℃少一个字符。
五、结束语
随着时代的进步,中国和国际社会的融合将不可避免地在越来越多的领域和范围内展开,量和单位的使用不仅影响到科学研究和技术交流,也实实在在地体现在我们的日常生活中。在数字化生存的大潮下,人类的众多需求更加依赖于信息技术的支撑和引领。在信息系统中,高质量的数据是保障信息有效记录、存储、交换、加工和展现,从而保障业务连续性的基础。
因此,为了数据的一致性、完整性和准确性,提高数据质量,就一定需要遵照并灵活地用好量和单位的标准规范。