2038年1月19日3时14分7秒

2013/06/19科普#计算机科学#数学#时间#节日#历法#灾难

人类和计算机有很大不同,人脑拥有超强的事物辨析能力、决策处理能力和自我学习能力,并以此弥补了存储(记忆)上的不足;而电脑计算和逻辑处理的基础都极为简单,简单到只会1+1、与或非,简单到连10进制都嫌麻烦,但它速度超快、容量超大、记忆力超好,所以在很多规则性强的领域几乎无人能敌。

举个例子,人类使用的计时系统就很复杂,又是年月日,又是时分秒,一会儿12进制,一会儿60进制,偶尔还来个28、29、30、31不等(月份天数)的进制。如果计算机也这么搞,它显然不乐意,像前面说的它连10进制都嫌麻烦。Unix系统采用了一种超级简单粗暴的方式:以Unix诞生之日1970年1月1日0时0分0秒起经过的秒数来计时。如公元1970年1月2日0时0分0秒的Unix时间就是86400——这符合计算机的性格,反正只要简单,好不好记是健忘的人类才需要考虑的。

这个计时系统被所有Unix和类Unix系统继承下来,而且影响了许多非Unix系统,POSIX标准推出以后,该时间也被称为POSIX时间。当然,Unix并非正巧在这天诞生,就像我国国庆日定在10月1日一样,这也是为了人类好记而选择的,其实最早PDP-7上的UNIX系统1969年就在运行了。

人类的各种历法中都存在“节日”的概念,有的是为了纪念某个人,有的是纪念某件事,有的则纯粹由于日期本身的独特性或趣味性,例如11月11日被称为光棍节(因为数字都是棍子),10月11日被称为萝莉节(因为数字像英文的loli)……爱好节日的无聊人类也没放过Unix“历法”:2001年9月9日1时46分40秒,UNIX时间1000000000,被称为第一个“亿禧年”(Billennium);2005年3月18日1时58分31秒,UNIX时间1111111111,则俨然超级无敌大光棍节;2009年2月13日23时31分30秒,UNIX时间1234567890,是不是该叫阿拉伯数字节?

“亿禧年”是个值得警惕的名词,哪怕是记忆力不好的人类也应该记得本世纪初的“千年虫”问题(简称Y2K BUG):在比Unix诞生更早的计算机中,由于存储成本过高而仅采用两位数字表示年份,一旦到达公元2000年,计算机所表示的00年就出现混乱,并造成了全世界范围内的巨大影响。Unix时间的第二个“亿禧年”出现在公元2033年5月18日3时33分20秒,我们可以拭目以待;第三个“亿禧年”出现在2038年1月19日3时14分7秒,恐怕就不会那么顺利地到来了,因为在那之前,人类首先要解决类似“千年虫”却比“千年虫”更加隐蔽更为棘手的“2038年问题”。

我们知道,再强大的计算机其内部都建立在二进制基础之上,也就是说1234567890这样的数字,在32位计算机系统的内存里实际上是01001001 10010110 00000010 11010010,这串32位二进制数中,最高位被用来表示正负符号,0代表正数,1代表负数,所以它能表示的最大数字就是01111111 11111111 11111111 11111111,即2147483647,当它用来表示Unix时间,则对应公元2038年1月19日3时14分7秒——Unix时间的第三个“亿禧年”——的前一秒。再过一秒钟,Unix时间会溢出变成10000000 00000000 00000000 00000000,首位1代表负数,因此这串二进制数相当于十进制的-2147483648,这是什么概念?——时光倒流。负数表示了一个Unix诞生之前的时间——公元1901年12月13日20时45分52秒,从而引发和“千年虫”类似的混乱。

“2038年问题”的隐蔽之处就在于,人类这种脑子实在记不住2038年1月19日3时14分7秒这个有零有整参差不齐的时刻;而棘手之处在于,它产生的原因更接近系统底层。最简单的解决方式是将所有计算机升级到64位操作系统,以扩展Unix时间的长度。64位二进制数的实际可用位数是63位,最大能表示到公历的292277026596年12月4日,如果那个时候人类文明还存在的话,公元纪年很可能因为太难记而被抛弃了。理想的情况是等到2038年,64位系统已经成为主流,从而避免特意修正这个问题所需的高昂成本。

计算机32位操作系统所能表示的最大整数2147483647(即2的31次方减1)是个神奇的数字,除了会引发“2038年问题”外,它还是第8个梅森素数(目前仅发现49个),也是第3个双重梅森素数(目前仅发现4个),1772至1867年的近百年间,这个数是已知的最大素数。