近期美国签证系统瘫痪 或因Oracle升级故障
【IT168 专稿】从7月19日开始,美国签证系统出现技术故障,全球上万名赴美申请者因此受到影响。此次出现故障的美国领事综合数据库(CCD,Consular Consolidated Database)是基于Oracle研发出的最大的数据库系统之一,肩负着美国国务院审批、记录并打印签证及其他赴美入境材料的重任。
据了解,在该领事综合数据库中存有上亿的签证记录、7500万份照片资料,平均每天能办理3.5万份签证业务。美联社称,数据库的运行故障最早出现在本月19日,经检测、排查后该系统于23日恢复使用,但运作效率仍呈现出“大幅下降”的状态。
对于此次事件,微博认证为甲骨文(中国)软件系统有限公司资深主任技术分析师的博友称,CCD平台曾获美国政府大数据解决方案大奖,而此次出现故障的美国签证系统是CCD平台170多个软件应用的其中之一。此次事故的起源是visa应用故障,是由于美国领事局升级其中一个Oracle RAC系统,但没有经过仔细演练上线而造成的。领事局方面的信息技术人员折腾一个礼拜后,7月25号才报告给甲骨文,造成了故障的延误。
ITPUB资深版主吕海波(VAGE)认为,Oracle对于规模一般、繁忙程度一般的数据库,支持的还是可以的;但对于规模极大、极为繁忙的数据库,缺乏有力的支持。这也是阿里系去IOE的主要原因之一。
"去IOE"中的I,在阿里巴巴内部代表者为IBM,真实含义是去掉以IBM为代表的小型机硬件设备,不再使用集中式技术架构,改为开放式X86硬件平台的分布式技术架构提供数据服务;“去IOE”中的O,在阿里巴巴内部代表着甲骨文,真实含义是去掉Oracle数据库,也即以开源数据库产品替代甲骨文、IBM等为典型代表的商业数据库产品;“去IOE”中的E,在阿里巴巴内部代表者为EMC,真实含义是去掉以数据储存的存储设备,也即不再使用EMC、HP、戴尔等公司提供的中高档存储设备,改为使用开放通用的X86主机的本地存储。更多什么是去IOE http://itlife365.com/blog/post/qu-IOE.php
集中式部署(IOE架构)很难适应互联网大规模应用对扩展性的要求,所以所谓去IOE,其实质是分布式架构+开源系统替代了集中式架构+商用系统
他从以下四个方面分析了此次美国签证系统瘫痪事件背后的原因:
一、对闭源的系统,support全靠厂商。随着用户规模扩大,support力度肯定越来越薄弱。但Oracle RDBMS本身已经有数十年的运营基础、众多DBA大力研究、第三方技术人员能力并不逊于原厂。因此采用它还是相对安全的。
二、但对于极为庞大、繁忙的系统,Oracle的support能力毕竟有限,系统稳定性的保证主要靠甲方公司自己的DBA团队。一旦DBA团队能力稍弱,系统问题再所难免
三、oracle最近如火如荼推出内存数据库组件,如果要使用,一定要小心。如果的确需要内存层做缓存,选择Redis、Memcached或CouchBase等或许是更好的选择。Oracle内存组件不像Oracle RDBMS有数十年的运行基础,又是闭源,一旦出现问题,Oracle是否能及时解决,尚未可知。
四、在初期的架构阶段,由于不了解其内部技术原理,仅像工地工人一样“搭建”着使用,没有根据原理,扬长避短真正的“架构”着使用,又如何保证这样使用是最好的?如何保证出现问题后尽量减少线上应用的影响?
截至今天上午,美国签证系统已逐渐恢复,美国驻华使馆签证处重新开始受理签证申请,但故障的影响还在继续。美国哥伦比亚广播公司(CBS)称,因签证系统故障造成大范围影响的事例在美国并非首次出现,2003年9月,该国签证系统遭遇电脑病毒袭击陷入瘫痪状态。
-->>转载于:http://tech.it168.com/a2014/0728/1650/000001650506.shtml