2012-09-12 15:35:03 来源:TechTarget中国
飞机旅行似乎已快要达到很多乘客的忍耐极限--座位间距小、食物选择少、飞行时间长,还有就是安检的等待和催促。
旅行者们在经过主要枢纽机场的时候都已经做好了这样的心理准备。不过,他们有可能不知道,在每次飞行的背后,都有着大量数据的生成;只有对它们进行采集、挖掘、分析才能保证飞行安全。虽然大部分数据都是结构化数据,但是也有一部分是文本形式,来自撰写报告、音频录音和警示信号。
NASA首席数据科学家Ashok Srivastava说:“所有人都知道国家空域非常安全。”Srivastava是系统范围安全保险技术项目(SSAT)的牵头人,列举了1959到2006年每年的死亡事故率,来证明近五十年间这一比率的稳固下滑趋势。
“但现在的问题是,在不断增加的航班数量中,怎样才能让航行变得更安全一些?”
在今年夏天第八届年度文本分析峰会(Text Analytics Summit)的演讲中,Srivastava提到,每年的航班增长率可达2%到3%,根据具体经济情况上下波动。而交通统计局(Bureau of Transportation Statistics)的报告显示,美国交通部仅在2011年一年中就记录了1000万次国内和国际商业航班。如果增长率为2%,那就是说每年都有几十万次新的航班开通,给空域加压。
他说:“如果是这样的情况,我们只有寻找到提高安全性的方式,才能保持低事故率。这是一个NASA和其他机构目前正在努力的领域,关键就在于必须大力控制住风险。”
通过文本分析得出事件原因
Srivastava和他的团队会仔细分析发生的异常事故,其中一个方法就是在地图上按照连续性把它们标识出来,通常从一个安全的州开始。而对于那些在连续性中“反常的州”,团队会特别注意,因为这意味着事有蹊跷、值得警惕;他们会在这样的地方上做下记号,提示该路线安全系数低,可选择回航到安全的州。
“文本在理解事件中所扮演的角色越来越重要。”
团队对运营数据进行分析,识别在反常的州发生的事件,同时也会参考机组和地勤工作人员的报告。Srivastava称,这些报告能够帮助他们理解事件发生的随机因素和实际原因。
在金融业中,按秒以计的数字数据可以显示股票走势,而媒体报告能够解析数字之外股票涨跌的原因。航空报告也是这样。[page]
“单凭数字数据本身,我们没办法分析出事故的原因。”
Srivastava举出实例,大概一年多以前,肯尼迪国际机场发生了一次事故,埃及航空公司的986次航班和德国汉莎航空公司的411次航班在跑道上差点发生碰撞,还好没有酿成惨剧。
“请问这次事故为什么会发生?是怎么回事?我们又怎样对这次数据进行分析?”对此,他们展开了调查,包括分析飞行员与控制塔之间的音频录音,后来得知是埃及航空公司的航班转错了弯。NASA还处在音频分析的初级阶段,即将录音转制为文本内容。
搞清楚了是怎么一回事之后,Srivastava和他的团队着眼于从随机因素中提取出预测信息,以防止未来类似事故的发生。
他说:“这对今天的系统安全来讲至关重要,对明天的系统更是如此。”
从分析走向预测
在数据分析流程中有一种传统的方法,即单独分析数字数据和文本数据,然后再把它们整合到一起,得出结论。
Srivastava说:“很多人都在采用这种方式,我认为很有效,但是我们的做法完全不同。”
他们把数据汇集到同一个系统,对所有数据一并分析,包括雷达和卫星系统中的网络数据、软件中的航空数据、引擎和传感器数据、地勤和机组人员的地面文本数据等等。分析在单一架构中通过一级支持无线电导航(一种学习模型、检测模式的机器)完成。
他说:“通过短时间内把所有数据汇集到一起、进行同时分析,我们能够对诸如航空系统这样的真实系统进行高精确度预测。”
数据和文本一样,都可以通过不同的途径、运用多样化的方式进行分析,比如算法式和可视化;这使得NASA和其他机构能够密切关注流行趋势、事件的增幅减幅以及跑道入侵事故的因素。
Srivastava提及了企业在发展自己和规避风险时所采取的主动立场:就像企业社区一样,NASA和其他机构正在尝试着各种臆测、策略和技术,以期能够将问题在发生之前就扼杀在摇篮之中。
“而整个系统的命运都将由数据分析来决定。”
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。