简介 战场中精密传感器网络的激增带来了海量数据,如何通过新的数据处理方式快速融合、利用并将大数据转化为指导行动的情报,进而为指挥控制提供支持成为大数据军用领域的一个研究重点。美国太空与海战系统司令部人员发表的论文《指挥控制系统中的大数据决策支持》(Big Data Decision Support in Command and Control Systems )探讨了大数据环境下实现指挥控制决策支持的方法,同时以V-22 “鱼鹰”倾转旋翼机为例,探讨了通过监视、收集和分析系统装备的数据,保证资产准备就绪程度和最大利用率,从而确保成功执行指挥控制任务。本文编译了该论文的主要内容。
1 应用大数据的指挥控制决策支持 美国太空与海战系统司令部(SPAWAR)Dean Lee等发表的论文《指挥控制系统中的大数据决策支持》一文认为,使用大数据工具有可能实现对快速决策的支持。大数据能够作为计划过程的组成部分,确保资产为执行任务作好准备;在作战过程中,大数据工具能够为行动方案的各种选项快速分析信息。论文描述了在大数据环境下,通过数据存储、数据检索和分析算法这种三管齐下的方法实现指挥控制决策支持。
1.1 数据存储 聚合并存储不同数据来源的能力对于任何指挥控制系统都极其重要。特别是,随着大量数据输入系统,必须为每条数据确定适当的存储机制。在作战指挥控制环境中,结构化、半结构化和非结构化的数据往往同时存在,指挥控制存储系统必须支持各种数据库技术才能有效和高效地存储数据。 为了应对各种各样不同数据库技术的挑战,本文提出了一种系统设计,可以透明地维护不同的数据库技术。首先,定义一个统一的数据输入层,无论实际的存储技术是什么,所有数据来源都可以与系统交互。其次,在系统内部(在数据输入层之后),开发一套针对特定技术的摄取器,以便在数据进入系统时使用适当的存储机制;另外,将其他数据清理和转换规则封装为摄取器的一部分,用于检测和纠正格式错误的数据。最后,将路由层嵌入到数据输入层中,当原始数据进入时,系统可以自动将正确的摄取器与数据关联起来。 图1 输入数据流的系统视图
1.2 高效的数据检索 快速决策的基础是数据的可用性以及快速检索相关数据位的能力。上节描述的后端存储的异构性能够以一种优化的方式存储不同类型的数据。例如,尽管可以将自由格式的文本数据直接存储在分布式文件系统(HDFS)中并通过Solr进行索引,但是如果需要,高度结构化的传感器数据应存储在Accumulo、HBase或者甚至是SQL等数据库中。 从数据提取的角度来说,不应要求用户关注实际的数据存储机制。因此,必须有一个数据查询机制,通过该机制,数据请求将自动路由到适当的后端存储,并且以与数据存储无关的方式将数据检索出来。 尽管系统支持异构存储,但是为每种存储技术开发相应的模式以保持最佳性能仍十分重要。对于大数据存储,一个流行的观点是在读取之前假定数据模式,这意味着数据以blob形式存储,并且仅在查询时才施加结构。对于任何系统,尤其是大数据系统,为了保持最佳的查询性能,数据模式是绝对有必要的。如果系统知道数据是如何存储的,那么系统就可以制定有效且有用的查询来检索该数据片段。为了使指挥控制系统在异构存储环境中能高效运行,必须不断监视和优化后端存储,并且能够以不同的模式存储重复数据,这样在任何情况下都能够以最佳效能检索数据。 图2描述了有关数据请求流的系统视图。图中的实线箭头表示数据请求路径;请注意,还有一个路由层可以自动将请求重定向到适当的数据库。虚线箭头表示数据的返回路径。这张图描绘了一个指挥控制系统,其中数据存储区对最终用户完全透明,但同时仍保留了利用各种数据库进行有效数据检索的好处。 图2 输出数据流的系统视图
1.3 分析 大数据指挥控制决策支持的最后一部分是分析能力。本节辨析了在线分析和离线分析,描述了每种方法的优缺点。有效的指挥控制决策需要这两种分析方法的结合。 1.3.1 在线分析在线分析提供了在数据流入系统时提供决策支持的能力。在线分析算法能够即时对数据片段进行操作,从而为指挥官提供快速决策支持。可以支持这个用例的技术包括Apache Storm和Apache Flume。这两种技术利用体系结构中的企业服务总线(ESB),使数据片段以消息的形式流经系统。在这些在线分析系统中,对工作的原子单位进行了定义,让数据在通过ESB时即刻进行转换。但是,由于在线分析平台的流式传输性质,可以与决策相关联的历史信息非常有限,因此这种算法的输出可以被限制为简单的二进制决策,几乎没有或完全没有任何复杂性。 1.3.2 离线分析另一方面,离线分析功能能够遍历大量数据(包括过去的决策)以形成新的决策。Apache Spark是支持这种分析类型的平台之一。更常见的是,将机器学习和人工智能嵌入到这些类型的分析算法之中,以便可以从数据中提取潜在模式,并可以进行精确分析以提供决策支持。此外,分析算法可以为可能的决策生成依据,从而让最终指挥控制决策者做出明智的决策。但是,由于这些分析算法需要学习的数据量可能很大,因此算法生成结果的时间不确定,可能需要很长时间,这让实时决策支持变得不太可能。
2 应用大数据的装备维护 指挥控制结构通常由设施、装备、通信、程序和人员组成,这些对于指挥官有效地计划、指挥和控制作战行动都至关重要。假设所需的资产都可用于执行任务,那么通过良好的领导能力、流程和系统,就可以成功地完成指挥控制任务。但是,资产准备就绪程度的降低可能会影响整个任务;而对于高度依赖于资产的任务,这个问题会进一步放大。因此,作为指挥控制任务的组成部分,必须始终考虑指挥控制资产的健康状况,这一点非常重要。
在确定指挥控制规划有效性的指标时,可增强指挥控制资产准备就绪程度的技术和方法很重要却常常会被忽略。从历史上看,资产准备就绪程度是通过定期维护来实现的。但是,过多的维护活动可能会导致停机时间增加,从而影响整个任务。一种现代的维护计划方法称为“基于条件的维护(CBM)”,是根据资产健康状况来确定维护活动。由于解释和分析资产健康状况数据所需的额外人力和仪器,“基于条件的维护”需要高昂的成本。此外,随着时间的推移所收集到的资产数据提供的信息经常是错误的,从而阻碍了有效解决资产准备度的问题。但是,随着维护成本的不断增加,不必要的维护活动会对指挥控制任务的目标产生不利影响。 幸运的是,近年来在使用先进的分析技术和能力过程中,也产生了许多创新,能够帮助处理“基于条件的维护”领域中的大量数据集。本文以V-22 “鱼鹰”倾转旋翼机为研究案例,通过对V-22的监视、收集和分析数据,以提高其准备就绪程度,从而确保成功执行指挥控制任务。 图3描述了V-22自动化后勤环境(ALE)的决策维护活动分析过程。基于RESTful Web服务的数据即服务(DaaS)将与存储无关的数据提供给外部使用者;Apache NiFi实现了一种数据消费架构,因此可以将各种类型的数据摄取到基于Hadoop的数据存储异构集合中,其中包括Accumulo和Solr。在DaaS和数据摄取层之间,存在一个通过Apache Kafka技术实现的企业服务总线,Apache Kafka技术能够在体系结构内的各个子系统之间进行代理请求,从而使整个系统具有模块化和可大规模扩展的能力。最后,通过利用Apache Spark和Apache Solr在该系统中实现分析即服务(AaaS)。 图3 V-22系统实施参考
图3中所说明的实施方案对V-22自动化后勤环境的影响是立竿见影的。数据使用者不再依赖本地的临时数据转换来满足他们的需求;相反,该系统将转换逻辑封装在DaaS中,可以与所有用户共享,从而减少了重复的开发工作。此外,该系统已成为所有数据来源的存储库,因为该系统可用于存储所有类型的数据,而无需考虑实际数据类型,还能够有效地将这些数据提供给最终用户。更重要的是,数据来源的聚合使得该系统可以通过利用后端中的大量计算资源,向其用户提供分析即服务。因此,用户可以访问由Hadoop生态系统提供的全部计算能力,而不必担心维护此类系统的复杂性。 此外,这一参考体系结构还有助于通过历史数据来检测趋势,并在发现异常时提醒维护人员;这项关键功能能够帮助“基于条件的维护”实现其指挥控制目标。此外,这项技术能够让飞行器维护人员通过近乎实时地自动化成本效益分析流程来做出更快、更合理的决策。最终,不但可以节省成本,还能提高维护活动的效率。
|