什么是工业大数据? 随着新工业革命时代的序幕徐徐拉开,物联网、工业互联网、智能ICT技术、人工智能等技术成为舞台上最受瞩目的新星。在这些新兴技术的推动下,工业领域中的大数据环境正在逐渐形成,数据从制造过程中的副产品转变成为备受企业关注的战略资源。如果大数据是工业价值转型的核心驱动力,那么我们该怎么去定义和使用大数据?关于这个问题,我们在《工业大数据》这本书中曾表达过一个观点:大数据并不是目的,而是分析问题的一种视角和解决问题的一种手段。通过对数据的洞察,可以预测需求、预测制造、挖掘不可见世界的价值、解决和避免不可见问题的风险,以及利用数据去整合产业链和价值链,这些才是大数据的核心价值和目的。 一提到大数据,人们首先会想到在互联网和商业等环境中,利用大量的行为数据来分析用户行为和预测市场趋势等应用。但是对工业大数据的定义和应用却很难直观地理解和想象。现在对大数据最为流行的定义,来自于维克托·迈尔-舍恩伯格(Viktor Mayer-Schönberger)和肯尼斯·克耶(Kenneth Cukier)编写的《大数据时代》中提出的4V特性,即Volume(数据量大)、Velocity(流动速度快)、Veracity(准确性)和Variety(来源多样)。这个定义是针对互联网和社会环境中的大数据,从数据工程的技术挑战方面所提出的。而工业大数据的挑战和目的则要通过“3B” 和 “3C” 来理解。 工业大数据应用的“3B”挑战: Bad Quality--在工业大数据中,数据质量问题一直是许多企业所面临的挑战。这主要受制于工业环境中数据获取手段的限制,包括传感器、数采硬件模块、通信协议和组态软件等多个技术限制。对数据质量的管理技术是一个企业必须要下的硬功夫。 Broken--工业对于数据的要求并不仅在于量的大小,更在于数据的全面性。在利用数据建模的手段解决某一个问题时,需要获取与被分析对象相关的全面参数,而一些关键参数的确会使分析过程碎片化。举例而言,当分析航空发动机性能时需要温度、空气密度、进出口压力、功率等多个参数,而当其中任意一个参数缺失时都无法建立完整的性能评估和预测模型。因此对于企业来说,在进行数据收集前要对分析对象和目的有清楚的规划,这样才能够确保所获取数据的全面性,以免斥巨资积累了大量数据后发现并不能解决所关心的问题。 Below the Surface--除了对数据所反映出来的表面统计特征进行分析以外,还应该关注数据中所隐藏的相关性。对这些隐藏在表面以下的相关性进行分析和挖掘时,需要一些具有参考性的数据进行对照,也就是数据科学中所称的 “贴标签” 过程。这一类数据包括工况设定、维护记录、任务信息等,虽然数据量不大,但在数据分析中却起到至关重要的作用。 工业大数据分析的“3C”目的: Comparison(比较性)--从比较过程中获取洞察,既包括比较相似性,也包括比较差异性。比较的维度既可以是在时间维度上与自身状态的比较,也可以是在集群维度上与其他个体的比较。这种比较分析能够帮助我们将庞大的个体信息进行分类,为接下来寻找相似中的普适性规律和差异中的因果关系奠定基础。 Correlation (相关性)--如果说物联网是可见世界的连接,那么所连接对象之间的相关性就是不可见世界的连接。对相关性的挖掘是形成记忆和知识的基础,简单地将信息存储下来并不能称之为记忆,通过信息之间的关联性对信息进行管理和启发式的联想才是记忆的本质。相关性同时也促进了人脑在管理和调用信息时的效率,我们在回想起一个画面或是情节的时候,往往并不是去回忆每一个细节,而是有一个如线头一样的线索,你去牵它一下就能够引出整个场景。这样的类似记忆式的信息管理方式运用在工业智能中,就是一种更加灵活高效的数据管理方式。 Consequence (因果性)--数据分析的重要目的是进行决策支持,在制定一个特定的决策时,其所带来的结果和影响应该被同等地分析和预测。这是以往的控制系统所不具备的特性,也是智能化的本质。工业系统中的大部分活动都具有很强的目的性,就是把目标精度最大化,把破坏度最小化的 “结果管理”。结果管理的基础是预测,例如制造系统中,如果我们可以预测到设备的衰退对质量的影响,以及对下一个工序质量的影响,就可以在制造过程中对质量风险进行补偿和管理,制造系统的弹性和坚韧性就会增加。 总结而言,互联网和商业大数据与工业大数据在技术挑战、数据属性和分析目的等方面有很多区别,这也决定了两者技术手段的不同。 工业大数据的价值及意义 在工业和商业从分离到融汇的过程中,我们观察到,有四个值得关注的重要转变,客户需求的转变,生产系统的转变,商业模式的转变,工业系统运转模式(决策模式)的转变。客户需求的转变,是从无到有、从有到精、再从精到个性化。生产系统的转变,是从简单到复杂、从复杂到规模化、从规模化到精益化、从精益化到柔性化、从柔性化到智能化,最终目的是实现无忧的生产环境。商业模式的转变,是从卖产品到卖能力、从卖能力到卖服务、从卖服务到卖价值,目的是去挖掘用户不可见的价值。工业系统运转模式的转变,从应激式的解决问题,到基于经验的预防问题,现在正利用数据向基于线索和事实来避免问题的模式转变,最终目的是实现知识的获取和传承。这一系列转变背后的核心是工业价值的转型,大数据在这个转型的过程中将起到举足轻重的作用。简单来说工业大数据的目的是实现从自造到制造,从制造到智造,从智造到传承。 利用大数据挖掘“不可见世界”中的客户价值 “有之以为利、无之以为用”是出自老子《道德经》中的一句话,其中的智慧放在当今工业的价值模式中依然十分适用。这句话可以理解为:一切事物的实体为我们提供可以凭借的可见的基础条件,而其中所隐藏的空间和可变化的无限可能才是被我们真正使用并创造价值的所在。 这些价值存在于用户的使用场景、隐形因素的相关性和产品被制造和使用的全生命周期这些 “不可见世界” 中。数据将成为挖掘这些价值的重要手段,主要体现在:利用数据挖掘在使用中获得新的知识 和技术对现有产品进行改进;利用数据去发现和定义用户未知的需求;以数据为媒介向用户提供增值服务。 利用大数据实现无忧虑的制造环境有三个方向,数据在每一个阶段中扮演的作用也并不相同。第一个方向是在解决可见问题的过程中积累经验和知识,从而去避免这些问题。在这个过程中,数据可以作为经验和知识的载体。第二个方向是依靠数据去分析问题产生的隐性线索(evidence)、关联性和根原因等,进而利用预测分析将不可见问题显性化,从而实现解决不可见问题的目的。现在的制造系统正在经历从第一个阶段到第二个阶段的转变过程,在完成这个过程后,制造系统将不再有“surprise”,使得所有隐性问题在变成显性问题和影响之前都可以被提前解决。第三个方向是通过对数据的深度挖掘,建立知识和问题之间的相关性,从数据中启发出新的知识,并能够利用知识对制造系统进行精确的建模,产生能够指导制造系统活动的镜像模型,从系统的设计端避免可见及不可见问题的发生。 这三个方向对企业都非常具有借鉴意义,但是需要对不同的情况也适用于不同的方向。总地概括,这三个方向分别适用于以下几类情况中问题的解决: 第一个方向:适合在某一个领域已经经营了很久,有了一定的经验积累,但是却很难总结出为什么做得好或是不好。 第二个方向:在解决了可见的问题之后,仍然存在一些不可见问题对制造系统造成的影响,希望能够了解不可见因素的变化过程和相互的关联性,积累更加深入的制造知识。 第三个方向:在制造基础还较为薄弱的领域,并没有形成太多有效的数据,但是拥有非常丰富的使用数据和经验,则可以借助使用过程中积累的知识对制造系统提出设计的要求。
|