干电脑屏质检怎么样(人力解放?智能质检了解一下(1))
【编者按】近些年来,人工智能技术迅速发展,技术逐步成熟的原因主要得益于人类在算力和算法上的突破,并由此推动AI技术广泛应用至各行业,特别在物联网部署规模进一步扩大后,企业有能力从生产链条中获得大量数据,并经过大数据处理和AI技术机器学习,达到节约人力、淘汰落后产能和获得更大经济利益的目的。然而在这许许多多的应用中,原本应该是首先得到根本改善的智能质检,却一直处于“机器+人”的状态,这一行究竟存在着什么样的特殊性、在实际工作中,机器究竟有没有可能在无人干预的情况下达到甚至超越人类的工作指标?
为什么要做智能质检,这还得从中国质检或者世界工业质检的现状开始。尽管工业4.0提出已经N年了,但我们的工业普遍采用的外观质检的绝对主力依然是人,从传统工业到3C产业的零部件检测,都是靠人眼、人脑、人手来进行处理。尽管人可以达到很高的精度,但相对而言只能维持较短的时间,并且夜班工作效率因光线、工作面、作息规律等原因难以得到保障。
?这是一个相当令人震惊的事实,尤其是小零件的质检效率,和上世纪相比,提高真的没有想象中那么大。
近些年来由于算力和算法的突破,机器视觉或者说计算机视觉(ComputerVision简称CV)的崛起,计算机只要连上摄像头就能够代替人类的眼睛和大脑去解决实际问题,一度让人看到了在这个技术含量低、重复性高的领域使用机器取代人进而大幅提高工作效率的希望。但是若干年过去了,这个技术研究若干年后,结果仍不理想,人的眼睛能看出来的,ComputerVision不一定能检出来,遑论机器取代人一说,最多也就是机器辅助人类进行检查,作为人类的一个帮手,并不能把人类完全代替下来。
一旦技术不能满足生产要求,我们就有必要考虑下是否技术本身出现了问题。那么是不是CV技术走了弯路?我们有必要先了解一下CV技术是怎么做的:拍摄图像→人工判定好的还是坏的→计算机ifthenifthen(如果……则……)的逻辑编程——这就是我们说的ComputerVision。可以这样来理解CV技术就是不断的写程序,写程序,写程序。那么,为什么不能写个通用的程序来执行?这是因为技术不通用,而产品的缺陷存在多种样式,以电脑屏幕划痕为例,什么样的划痕才是缺陷,多深多浅,或者说什么样的是可以放过的,这个逻辑需要程序员自己去总结和编程,然后拿给工业企业用。这个时候,如果我们人类总结错了,或者总结不全,比如说长长的划痕是要检出来的,而事实上划痕却是一个点一个点划的,就不符合长划痕的逻辑,用计算机检的时候它就不够长度,这个时候就会出错,所以需要人力复查,最终检验者依然是人,CV技术只能打辅助。
类似的例子还很多,这种现状,就造成了质检产业的特点:技术不通用而缺陷样式多。所以,尽管作为乙方来说作为ComputerVision的供应商来说CV机的毛利大概都在60%以上,但因为不断的写程序又不断修改,这个过程中就把毛利都吐光了。事实上,很多乙方抱着一个很好的憧憬去做这件事情,做了之后又会发现这个事情不那么好玩,并不能够代替人类解决问题,在不断的售后服务中,乙方生存也受到影响,企业很快就倒闭/关闭,这样也造成甲方去买这个技术的投资也浪费了,这就是我们CV技术的现实。质检的本质就是人类抽象目标特征并加以识别的过程,因为人类不那么完美,不能把所有特征一次总结全,这就导致甲方不能把特征一次性的告诉乙方。
“首先你要定义什么是缺陷,然后再逻辑实现。”这就是CV技术。
??这样的技术,毕竟还不能完全摆脱人类单独工作,那就只能作为人类的助手,稍稍使人提高一点生产效率。而工业发展到当今这个节点下,生产力的强大和技术进步的迅速,几乎可以实现人类的所有要求,那么为了让人类从重复性高而技术含量低的生产线上下来去做服务型的工作,也一定要出现一种技术,满足质检的刚需。
它不仅要能够追上人类的视觉,还要会总结、能应用。是的,它就是人工智能。
从2012年开始到2016年,人工智能技术完成了整个深度学习的革命,它主要体现在视觉方面,完成了计算机AI技术追上人类这样的过程。回顾一下,这个过程首先是由斯坦福的华人科学家叫李飞飞所发起,首先,借助互联网寻找图片,把世界上的物体的图片全找来做一个数据集,这个数据集非常之大,包含了所有的图片,其中含有比如说猫狗人的大头照。然后将数据集向全世界开放,让全世界的科研工作者在这上面来做算法,看识别率,看谁能够把它识别率做的最高,仅仅的几年时间,人类技术完成了一个飞跃。
人类的算法的水平是差错率是在5%左右的量级上,深度学习之后的机器视觉技术在2015年达到了5%,追平人类,2016年超过人类。这是非常伟大的一场科学革命,它意味着我们通过计算机去编一个算法,视觉方面的能力是能够追上人的眼睛人的大脑的。从此机器就可以更好地理解这个世界了。
从这个时间点开始,机器视觉技术才真正具备在工业化领域应用的能力。如果百度一下“智能质检”,可以看到的多是语音质检,同时讲的理论多于工业化迭代。问题出在哪里,为什么好好的智能技术就不能直接投入生产,和各种零件在工厂里打交道?回答这个问题的,是专业进行智能质检的企业领邦智能。2016年6月,领邦智能成立,以“让AI赋能工业质检”作为自己的使命,开始智能质检工业化迭代的研发,并把智能质检定义为“新质检”。这的确是一种新的质检。过去的技术只是辅助质检。
但谁也说不好未来会怎样,包括领邦智能。研发三年,成果比颗粒无收好一点。提起往事,领邦智能崔博士非常感慨:“研发……是很痛苦的一个过程。其实原来我们也没预计三年。我们觉得这样一个深度学习技术科学界都突破了,我们技术界和产业界应该很快可以把它用起来。”结果AI干完了之后就发现还是追不上人类。没错,技术是追上大脑了,但摄像头追不上人类的眼睛。
?人类是怎么看东西?人类是拿一个物体在光线下面各种角度看。工业成像系统追不上人类,就是因为机械的单一视角下有些缺陷根本就成不了像。甚至有些缺陷需要在特殊的光线下才能看到。领邦智能为了解决问题,研发了三年。资本界经常问这一句话:AI落地为什么这么慢?但是回顾过去的历代技术革命,这第四次技术革命还是最快的。
新质检
三年磨一剑,的确是快多了。而领邦智能三年产生的服务,不仅是新的质检,还有新实践、新认知、新商业。万亿级的工业质检市场,把人力换下来,它必须是和以往有重大不同。如果仅仅是技术改善,我们不能称之为一代技术,更不能命名为新质检。仍以CV技术为例,再怎么优化,业内还是称之为自动化质检。
新质检是AI技术,AI质检。首先,质检精度追上人类。CV差错率25%;人类5%;要做到超越人类,必须避免人类的弱点。所有的人和机器混合模式都是我们的无奈,是科学和技术都不够发达的表现。AI质检和CV不同,AI是大脑,不是编程,它在提取特征的时候用不到编程。
具有黑箱色彩的大脑技术
通过神经网络的层层运算,就得出了是猫还是狗的结论。神经网络类似于人类的大脑。
首先,我们给它一个标记,先告诉他是猫是狗,然后让大脑(神经网络)学习,学习完了之后,它会产生一些W系数矩阵,学习完了这个模型,再应用于新的图片上去抽丝拨茧的去一层层抽取特征,最后做出个判断是猫是狗,这里面没有任何规则。
同样,在工业领域,领邦智能研发了iBrain,能够直接把人换下来的一点东西都不缺的完整的方案。iBrain是工业的大脑,是一个深度学习的大脑。它和一个设备端连在一起,整个结构简单表述即为云大脑&端设备。云和端是物联网的概念,现在IoT+AI,端设备也是有硬件的,形成AIoT的网络结构,以云端更加强大的算力进行融合运算,共同来执行追上人类的任务。
追上人类的AI是如何工作的
简单来说,AI的工作分为三个阶段,第一阶段是标记样本。神经网络已经完成仅仅意味着程序写完,事实上这时候的AI什么也不会,领邦智能的工作人员首先给缺陷图片打标签标注上缺陷位置。第二阶段是训练大脑,让神经网络在学习中完成W系数的训练。第三阶段是运行,让大脑去干活。
?举一个生产中的案例,烟盒的外观缺陷检验,第一步,把这个认为是缺陷的位置像素打上标记。
?所有认为是缺陷的像素都要打标记。作为徒弟肯定要先学习的,但是如果作为师傅的人类犯了糊涂,把缺陷漏掉了或者不是缺陷的地方给涂上了,那作为徒弟的人工智能也会跟着出错,要补救过来可能需要十条以上的正确涂色来纠正。
?第二阶段是训练,利用缺陷图片训练神经网络,需要尽可能多的图片,一般来说单一模型的可能会需要一千张,先把图片从COS资源管理器上调到GPU上。大规模的训练利用了GPU的高内存带宽,这一点GPU大大高于CPU(比如Intel的Corei9-7980XE内存带宽约为57GB/s,NVIDIA的TeslaP100带宽约为900GB/s)。所谓训练,其实就是在求解神经网络的W系数。训练结束后,需要做一次验证和测试,看看训练的结果够不够。如果训练结果不够,需要再次进行训练。
训练完成后即进入第三阶段,用于预测,仍以烟盒为例,生产线上过来的烟盒,好的就通过,坏的就打掉。
在这三个阶段的训练过程中,会涉及到一个很大的问题即计算能力。打败人眼的神经网络可能会做到152层以上,它在工作的时候需要非常强大的算力,设备端的CPU算力严重不足,仍然需要用到GPU,甚至需要在云端放非常多的GPU进行运算。
端上通常做一个训练要1-10天,请问哪家工业用户他可以等待这么长的时间——在云上的话训练只需要十个小时。尽管理论上曾经预计工业质检100张图片就OK了,甚至可以在设备端进行训练,事实上100张的估计严重不符合事实,一般来说遇到的缺陷总能填满500到1000张。在设备端进行训练是不可能的。数量偏少则精度不够,在业界已是常识。
这样一来,在设备端打标记,设备端GPU运用于预测,运行在云端的GPU用于训练,这样的一个AIoT结构是把GPU的算力进行了分配。领邦智能在云上有几十块GPU以保证算力。
云训练可以保证我们对客户的辅导减少售后服务的成本,所以第一个认知就是一定是云大脑端设备。
训练中遇到的第二个问题,如果你不在云训练,图片全在客户这边,如何辅导客户,让让客户的技师、工人来掌握这项技术呢?这这也就是当今AI在各个领域落地的过程中所有企业都非常关注的核心问题之一:数据共享和设备上网。
从这个角度来说,技术革命真是不容易,不仅是智能质检。
【下期提要】
?通过数据训练让机器完整替代人类进行质检对我们来说已不是问题,那么,数据共享设备上网、替代人力的效果、具体的实践案例等大量干货,小编将在《人力解放?智能质检了解一下(2)》和《3》中带给大家。
更多精彩内容,请持续关注。