引言
接地线是保证电气施工人员人身安全的生命线,而挂拆接地线是电气操作中危险系数较高的操作,任意一个错误操作都可能对整个电力系统的安全运行造成无法挽回的后果,甚至发生严重的人身伤亡、设备损坏事故[1]。在很多停电检修作业中,由于所用接地线较多、接地点分布于各个地方,高强度的工作会使得作业人员在拆除接地线的过程中漏拆临时接地线,从而致使带接地线合断路器、隔离开关的恶性误操作事故发生[2-4]。根据国网公司的统计数据,约有六成的电气误操作事故都与接地线操作密不可分[5]。目前,接地线需要人工搬运到工作场所,核对间隔名称也是人工进行的,产生疏漏的概率不可完全避免,目前还没有较好的自动化防误方法,因此,展开针对接地线装拆操作的防误研究,对于提高施工安全水平具有重要意义。基于此,设计并提出了一套基于机器视觉技术的接地线装拆安全检测告警软件,并对其应用进行研究。
1 基于机器视觉技术的接地线装拆安全检测告警技术
1.1 告警功能的实现
利用手持终端与伺服电机实现接地线装拆安全检测的告警,接地线装拆的安全检测告警流程如图1所示。首先是利用手持终端同步工作票信息,然后采用手持设备开发OCR识别间隔文本,最后采用手持设备GPIO控制缠绕电机转动方向及转速。
以接地线安装的安全检测告警为例,对大致的流程步骤说明如下>
(1)运维人员到现场操作之前,点击办公电脑中的同步程序,该程序是一个RPA机器人程序,可以替代人工快速浏览今日工作的工作票,并将工作票信息下载到同步目录中。
(2)运维人员将下载的工作票信息文件拷贝到安全移动U盘介质中。
(3)运维人员将安全移动U盘插入手持终端,手持终端自动识别工作票的信息文件,并进行关键结构化信息解析。
(4)运维人员拖动小车到达工作间隔后,利用手持终端的“作业点校核”模块调出摄像机,拍摄作业现场的间隔铭牌照片。
(5)获取到间隔铭牌图片后,程序对图片进行TSR(多场景图像识别),识别出间隔的铭牌文本。
(6)如果间隔识别不出或识别的文本与工作票不对应,则提示用户,重新返回步骤(4);若识别成功,则进入步骤(7)。
(7)再次检索是否存在同一作业点的多个工作票,提交用户选择确认或选择不确认,如果用户确认,则进入步骤(8);如果不确认,则返回步骤(4),重新拍摄校核。
(8)程序解锁电机,使程序具备放线操作功能。
(9)执行放线操作。
(10)拔出接地线桩头,组装接地线杆,进行接地线安装操作。
1.2 软件设计
1.2.1 软件架构,基于机器视觉技术的接地线装拆安全检测告警技术手持终端所用的软件为嵌入式应用软件,采用软件开发MVC框架,更好地实现了用户界面代码、后台业务及数据模型的分离,具有更好的软件工程维护特性。
软件开发框架如图2所示,MVC(模型—视图—控制器)开发框架分为3层,分别是模型层、控制层和视图层。模型层包括工作票、人员、照片、告警信息的模型,可以通过控制层轻松生成实例,不需要编写关系查询语句,从而减少了很多隐性错误;控制层包括业务逻辑的控制,比如对工作票地点和图像识别作业点间隔名称进行匹配等,还包括底层硬件驱动逻辑的控制,比如电机控制、语音播报、图像采集等,通过JNA技术连接底层驱动文件,通常为DLL或SO格式文件。视图层采用了乌班图的UI,主要是通过JavaFX技术自带的图形界面组件实现,为操作人员提供界面显示功能。
1.2.2 编程语言选择,在编程语言的选择方面,由于系统是基于触屏的平板操作系统,可采用的编程语言有Python、Java、C#、C++等,目前大部分控制程序采用C++语言,通过QT编程工具进行编写,但C++语言的内存泄露问题对系统的开发、测试提出了很高的要求,通常适合成熟的应用,如硬件驱动等。Python、Java与C#都没有类似的问题,但Python多用于计算和人工智能建模,C#语言主要用于Windows平台的开发,可移植性不强,而Java具备跨平台操作的可能性,在各类操作系统上的应用是比较容易移植的,因此,本项目采用Java作为编程语言。
1.2.3 收放线功能的实现,针对缠绕线的需求存在放线与收线操作,本项目采用了直流正反转电机,通过控制主板J1900低功耗板GPIO控制技术进行控制,选择一组引脚控制电机启停,一组引脚控制输出PWM电压,通过输出电压大小控制电机的转速。
2 机器视觉技术在接地线装拆安全检测告警中的应用
2.1 机器视觉技术概述
视觉是人类获取外界信息的主要方式,是一种强大的感知方式,而机器视觉技术指的是利用机器模拟人的视觉感知,将感知的事物进行度量、描述的一种技术,度量的实现基于硬件,信息描述的实现基于软件。在机器视觉技术中关键的是对信息的描述,因此,现阶段对于机器视觉技术的发展,一般集中于算法软件层。机器视觉技术中心信息的描述主要任务为对目标进行检测、分割与跟踪三个方面。
2.1.1 目标检测,目标检测指的是在获取到的图像中,设定需关注的语义对象,对基于语义对象的一类或多类型的实例目标进行检测,进而获取实例目标的信息。获取的信息主要包括实例类别信息和在图像中的位置信息。传统的目标检测主要分为3个阶段,分别是区域选取、特征提取及特征分类,通过图像分类技术将目标检测问题转化为图像分类问题;深度学习技术的提出及其在目标检测中的应用,取代了手工进行特征提取的操作,提升了传统算法中对于区域的选取效率,并且提升了特征分类的准确度。目标检测方法主要可分为两类,一种为单阶段检测方法,通过直接回归得到目标位置,代表算法为YOLO、SSD等;另一种为两阶段检测方法,通过生成候选框,在候选框上回归得到目标位置,代表算法有Fast R-CNN、Faster R-CNN等。
2.1.2 目标分割,目标分割主要是将获取到的图像中归属于同一个物体的所有像素进行处理,利用标签化处理方式将其添加到同一标签中,确定图像中物体的边界,进而在视觉上呈现出分割的效果。根据分割对象的不同主要分为两种,一种是语义分割,仅要求在类别上进行分割即可;另一种是实例分割,要求精确分割到个体上。根据分割方式的不同,可分为基于像素相似性分割和基于像素邻域关系分割两种,代表算法有阈值分割算法、区域生长算法等。
2.1.3 目标跟踪,目标跟踪的主要任务是获取目标在视频序列中的运动轨迹,通过确定视频序列中一个或多个目标的大小和位置关系,并通过关系将目标关联起来,进而实现运动轨迹的获取。根据建模方式的不同,目标跟踪算法可分为两种,一种是生成模型构建,通过模型提取目标的特征,并构建特征的表现模型,在图形中进行区域搜索,获取与模型匹配度最高的区域,并输出跟踪结果,代表算法有卡尔曼滤波、Mean-shift算法等;另一种是判别模型构建,该模型将目标和背景视为两种类别,分别进行特征提取、特征分类,将目标跟踪问题转化为二分类问题,代表算法有相关滤波算法、深度学习处理等。
2.2 基于语义特征的场景文本检测方法
在机器视觉技术中针对文字的识别大都采用OCR技术实现,但是OCR处理图片天然存在短板,即必须将字体调整平整才能够形成高度匹配的文字识别效果。自然场景中,很多文字存在着扭曲、不全、颜色脱落等现象,拍摄者的技能、角度、光线等都给识别带来了不确定性,这就如同扫描的文本打印后再次扫描,通过OCR特别容易出现乱码字符是一样的。本文研究的关键是场景文本检测,对象是变电站间隔铭牌,通常来说,铭牌维护都是相对及时的,但也有部分变电站铭牌存在老化及不平整等现状,这给项目的技术路线开展带来了一定程度的干扰。
基于图像处理的OCR识别是进行场景文本检测常用的一类方法,首先拍摄图像,然后将图像通过图形变换,形成规整的二值图像,从而获取文本区域和内部特征,最终根据特征识别相应的文字,因此自然情况下文本识别率不高的原因也就不难理解了。近年来,随着人工智能技术的发展,在特定的领域,通过采集样本利用CNN或RNN进行特征自动提取,通过概率模型学习特定领域范围内的文本识别,成为较好的解决方案,后期又增加了注意力机制,使自然场景下的学习更加高效、有针对性。
针对自然场景文本的检测[6],一般采用PSENET网络对文本进行识别,通常在OCR识别中,文字检测都是由目标检测继承而来,目标检测大多是基于先验框的,比如anchor base。该模式从目标检测衍生到OCR领域就有很多缺陷,比如倾斜(或扭曲)文字检测不准、过长文字串检测不全、过短文字串容易遗漏、距离较近的无法分开等[7]。
为解决上述存在的问题,通过应用渐进式扩展网络(PSENet)技术进行优化,应用原理如下>
将拍摄的照片进行4~5层的上采样,由高分辨大图转换成隐含特征的小号图片,这类图片容易聚焦物体,起到优秀的聚焦作用,通过小号图片的下采样,再与对应大小的原图进行加运算,可以保留图像的细节,同时突出物体。多次操作后的图像,再通过1×1的卷积,形成多张图片,比如P1,P2,P3,…,Pn。为了获得最佳的对比,形成文本范围与周围环节的优异区分或是多个文本范围的相互区分,采用渐进式尺度扩张算法[8],划分这些图片的文本区域,很多研究表明,6~7张图片的效果最为优秀。
如图3所示,具体操作如下:首先,将P1的图片文本范围与背景范围进行识别,比如图片矩阵中文本部分的区域是灰色,背景部分是矩阵白色区域,通过不同颜色文本像素标志向像素四领域逐步扩展,如果不同文本区域的多张存在冲突,则标记为2,处理方式可采用先到先得原则;其次,将P2的图片与P1融合处理,直至P7,最终形成文本范围的强区分。
3 基于机器视觉技术的接地线装拆安全检测告警技术应用分析
本项目开发完成的成果包括数据同步、作业点校核、电机控制等三个模块,数据可以与工作站服务器进行同步,可以采用RPA关键信息采集或PMS数据中台接口方式获得。本项目采用了RPA技术采集,每日将工作票关键信息同步到工具软件,再通过OTG方式拷贝到移动硬盘中。作业点校核功能能够打开摄像头获取现场的图片,并自动将注意力集中到文字区域,采用自然场景下文本光学识别技术,利用基于语义特征的场景文本检测方法准确识别间隔文本,将文本和工作票信息进行比对,比对无误后,通过电机控制缠绕装置解锁,并开始放线操作。
实际应用过程中,通过小车的拉杆拖动,带动220 kV接地线9根管加软管铜接地线,大大减少了以前人工肩扛或手抱的操作负担。到达作业点后,通过手持终端“作业点校核”进行工作间隔与工作票信息位置验证,验证一致后,驱动电机解锁,可进行放线操作。本文设计的基于机器视觉技术的接地线装拆安全检测告警软件,可以有效地对变电站工作间隔进行核验,从而防止变电运维人员错误操作间隔装接地线的行为。目前,该系统在某220 kV变电站现场已投入试运行,由于220 kV站点间隔多且电压等级高,走错间隔的隐患必须百分之百消除,该系统能够通过图像核验间隔,通过控制对缠绕装置进行解锁,很大程度上减少了安全风险,提高了变电站运维工作的安全性。
4 结语
接地线装拆工作具有一定的危险性,并且大部分危险事故是由误操作引起的,因此对接地线的装拆进行检测、对误操作行为进行告警具有重要意义。本文设计的基于机器视觉技术的接地线装拆安全检测告警软件,通过机器视觉技术实现对施工作业环境的识别,利用手持终端搭载安全判别软件,通过校验工作间隔与工作票信息位置,进而控制伺服电机的收放线工作,当存在误操作时停止收放线进而实现阻拦、警示操作人员的功能。通过在接地线装拆中应用基于机器视觉技术的安全检测告警技术,可以有效降低误操作带来的安全风险,提高接地线装拆工作的安全性,从而提高变电站运行的安全性和稳定性,进而推动电力行业良性发展。