1. 引言
变压器是输配电系统的主要设备,其状态对电力系统的安全性和可靠性至关重要。变压器发生事故的可能性随着绝缘的恶化而增加。油–屏障式绝缘是油浸式变压器的主要绝缘类型,变压器在长期运行中,由于热老化的不可逆消极影响 [1] ,导致其油–屏障式绝缘系统的机械性能发生下降,影响它的安全稳定运行。因此,准确识别变压器油–屏障式绝缘的不同老化阶段,特别是对于运行时间越久的变压器,油–屏障式绝缘老化状态监测的研究对于变压器运行寿命的预测具有重要的意义。
目前,对于油–屏障式绝缘老化检测的方法有绝缘纸的聚合度(DP)检测,糠醛浓度检测,油中溶解气体分析(DGA),然而,这些方法都有各自的缺点。DP在采样和测量时需要切断电源并且需要对变压器进行吊芯取样,因此,DP测量在现场应用仍有诸多不便。对于糠醛浓度检测,有高效液相色谱(HPLC)、紫外(UV)分光光度法和比色法等方法。HPLC有操作复杂、洗脱困难等缺点;紫外分光光度法稳定性差,易受变压器油中除糠醛外的其他有机物的影响;由于比色法需要目视比色管,这导致比色法精度较低,易受不同操作人员的影响。溶解气体分析(DGA)常使用气相色谱(GC)来进行,然而,色谱柱的性能会随着时间的推移而下降,GC监测系统需要由专业人员在实验室中操作。
随着激光技术和电荷耦合元件检测技术的发展,拉曼光谱已广泛应用于食品检测 [2] 、材料分析 [3] 等领域的定性或定量分析。近些年来,有学者使用拉曼光谱进行糠醛浓度检测,检测限达到14.4 mg/L [4] ,表明拉曼光谱在变压器的早期故障诊断中显示出一定的潜力。油–屏障式绝缘是变压器的重要组成部分,根据绝缘油的型号不同,可分为10#、25#、45#三种,其中45#油–屏障式绝缘常用于低温、超高压环境,然而,很少有报道将拉曼光谱应用于45#绝缘油与绝缘纸组成的绝缘类型以间接评估变压器的老化状况。因此,本文研究的主要目的是探究45#油–屏障式绝缘的拉曼光谱特性,并探索其应用于油浸式变压器老化阶段评估的可行性。
在本文研究中,使用自行搭建的热老化设备,制备不同老化油样样品,使用拉曼光谱仪测得各个时间段老化样品的拉曼谱线。根据不同的老化时间,模拟不同的老化程度,对不同老化程度的样品数据进行分类,探究热老化对变压器油–屏障式绝缘类型的影响。
2. 实验部分
2.1. 拉曼光谱检测装置
本文根据激光拉曼原理搭建了如图1所示的检测油样实验装置。实验时,785 nm的激光器发射的激光经探头穿过盛放样品的压盖玻璃瓶,照射在油样表面,并发生拉曼散射,散射光经光谱仪采集后通过信号传输线将采集的数据传给微型计算机,进而完成对油样的检测。该实验装置采用厦门奥谱天成光电有限公司生产的拉曼光谱仪,型号为ATR3110-785。为了提高信噪比,减小宇宙射线与荧光的干扰,获得稳定的油样拉曼光谱图,将积分时间设置为5 s,激光功率设置为100 MW,平均次数设置为1次。
Figure 1. Diagram of oil sample testing device
图1. 油样检测装置图
2.2. 油–屏障式绝缘老化样品的制备
本采用45号矿物绝缘油与0.2 mm厚的牛皮绝缘纸,先将绝缘油在80℃下干燥脱水72 h,再将绝缘纸裁剪成碎末状后干燥48 h,绝缘油与绝缘纸干燥完成后,将绝缘纸与绝缘油以1:8质量比混合装瓶,在40℃下充分混合24 h,然后开始热老化加速实验。
本文实验温度采用130℃,不会高于45号绝缘油的闪点温度(135℃)保证实验操作的安全性,同时,又可以确保油–屏障式绝缘样品的快速热老化。避免了温度设置过低,增加了热老化时间,达不到加速热老化效果;也避免了温度过高,会破坏绝缘油内部的分子结构,使得检测结果不具有真实性的缺点。
本文加速热老化样品制备设备采用鼎鑫宜公司生产的数显恒温油浴锅,设备型号DXY-12H,该设备广泛用于石油、化工领域,主要用于化学物质的蒸馏、干燥、浓缩以及浸渍化学药品或生物制品。油浴锅有箱主体、油锅、锅盖和温度控制系统等组成,其加温件采用优质不锈钢管式电加热管,直接浸入油浴锅进行热交换,加热效率高、热能损耗小,温度控制采用“工业及专家自整定PID技术”控制,与传统的PID控制方式相比具有更小的温度超调、更快的稳定时间、更好的控温精度等优点。控温仪还具有定时控制、控温误差修正、偏差报警保护等功能。油浴锅具体参数如表1所示。
Table 1. Specific parameters of the oil bath
表1. 油浴锅具体参数
3. 光谱预处理及其分类算法
3.1. Savitzky-Golay平滑
Savitzky-Golay滤波是由一种在时域内基于局域多项式最小二乘法拟合的滤波方法 [5] 。其最大的特点在于在滤除噪声的同时可以确保信号的形状、宽度不变。Savitzky-Golay原理如下:
设有
个等间距量测点
,在滤波过程中,令
,n为滤波窗口的宽度,假设窗口内的数据点可采用
次多项式进行拟合。即
(1)
于是就有了n个这样的方程,构成k元线性方程组,写成矩阵形式为:
(2)
要使上述矩阵有解,必须满足
,系数A的最小二乘解为
,滤波完成后的
,其中
,称为滤波系数,Y为原始光谱,
为经SG平滑后的光谱,X只由滤波带宽
和多项式次幂
决定。
3.2. 非对称重新加权惩罚最小二乘法
为了提高后续数据处理的效果,需要对平滑后的原始光谱数据进行基线校正。本文使用非对称重新加权惩罚最小二乘法(arPLS)来进行基线校正,arPLS是由韩国全南大学SungJuneBaek等人提出的一种基线校正算法 [6] ,对权重更新的表达式如下:
(3)
(4)
其中y表示原始信号,z表示拟合信号,下标i表示光谱信号的每个点,
,
为
的部分,m为均值,
为标准差。当信号与基线之间的差异小于估计的噪声平均值时,逻辑函数对低于或高于基线的信号给予几乎相同的权重,避免了基线在无峰区域被低估,在峰值区域被高估,保证所得出的基线更接近于实际基线。
3.3. 主成分分析
由于实验过程中采集的光谱数据维度为2048维的高维数据,不仅增加了存储空间,而且影响了分类效果,所以在使用分类算法前需要对原始数据进行降维处理。主成分分析(PCA)是一种应用广泛的数据降维方法,将原变量进行转换 [7] ,使得少数几个新变量是原变量的线性组合,同时,这些新变量要尽可能表达原变量的数据特征而不丢失信息。
3.4. 支持向量机
支持向量机(Support Vector Machine, SVM)是一种用于模式分类的有监督学习方法,由Vapnik提出,SVM的基本思想来源于线性判别的最优超平面,所谓最优分类超平面就是要求分类面不但能将两类样本无错误的分开,而且要使分类间隔最大。通过构造多个一对一分类器,SVM可实现多类样本的分类判别。
4. 结果与讨论
4.1. 油–屏障式绝缘样品谱图
为方便查看不同老化时间油–屏障式绝缘样本的拉曼光谱图变化,将每个老化时间数据的平均光谱绘制在图中,对45#绝缘油样进行分析。原始光谱如图2所示。
Figure 2. Major raw spectrum of oil samples
图2. 油样原始光谱图
观察原始光谱图,可以看出,由于荧光干扰引起的基线漂移,使得老化油样的原始光谱处在不同的基准值之下,不能很好的区别拉曼谱峰。为此,使用arPLS方法对原始光谱进行基线校正处理,以老化时间0 h为例,展示原始光谱、基线、基线校正后的光谱三者之间的关系,如下图3(a)所示,基线校正后,对谱线作SG平滑处理,如图3(b)所示,通过SG平滑,能够有效消除基线校正无法消除的噪声干扰。
(a)(b)
Figure 3. (a) Baseline correction; (b) SG smoothing
图3. (a) 基线校正;(b) SG平滑处理
由图4可以看出,经过基线校正、SG平滑等预处理之后,各类老化油样的拉曼光谱处在同一个基准值之上。绝缘纸主要由纤维素构成,而纤维素是由葡萄糖单体经糖苷键构成的高聚合碳氢化合物,在老化过程中,由于温度的影响,连接葡萄糖单体的糖苷键断裂,生成糠醛等老化物质溶解在油中,且老化时间越长,糖苷键断裂的越多 [8] 。在油中老化物质与绝缘油自身的共同作用下,测量油样的拉曼光谱强度越来越强。
Figure 4. Thermal aging spectra of oil samples at various stages
图4. 油样各阶段热老化光谱图
4.2. 分类结果分析
如表2所示,根据不同老化时间段取样将热老化油样分为6类,每个时间段得到63条谱线,其中42条用于训练模型,其余21条用于测试模型效果,对拉曼原始数据进行SVM分类。
Table 2. Correspondence between sampling time and categories
表2. 取样时间与类别对应关系
采用网格法、粒子群、遗传算法寻求SVM模型的最佳参数值,并使用5折交叉验证,避免模型过拟合。其中网格法(Gridsearch)是在给定的参数空间内搜索最优参数,将参数空间划分成长短相同的网格,其中每一个网格点代表一组参数,将所有网格点带入SVM中验证分类效果,暴力枚举出最优参数;粒子群(PSO)优化的基本思想是通过群体中个体之间的协作和信息共享来寻找最优解;遗传算法(GA)在寻优过程中随机产生多个起始点并同时开始搜索,由适应度函数来指导搜索方向,能够在复杂搜索空间寻求全局优化解。三种方法寻优结果可视化如图5~7所示。
表3为三种寻优方法性能的对比分析。与网格法相比,使用粒子群算法与遗传算法寻优的交叉验证准确率相同,均为92.06%,但PSO、GA寻优时间较长,这是由于在PSO中,粒子的收敛是以轨道的形式实现的,并且粒子的速度总是有限的,导致搜索全部空间耗时较长;而单一的GA编码不能全面将优化问题的约束表示出来,需要借助罚函数法将约束问题转为非约束问题,因此大大增加了工作量和求解时间。由表3知,三种寻优方法对测试集的效果一致,测试集共有126个样本,三种方法均错分20个样本,故选择网格法寻优效果最好。
Table 3. Comparison of the results of different optimization methods
表3. 不同寻优方法结果对比
从图8中看出未经过任何处理的光谱数据分类的效果并不理想,网格法SVM测试集分类准确率为84.13%。长时间老化与短时间老化对比鲜明,类别为5,6的样品实际类别与预测类别完全相同,类别为1,2,3,4的样品总计有20个被错误归类。短时间不同老化时间区分的效果不是太好,其中实际老化类别为1的,在预测时,有4个样本被归于类别2,归于类别3、4的各有两个样本;实际类别为3的,有7个样本被归于类别4;实际类别为4的,有4个样本被归于类别3。导致这种现象原因可能有如下两方面,第一,短时间老化时,绝缘油萃取绝缘纸中的老化物质比较少,第二,由于荧光干扰造成的基线漂移与测量环境产生的噪声影响了拉曼峰的辨别。
为了去除噪声、荧光等信号的干扰,提高分类准确率,对原始数据进行基线校正、平滑预处理。此外,每个油样的拉曼光谱含有2048个数据点,高维数据会造成巨大计算量,很大程度上增加了参数寻优的时间,因此采用主成分分析对数据进行特征提取,使得最大程度上保证样本信息的同时减小数据维度。对于本文中的实验数据,前2个主成分的累计贡献率超过95%,可以充分表示原有光谱的光谱信息,故将原始光谱维度降至2维。对预处理后的光谱数据进行网格法参数寻优,结果如图9所示。网格法寻优运行时间进一步缩短,且交叉验证准确率上升至94.05%。
Figure 8. Classification result of oil sample raw data
图8. 油样原始数据分类结果图
Figure 9. Grid method optimization after data preprocessing
图9. 数据预处理后网格法寻优
对进行预处理后的数据进行分类,测试集准确率由84.13%提升到92.86%,结果如图10所示。对短时间热老化样本的错分率已经大大降低,总错分样本为7个。其中实际类别为1的样本,只有2个样本被归类为类别2,没有归类类别3、4的情况,实际类别为3的只有一个样本被归类为类别4,实际类别为4,5,6的分类结果全部正确,没有错分的情况,这说明荧光干扰造成的基线漂移影响得到大幅度抑制。但是,实际类别为2的样本错分数增加了3个,对于老化类别为2的样本来说,其分类准确率由95.23%下降到80.95%,这说明对于老化时间较短的油样,通过一系列方法对拉曼光谱数据进行预处理,也可能会对某一类的分类结果产生消极影响。通过预处理方法提高了所有类别的总的分类准确率,特别是对于老化时间较长的样本,此时绝缘纸溶解在绝缘油中的老化物质较多,分类准确率高达100%,说明此方法能够很好的对运行时间较长的变压器的油–屏障式绝缘老化状态作出正确的评估。由此可见,使用网格法优化SVM参数对变压器油–屏障式绝缘老化状态的评估具有良好的可行性。
Figure 10. Classification result after data preprocessing
图10. 数据预处理后分类结果图
5. 结论
通过室内老化设备进行加速热老化实验,获得不同老化时间的油–屏障式绝缘样品,并对其进行拉曼光谱检测。对原始数据进行SVM分类,通过Gridsearch、PSO、GA等方法对SVM参数进行寻优,其中,Gridsearch在保持较好的寻优效果时,运行时间较短。为提高SVM的分类准确率,对拉曼光谱进行预处理操作,包括采用arPLS方法消除拉曼光谱的基线漂移,采用SG平滑去除噪声信号,通过PCA有效降低拉曼光谱的数据维度,经预处理后拉曼数据SVM的分类准确率提高至92.86%,为进一步探究变压器油–屏障式绝缘老化状态评估提供参考。
基金项目
温州大学大学生创新创业项目,浙江省大学生新苗人才项目。
NOTES
*通讯作者。