??????? 隨著機(jī)組容量的增大,對分散控制系統(tǒng)(DCS)的安全可靠性要求也越來越高。為了提高DCS安全運(yùn)行的可靠性,一般都對較為關(guān)鍵的部件實行冗余配置,采取雙系統(tǒng)運(yùn)行。揚(yáng)州第二發(fā)電有限責(zé)任公司(下稱揚(yáng)二廠)兩臺600MW機(jī)組的DCS都選用了Teleperm XP(下稱T XP)。在T XP系統(tǒng)中,AP是直接檢測和控制現(xiàn)場設(shè)備的自動處理單元,AP系統(tǒng)的正常與否直接決定著T XP系統(tǒng)的可靠性,也就影響著機(jī)組運(yùn)行的安全穩(wěn)定性。
??????? 1 T XP系統(tǒng)的組成和現(xiàn)狀
??????? T XP分散控制系統(tǒng)對機(jī)組的在線控制主要由操作員監(jiān)視系統(tǒng)(OM)和自動處理系統(tǒng)(AS)兩大部份協(xié)調(diào)完成。OM系統(tǒng)和AS系統(tǒng)采用冗余配置和分層控制的原則,網(wǎng)絡(luò)通信使用兩路虛擬總線連接(參見T XP結(jié)構(gòu)圖)。AS系統(tǒng)的核心是自動處理單元AP。經(jīng)過數(shù)年來實踐和分析,OM系統(tǒng)的SU和PU冗余丟失一般不直接影響機(jī)組的安全運(yùn)行,即使在OM系統(tǒng)的主從SU和PU全部故障的極限狀態(tài)下,只要各AP系統(tǒng)運(yùn)行正常,一般仍然可以在機(jī)組不停運(yùn)的工況下排除故障;但如果AP一旦冗余丟失,就只有單CPU運(yùn)行,這時如果主CPU或其通訊模件發(fā)生故障,整個AP就停止工作,與其它柜間的通訊發(fā)生中斷,嚴(yán)重時造成總線通訊中斷或控制系統(tǒng)失控而導(dǎo)致機(jī)組跳閘。歷史上曾有四次由于AP 冗余丟失繼而引發(fā)其它故障,最終導(dǎo)致機(jī)組跳閘。
??????? 自#1、#2機(jī)組商業(yè)運(yùn)行以來,AP冗余丟失的情況比較頻繁。T XP發(fā)生的所有故障中,AP的故障占了大半。據(jù)不完全統(tǒng)計,在2001年1月至2003年12月期間,AP冗余丟失故障就有56次(參見附表1)。AP冗余丟失的狀況正在逐漸改善,但目前尚未徹底改觀,這始終是影響機(jī)組安全運(yùn)行的隱患。
????????????????????????????????????? …???
??????????????????????????? …???????????
??????? 附圖1?? T XP結(jié)構(gòu)圖
??????? 附表1:?? 2001-2003 AP冗余丟失情況
??????? 周期?AP1?AP4?AP5?AP6?AP7?AP20、21?合計?
??????? #1機(jī)組冗余丟失?3?2?7?12?8?3?35?
??????? #2機(jī)組冗余丟失?3?2?0?4?5?7?21?
??????? 2 AP冗余頻繁丟失的原因
??????? 在T XP系統(tǒng)中,AP冗頻繁余丟的根源表現(xiàn)為顯性和隱兩種狀態(tài)。AP模件的軟件缺陷和硬件故障可直接導(dǎo)致AP冗余丟失,屬于顯性的根源;AP運(yùn)行環(huán)境超溫、AP負(fù)荷率超標(biāo)和靜電對AP模件的破壞所造成的AP冗余丟失,往往在當(dāng)時表現(xiàn)為不明原因,屬于隱性的根源;模件和機(jī)架積塵的影響多數(shù)情況是顯性問題,有時也是隱性的問題。
??????? 2.1 環(huán)境溫度對AP的影響
??????? DCS模件的電子器件對溫度的變化比較敏感,溫度梯度場呈非線性變化,一旦接近或達(dá)到飽和區(qū)域時工作狀態(tài)就失常。因此,DCS對環(huán)境溫度都有一定的要求。按電力行業(yè)標(biāo)準(zhǔn),電子室的溫度應(yīng)控制在18 ℃-24℃。國內(nèi)的DCS多數(shù)采用柜內(nèi)強(qiáng)制通風(fēng)的冷卻方式,當(dāng)電子室溫度在此范圍內(nèi)時,DCS模件的芯片工作溫度在40℃以下。然而TXP分散控制系統(tǒng)的擴(kuò)展柜采用上下溫差自然冷卻方式,冷卻效果相對比強(qiáng)制通風(fēng)方式差;基本柜中也只對電源部份采用了風(fēng)扇通風(fēng),所以模件芯片的實際溫度比室溫高得多。在現(xiàn)場測試,當(dāng)室溫21℃時,AP柜功能模件溫度在33℃左右,而芯片的工作溫度在40℃左右;當(dāng)28℃室溫時,功能模件自身溫度達(dá)到43℃左右,芯片工作溫度高達(dá)50℃左右。因此,對于揚(yáng)二廠T XP而言,即使電子室的溫度滿足國家行業(yè)標(biāo)準(zhǔn)的要求,當(dāng)室溫在21-24℃時,AP模件的芯片實際已經(jīng)工作在超溫狀態(tài),何況,過去有時電子室溫度高達(dá)25-29℃。2003年5月份,加裝分體式空調(diào),電子室溫度控制在18 ℃-21℃后, 5月至8月期間的AP冗余丟失次數(shù)占全年的35%,比已往同期下降了50%。從實踐情況看,揚(yáng)二廠電子室最適宜的環(huán)境溫度應(yīng)該在18 ℃-21℃,電力行業(yè)標(biāo)準(zhǔn)不完全適合揚(yáng)二廠電子室的環(huán)境溫度要求。
??????? 2.2 AP柜模件積塵
??????? 塵埃聚集到電路版和機(jī)架槽的表面,形成覆蓋層。這些塵埃在三種情況下會對AP模件產(chǎn)生不利影響。一是積塵受潮后,形成局部短路,燒壞模件。二是在模件更換或新增模件時,塵埃附著在模件與機(jī)架槽的金屬接觸面之間,形成局部接觸不良。這種情況在塵埃較多且插模件方法不當(dāng)時往往會發(fā)生,而且這種接觸不良的故障不易被發(fā)現(xiàn)。三是在較高電壓(例如電容)下塵埃產(chǎn)生電離,形成帶電塵埃,條件滿足時形成放電。尤其在模件積塵和高溫同時作用時,更容易引起局部燒壞。
??????? 電子室內(nèi)灰塵較多,電子柜機(jī)架和模件表面積塵較嚴(yán)重。#1機(jī)組AP1就發(fā)生過電源模件因表面灰塵受潮發(fā)生短路故障。在AP冗余丟失故障中,不明原因的AP模件損壞現(xiàn)象也常有發(fā)生,積塵影響是其中的一個因素。
??????? 2.3 硬件的隨機(jī)故障
??????? 硬件的隨機(jī)故障導(dǎo)致AP冗余丟失的問題,一方面是設(shè)備使用過程中,模件隨機(jī)損壞。究其根源,有強(qiáng)電串入、有人為因素、有質(zhì)量問題、有自然損壞、也有不明原因。從調(diào)試至今,#1、#2機(jī)組AP各種模件損壞近百塊。在運(yùn)行過程中,一旦發(fā)生AP的網(wǎng)絡(luò)通訊模件、柜間通訊模件或CPU模件等損壞,相應(yīng)的AP就會失去冗余或者發(fā)生主從切換后失去冗余。
??????? 另一方面,T XP設(shè)備漸近老化期,模件之間的連接或接地性能逐漸下降,簡接引起AP故障。設(shè)備老化問題主要反映在AP模件、機(jī)架連接和“三地”性能。AP柜模件間的連接故障會直接引起AP冗余丟失。2003年第四季度,#1機(jī)組AP5連續(xù)6次冗余丟失,采取了多種處理方案,從復(fù)位、冷啟、傳代碼、換模件到熱線診斷等多種措施,從處理結(jié)果看,AP5先發(fā)生CP1430模件故障,后又出現(xiàn)AP機(jī)架CP槽與模件的接觸不良,更換槽位后系統(tǒng)運(yùn)行正常。
??????? 2.4 AP相關(guān)軟件的固有缺陷
??????? 軟件問題引起AP冗余丟失主要分兩種類型,一類是系統(tǒng)支撐軟件的不完善,另一類是通訊軟件的性能差。通訊軟件的缺陷又主要表現(xiàn)三種情況,一是AP的通訊管理軟件對出現(xiàn)瞬間通訊延時的處理不當(dāng),二是CP1430偶爾存在通訊延時,三是APF120固化程序存在缺陷。
??????? T XP系統(tǒng)制造商針對各地用戶的運(yùn)行缺陷,已經(jīng)發(fā)布過大量的軟件補(bǔ)丁。我公司#1、#2機(jī)組使用的T XP系統(tǒng)支撐軟件也發(fā)生過多次問題,接受和安裝過相應(yīng)的軟件補(bǔ)丁。但補(bǔ)丁軟件過多時會影響系統(tǒng)軟件的運(yùn)算效率,所以更有效的改善辦法是軟件升級。