一臺(tái)SM+SC+數(shù)據(jù)庫(kù),兩臺(tái)SC+數(shù)據(jù)庫(kù)分布式部署。
TSM的監(jiān)控器Monitor監(jiān)控到兩臺(tái)SC有告警,提示與TSM服務(wù)器心跳連接異常,F(xiàn)TP服務(wù)器提示與鏡像FTP連接異常。通過(guò)ping測(cè)試,發(fā)現(xiàn)SM與各SC網(wǎng)絡(luò)連接正常,與各數(shù)據(jù)庫(kù)連接正常,與各FTP連接也正常。
從日志分析,SC都是由于連接數(shù)超過(guò)最大連接數(shù),無(wú)法打開(kāi)數(shù)據(jù)庫(kù)連接,無(wú)法查詢(xún)各SC和SACG的狀態(tài)導(dǎo)致告警。
1、采集兩臺(tái)SC,通過(guò)日志分析,兩臺(tái)SC都有由于達(dá)到連接最大數(shù)導(dǎo)致SC狀態(tài)異常,SC不停的連接SM的遠(yuǎn)程接口.
2、進(jìn)一步采集SM日志,同樣發(fā)現(xiàn)大量的連接數(shù)據(jù)庫(kù)失敗的問(wèn)題.
3、查看數(shù)據(jù)庫(kù)日志(包括錯(cuò)誤日志和事務(wù)日志),發(fā)現(xiàn)日志很大。因此SC在連接數(shù)據(jù)庫(kù)是有大量的連接失敗,導(dǎo)致各種告警.
4、進(jìn)行數(shù)據(jù)清理和數(shù)據(jù)轉(zhuǎn)儲(chǔ),將數(shù)據(jù)庫(kù)空間釋放出來(lái),解決問(wèn)題。
無(wú)