數據缺失怎么處理
樓主去圖書館查閱《華北工學院學報》2003年05期 的一篇論文吧 名字叫 帶有缺失數據的聚類分析方法 希望對你有幫助
傳統的聚類分析方法需要完全數據集,但有些情況下數據是不完全的,即包含缺失數據,這給聚類分析帶來了一定的困難.這里給出了一種迭代算法為缺失數據確定一個合理的替補值,構造出一個完全的數據集,逐步迭代進行聚類分析,并用實例詳細闡述了該方法的步驟.
如何確保監測數據不失真
數據的真實性和可靠性是一切工作的基礎。河南省環保廳監控中心對重點污染源的站點站房安裝有運維視頻監控系統,只要有人進入監控區域,視頻系統會自動采集視頻數據,每5~10秒生成高清圖片,并自動傳輸到省、市監控運行平臺,每天技術人員將對所有監控傳輸數據進行人工審核。如果發現問題,工作人員會及時備案上報,有效杜絕了數據被私自篡改的可能。
污染源在線監測無流量為什么還有數據
污染源在線監測異常數據主要有數據恒值、數據零值、無數據、數據異常大和數據負值等類型,某地一個季度內污染源在線監控系統內產生了1500余條異常數據,異常數據主要針對的是污染物濃度數據的異常情況。
恒值的判斷條件為污染物濃度數據8h以上無變化,負值判斷條件為污染物小時濃度數據為負值,數據異常大判斷條件為污染物濃度數據超過排放標準數倍,無數據判斷條件為污染物濃度小時數據缺失的情況。
通過對異常數據次數、異常類型和在線監測設備品牌進行統計分析,可以更加詳細的了解各個品牌在線監測設備存在問題,為在線監測設備廠家和排污單位在選擇在線監測設備時提供參考。
本網站文章僅供交流學習 ,不作為商用, 版權歸屬原作者,部分文章推送時未能及時與原作者取得聯系,若來源標注錯誤或侵犯到您的權益煩請告知,我們將立即刪除.