本發明涉及一種基于貝葉斯網絡定位HDFS關鍵低效函數的性能分析方法,被廣泛采用的大數據應用平臺如Hadoop和Spark,都把HDFS(Hadoop Distributed File System)作為默認的分布式文件系統。而分布式文件系統在對上層應用提供支持時,會因自身某些函數的低效,導致整個大數據應用執行效率較低,檢測這些關鍵的低效函數有助于大數據應用開發人員改善大數據應用性能。本發明提出的針對HDFS的關鍵低效函數分析方法,通過對系統插樁得到的函數運行時間以及I/O數據量信息,進行統計學分析,計算這些函數的低效概率,再根據低效概率建立函數的貝葉斯網絡找出HDFS源碼中值得優化的關鍵低效函數。
聲明:
“一種基于貝葉斯網絡定位HDFS關鍵低效函數的性能分析方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)