pyFileSearcher被設計成一個輕量級的、易于使用的、但能夠處理大量文件的工具,個人可以在大型企業服務器上使用的工具,以找出--哪些文件在過去幾天里占用了空間,它是免費的,它是開源的,它適用于Linux和Windows。
你得到的是什么?
按名稱、大小、文件類型搜索。按路徑的一部分進行搜索。搜索索引中列出的不早于N天的文件
保存已刪除文件的信息,對它們的搜索和對普通文件的搜索一樣
能夠保存搜索設置供將來使用
能夠以csv格式保存搜索結果
在搜索結果中突出顯示不存在的(已刪除的)文件
記錄訪問錯誤--你將知道哪些文件夾由于某種原因沒有被索引到
支持Windows中的長路徑(>256個字符)。
它是如何工作的
該程序在你的硬盤上運行,并保存關于文件的最低限度的必要信息:大小、創建時間、修改時間和文件的第一次索引時間(便于在不看屬性的情況下尋找新文件)。為了存儲這些信息,你可以使用sqlite數據庫(每個你想索引的目標目錄都有一個),如果你想索引幾十萬和幾百萬個文件,也可以使用MySQL數據庫。在后一種情況下,你可以只使用一個數據庫,但指定幾個目標目錄。在這兩種情況下,每個目標目錄都是與其他目錄并行索引的。
在你設置了簡單的索引參數(目標目錄,以及在使用sqlite的情況下,擴展名的白名單或黑名單)之后,你可以用"--scan "參數運行程序,自動開始索引,之后程序將被關閉。使用這個鍵可以通過調度程序運行。
在掃描過程中,在工作("data")目錄中會創建一個pid文件。它的存在會阻止啟動掃描的過程,如果程序崩潰了--請手動刪除它。
測試
該程序在一個有大約2000萬個文件的文件服務器上進行了測試。掃描時間 - 約5小時。最大線程中的文件:~7000000
MySQL的非默認參數(對于debian stretch)。
innodb_buffer_pool_size = 3000M
innodb_log_file_size = 128M
innodb_log_buffer_size = 4M
innodb_flush_method = O_DIRECT
在1.1.1中
修復:將pid進程保存到pid文件中。額外的驗證減少了在pid文件未被刪除時停止掃描執行的機會。
其他:默認 "sqlTransactionLimit "從20000改為1000
騰訊視頻官方版 | 45.34MB
愛奇藝視頻官方正式版 | 35.10MB
暴風影音最新版下載 | 50.3MB
酷狗音樂2022下載 | 37MB