2013年3月19日 星期二

[Linux]find 與grep 指令詳解

find 檔名 |grep > 輸出文件  //可以將搜尋結果存到文件裡面瀏覽
Trace code常用指令:grep -r -n '' ./

【 基本語法 】
查詢檔案名稱 ( 也可以查詢「目錄名稱」,其中 * 是萬用字元 )
find $HOME -name '*.mp3'
   註1: $HOME 是 Linux 下的一個環境變數,預設指向執行帳號的 HOME 目錄
查詢檔案名稱 (不區分大小寫)
find /etc -iname 'Network'
指定只要搜尋「檔案」名稱
find /var/log -iname '*.log' -type f
指定只要搜尋「目錄」名稱
find /etc -iname 'apache2' -type d
   補充說明:可用的 –type 參數值如下
b      block (buffered) special
c      character (unbuffered) special
d      directory ( 一般目錄 )
p      named pipe (FIFO)
f      regular file ( 一般檔案 )
l      symbolic link
s      socket
D      door (Solaris)
找尋所有檔案大小大於 50MB 的檔案
find /var -type f -size +50M
   註1: 不加上 –name 參數即代表搜尋所有檔案
找尋所有檔案大小小於 50MB 的檔案
find /var -type f -size -50M
尋找超過 7 天沒有被存取或修改過的檔案 (判斷檔案存取時間)
find $HOME -type f -atime +7
尋找曾經在 7 天內被存取或修改過的檔案 (判斷檔案存取時間)
find $HOME -type f -atime -7
尋找超過 10 分鐘沒有被存取或修改過的檔案 (判斷檔案存取時間)
find $HOME -type f -amin +10
尋找曾經在 10 分鐘內被存取或修改過的檔案 (判斷檔案存取時間)
find $HOME -type f -amin -10
尋找檔案建立時間已超過 30 天的檔案
find $HOME -type f -ctime +30
尋找特定使用者的檔案 ( 以帳號名稱 tom 為例 )
find $HOME -type f -user tom
【 進階應用 】
刪除 30 天以上未經存取過的暫存檔案 ( 注意: 以下指令最後一個分號(;)前一定要加上反斜線 )
find /tmp -type f -atime +30 -print -exec rm -f '{}' \;
   註1: 加上 –print 是為了讓被刪除的檔案檔名一併顯示在畫面上,這個參數可以省略    註2: 使用 –exec 會讓查詢到的每一個檔案路徑代入 ‘{}’ 位置,一個檔案會執行一遍 rm 命令
刪除 30 天以上未經存取過的暫存檔案 ( 使用 xargs 當成單一命令的參數 )
find /tmp -type f -print0 | xargs -0 rm -v
   註1: 加上 –print0 是為了讓輸出的結果不以「斷行字元」分隔,而改以 null 為結果的分隔字元    註2: 使用 xargs 命令加上 –0 是為了讓傳入的資料以 null 字元當成參數的分隔
   註3: 使用 rm 命令加上 –v 是為了能顯示出被刪除的檔案名稱,這個參數可以省略 
   註4: 使用 xargs 會將所有 find 命令查到的檔案轉換成 rm 的參數列,如果檔案過多可能會執行失敗!
   註5: 使用 xargs 可確保後面的程式 ( rm ) 只執行一次,所以理論上執行速度較快!
相同參數需輸入多筆並且以「或」邏輯運算時要用 –o 參數串接起來
例1:同時找兩種檔名樣式的檔案
find $HOME -name '*.mp3' -o -user '*.ogg'
例2:同時找兩個擁有者的檔案
find /usr/local -user user1 -o -user user2

【 注意事項 】
  • 使用萬用字元時務必加上單引號( ' )

    !!以下是錯誤示範!!
  • [user1@server ~]# find $HOME -name *.txt
    find: paths must precede expression
    Usage: find [path...] [expression]

相關連結

Grep
範例:grep_-r_-n(輸出行號)_"字串" _./(搜尋目前位置以下)_> 123.txt(輸出到123.txt文件中觀看)



 ◎參數
    1. -A NUM,--after-context=NUM
               除了列出符合行之外,並且列出後NUM行。
          
         ex:   $ grep -A 1 panda file
               (從file中搜尋有panda樣式的行,並顯示該行的後1行)
                              
    2. -a或--text
               grep原本是搜尋文字檔,若拿二進位的檔案作為搜尋的目標,
               則會顯示如下的訊息: Binary file 二進位檔名 matches 然後結束。
               
               若加上-a參數則可將二進位檔案視為文字檔案搜尋,
               相當於--binary-files=text這個參數。
         
         ex:   (從二進位檔案mv中去搜尋panda樣式)
               (錯誤!!!)
               $ grep panda mv
               Binary file mv matches
               (這表示此檔案有match之處,詳見--binary-files=TYPE )
               $
               (正確!!!)
               $ grep -a panda mv
    
    3. -B NUM,--before-context=NUM
               與 -A NUM 相對,但這此參數是顯示除符合行之外
               並顯示在它之前的NUM行。     
          
         ex:   (從file中搜尋有panda樣式的行,並顯示該行的前1行)
               $ grep -B 1 panda file

    4. -C [NUM], -NUM, --context[=NUM]
               列出符合行之外並列出上下各NUM行,預設值是2。
          
         ex:   (列出file中除包含panda樣式的行外並列出其上下2行)
               (若要改變預設值,直接改變NUM即可)
               $ grep -C[NUM]  panda file
          
    5. -b, --byte-offset
               列出樣式之前的內文總共有多少byte ..
           
          ex:  $ grep -b  panda file
       顯示結果類似於:
         0:panda
        66:pandahuang
       123:panda03
        
    6. --binary-files=TYPE
               此參數TYPE預設為binary(二進位),若以普通方式搜尋,只有2種結果:
                 1.若有符合的地方:顯示Binary file 二進位檔名 matches
                 2.若沒有符合的地方:什麼都沒有顯示。
                
               若TYPE為without-match,遇到此參數,
               grep會認為此二進位檔案沒有包含任何搜尋樣式,與-I 參數相同。
                
               若TPYE為text, grep會將此二進位檔視為text檔案,與-a 參數相同。
     
     Warning: --binary-files=text 若輸出為終端機,可能會產生一些不必要的輸出。
           
    7. -c, --count
       不顯示符合樣式行,只顯示符合的總行數。
       若再加上-v,--invert-match,參數顯示不符合的總行數。

    8. -d ACTION, --directories=ACTION
               若輸入的檔案是一個資料夾,使用ACTION去處理這個資料夾。
       預設ACTION是read(讀取),也就是說此資料夾會被視為一般的檔案;
       若ACTION是skip(略過),資料夾會被grep略過:
       若ACTION是recurse(遞),grep會去讀取資料夾下所有的檔案,
       此相當於-r 參數。

    9.  -E, --extended-regexp
       採用規則表示式去解釋樣式。
   
   10.  -e PATTERN, --regexp=PATTERN
       把樣式做為一個partern,通常用在避免partern用-開始。

   11.  -f FILE, --file=FILE
       事先將要搜尋的樣式寫入到一個檔案,一行一個樣式。
       然後採用檔案搜尋。
       空的檔案表示沒有要搜尋的樣式,因此也就不會有任何符合。
    
   ex: (newfile為搜尋樣式檔)
       $grep -f newfile file 

   12.  -G, --basic-regexp
       將樣式視為基本的規則表示式解釋。(此為預設)

   13.  -H, --with-filename
       在每個符合樣式行前加上符合的檔案名稱,若有路徑會顯示路徑。
    
   ex: (在file與testfile中搜尋panda樣式)
       $grep -H panda file ./testfile
                file:panda
                ./testfile:panda
                $
  
   14.  -h, --no-filename
               與-H參數相類似,但在輸出時不顯示路徑。

   15.  --help
               產生簡短的help訊息。

   16.  -I
               grep會強制認為此二進位檔案沒有包含任何搜尋樣式,
               與--binary-files=without-match參數相同。
                
           ex:  $ grep -I  panda mv

   17.  -i, --ignore-case    
               忽略大小寫,包含要搜尋的樣式及被搜尋的檔案。
            
           ex:  $ grep -i panda mv
             
   18.  -L, --files-without-match
               不顯示平常一般的輸出結果,反而顯示出沒有符合的檔案名稱。

   19.  -l, --files-with-matches            
               不顯示平常一般的輸出結果,只顯示符合的檔案名稱。

   20.  --mmap            
               如果可能,使用mmap系統呼叫去讀取輸入,而不是預設的read系統呼叫。
               在某些狀況,--mmap 能產生較好的效能。 然而,--mmap
               如果運作中檔案縮短,或I/O 錯誤發生時,
               可能造成未定義的行為(包含core dump),。
            
   21.  -n, --line-number
               在顯示行前,標上行號。
            
            ex:  $ grep -n  panda file
                顯示結果相似於下:
                行號:符合行的內容

   22.  -q, --quiet, --silent
               不顯示任何的一般輸出。請參閱-s或--no-messages

   23.  -r, --recursive
       遞地,讀取每個資料夾下的所有檔案,此相當於 -d recsuse 參數。

   24.  -s, --no-messages
       不顯示關於不存在或無法讀取的錯誤訊息。
  
 小: 不像GNU grep,傳統的grep不符合POSIX.2協定,
       因為缺乏-q參數,且他的-s 參數表現像GNU grep的 -q 參數。
       Shell Script傾向將傳統的grep移植,避開-q及-s參數,
       且將輸出限制到/dev/null。
 
POSIX: 定義UNIX及UNIX-like系統需要提供的功能。           
 
   25.  -V, --version
  顯示出grep的版本號到標準錯誤。
  當您在回報有關grep的bugs時,grep版本號是必須要包含在內的。

   26.  -v, --invert-match
  顯示除搜尋樣式行之外的全部。
                
   27.  -w, --word-regexp
          將搜尋樣式視為一個字去搜尋,完全符合該"字"的行才會被列出。

   28.  -x, --line-regexp
  將搜尋樣式視為一行去搜尋,完全符合該"行"的行才會被列出。


沒有留言:

張貼留言