[Linux]find 與grep 指令詳解

find 檔名｜grep > 輸出文件 //可以將搜尋結果存到文件裡面瀏覽
Trace code常用指令：grep -r -n '' ./

【基本語法】

查詢檔案名稱 ( 也可以查詢「目錄名稱」，其中 * 是萬用字元 )

find $HOME -name '*.mp3'

註1: $HOME 是 Linux 下的一個環境變數，預設指向執行帳號的 HOME 目錄

查詢檔案名稱 (不區分大小寫)

find /etc -iname 'Network'

指定只要搜尋「檔案」名稱

find /var/log -iname '*.log' -type f

指定只要搜尋「目錄」名稱

find /etc -iname 'apache2' -type d

補充說明：可用的 –type 參數值如下

b      block (buffered) special
c      character (unbuffered) special
d      directory ( 一般目錄 )
p      named pipe (FIFO)
f      regular file ( 一般檔案 )
l      symbolic link
s      socket
D      door (Solaris)

找尋所有檔案大小大於 50MB 的檔案

find /var -type f -size +50M

註1: 不加上 –name 參數即代表搜尋所有檔案

找尋所有檔案大小小於 50MB 的檔案

find /var -type f -size -50M

尋找超過 7 天沒有被存取或修改過的檔案 (判斷檔案存取時間)

find $HOME -type f -atime +7

尋找曾經在 7 天內被存取或修改過的檔案 (判斷檔案存取時間)

find $HOME -type f -atime -7

尋找超過 10 分鐘沒有被存取或修改過的檔案 (判斷檔案存取時間)

find $HOME -type f -amin +10

尋找曾經在 10 分鐘內被存取或修改過的檔案 (判斷檔案存取時間)

find $HOME -type f -amin -10

尋找檔案建立時間已超過 30 天的檔案

find $HOME -type f -ctime +30

尋找特定使用者的檔案 ( 以帳號名稱 tom 為例 )

find $HOME -type f -user tom

【進階應用】

刪除 30 天以上未經存取過的暫存檔案 ( 注意: 以下指令最後一個分號(;)前一定要加上反斜線 )

find /tmp -type f -atime +30 -print -exec rm -f '{}' \;

註1: 加上 –print 是為了讓被刪除的檔案檔名一併顯示在畫面上，這個參數可以省略註2: 使用 –exec 會讓查詢到的每一個檔案路徑代入 ‘{}’ 位置，一個檔案會執行一遍 rm 命令

刪除 30 天以上未經存取過的暫存檔案 ( 使用 xargs 當成單一命令的參數 )

find /tmp -type f -print0 | xargs -0 rm -v

   註1: 加上 –print0 是為了讓輸出的結果不以「斷行字元」分隔，而改以 null 為結果的分隔字元    註2: 使用 xargs 命令加上 –0 是為了讓傳入的資料以 null 字元當成參數的分隔
   註3: 使用 rm 命令加上 –v 是為了能顯示出被刪除的檔案名稱，這個參數可以省略    註4: 使用 xargs 會將所有 find 命令查到的檔案轉換成 rm 的參數列，如果檔案過多可能會執行失敗!
   註5: 使用 xargs 可確保後面的程式 ( rm ) 只執行一次，所以理論上執行速度較快！

相同參數需輸入多筆並且以「或」邏輯運算時要用 –o 參數串接起來

例1：同時找兩種檔名樣式的檔案

find $HOME -name '*.mp3' -o -user '*.ogg'

例2：同時找兩個擁有者的檔案

find /usr/local -user user1 -o -user user2

【注意事項】

使用萬用字元時務必加上單引號( ' )

！！以下是錯誤示範！！

[user1@server ~]# find $HOME -name *.txt

find: paths must precede expression
Usage: find [path...] [expression]

相關連結

find - Community Ubuntu Documentation

Grep
範例：grep_-r_-n(輸出行號)_"字串" _./(搜尋目前位置以下)_> 123.txt(輸出到123.txt文件中觀看)

◎參數
    1. -A NUM，--after-context=NUM
               除了列出符合行之外，並且列出後NUM行。

         ex:   $ grep -A 1 panda file
               (從file中搜尋有panda樣式的行，並顯示該行的後1行)

    2. -a或--text
               grep原本是搜尋文字檔，若拿二進位的檔案作為搜尋的目標，
               則會顯示如下的訊息: Binary file 二進位檔名 matches 然後結束。

               若加上-a參數則可將二進位檔案視為文字檔案搜尋，
               相當於--binary-files=text這個參數。

         ex:   (從二進位檔案mv中去搜尋panda樣式)
               (錯誤!!!)
               $ grep panda mv
               Binary file mv matches
               (這表示此檔案有match之處，詳見--binary-files=TYPE )
               $
               (正確!!!)
               $ grep -a panda mv

    3. -B NUM，--before-context=NUM
               與 -A NUM 相對，但這此參數是顯示除符合行之外
               並顯示在它之前的NUM行。

         ex:   (從file中搜尋有panda樣式的行，並顯示該行的前1行)
               $ grep -B 1 panda file

    4. -C [NUM], -NUM, --context[=NUM]
               列出符合行之外並列出上下各NUM行，預設值是2。

         ex:   (列出file中除包含panda樣式的行外並列出其上下2行)
               (若要改變預設值，直接改變NUM即可)
               $ grep -C[NUM]  panda file

    5. -b, --byte-offset
               列出樣式之前的內文總共有多少byte ..

          ex:  $ grep -b  panda file
       顯示結果類似於:
         0:panda
        66:pandahuang
       123:panda03

    6. --binary-files=TYPE
               此參數TYPE預設為binary(二進位)，若以普通方式搜尋，只有2種結果:
                 1.若有符合的地方：顯示Binary file 二進位檔名 matches
                 2.若沒有符合的地方：什麼都沒有顯示。

               若TYPE為without-match，遇到此參數，
               grep會認為此二進位檔案沒有包含任何搜尋樣式，與-I 參數相同。

               若TPYE為text, grep會將此二進位檔視為text檔案，與-a 參數相同。

     Warning: --binary-files=text 若輸出為終端機，可能會產生一些不必要的輸出。

    7. -c, --count
       不顯示符合樣式行，只顯示符合的總行數。
       若再加上-v,--invert-match，參數顯示不符合的總行數。

    8. -d ACTION, --directories=ACTION
               若輸入的檔案是一個資料夾，使用ACTION去處理這個資料夾。
       預設ACTION是read(讀取)，也就是說此資料夾會被視為一般的檔案；
       若ACTION是skip(略過)，資料夾會被grep略過：
       若ACTION是recurse(遞)，grep會去讀取資料夾下所有的檔案，
       此相當於-r 參數。

    9.  -E, --extended-regexp
       採用規則表示式去解釋樣式。

   10.  -e PATTERN, --regexp=PATTERN
       把樣式做為一個partern，通常用在避免partern用-開始。

   11.  -f FILE, --file=FILE
       事先將要搜尋的樣式寫入到一個檔案，一行一個樣式。
       然後採用檔案搜尋。
       空的檔案表示沒有要搜尋的樣式，因此也就不會有任何符合。

   ex: (newfile為搜尋樣式檔)
       $grep -f newfile file

   12.  -G, --basic-regexp
       將樣式視為基本的規則表示式解釋。(此為預設)

   13.  -H, --with-filename
       在每個符合樣式行前加上符合的檔案名稱，若有路徑會顯示路徑。

   ex: (在file與testfile中搜尋panda樣式)
       $grep -H panda file ./testfile
                file:panda
                ./testfile:panda
                $

   14.  -h, --no-filename
               與-H參數相類似，但在輸出時不顯示路徑。

   15.  --help
               產生簡短的help訊息。

   16.  -I
               grep會強制認為此二進位檔案沒有包含任何搜尋樣式，
               與--binary-files=without-match參數相同。

           ex:  $ grep -I  panda mv

   17.  -i, --ignore-case
               忽略大小寫，包含要搜尋的樣式及被搜尋的檔案。

           ex:  $ grep -i panda mv

   18.  -L, --files-without-match
               不顯示平常一般的輸出結果，反而顯示出沒有符合的檔案名稱。

   19.  -l, --files-with-matches
               不顯示平常一般的輸出結果，只顯示符合的檔案名稱。

   20.  --mmap
               如果可能，使用mmap系統呼叫去讀取輸入，而不是預設的read系統呼叫。
               在某些狀況，--mmap 能產生較好的效能。然而，--mmap
               如果運作中檔案縮短，或I/O 錯誤發生時，
               可能造成未定義的行為(包含core dump)，。

   21.  -n, --line-number
               在顯示行前，標上行號。

            ex:  $ grep -n  panda file
                顯示結果相似於下:
                行號:符合行的內容

   22.  -q, --quiet, --silent
               不顯示任何的一般輸出。請參閱-s或--no-messages

   23.  -r, --recursive
       遞地，讀取每個資料夾下的所有檔案，此相當於 -d recsuse 參數。

   24.  -s, --no-messages
       不顯示關於不存在或無法讀取的錯誤訊息。

小: 不像GNU grep，傳統的grep不符合POSIX.2協定，
       因為缺乏-q參數，且他的-s 參數表現像GNU grep的 -q 參數。
       Shell Script傾向將傳統的grep移植，避開-q及-s參數，
       且將輸出限制到/dev/null。

POSIX: 定義UNIX及UNIX-like系統需要提供的功能。

   25.  -V, --version
  顯示出grep的版本號到標準錯誤。
  當您在回報有關grep的bugs時，grep版本號是必須要包含在內的。

   26.  -v, --invert-match
  顯示除搜尋樣式行之外的全部。

   27.  -w, --word-regexp
          將搜尋樣式視為一個字去搜尋，完全符合該"字"的行才會被列出。

   28.  -x, --line-regexp
  將搜尋樣式視為一行去搜尋，完全符合該"行"的行才會被列出。

科技夢想者 - 技術與夢想的實踐之路

標籤

置頂文章

2013年3月19日星期二