Linux, テキスト処理コマンドまとめ
Linuxでよく使うテキスト処理コマンドをまとめる.リダイレクト(>, >>)やawk, sedと組み合わせて使うと強力.
1) cat [-n] hoge.txt fuga.txt
hoge.txtとfuga.txtを結合し,各行の左端に行番号を付けて出力
2) cut -d , -f 2 hoge.txt
hoge.txt内の","を区切り文字として指定したフィールドを抽出
3) join -j 1 hoge.txt fuga.txt
第1フィールドを基準にhoge.txtとfuga.txtをフィールドごとにまとめる.
hoge.txt : 1 maruyama
fuga.txt : 1 imai
>> 1 maruyama imai
4) paste hoge.txt fuga.txt
同じ行数の行をタブで区切って連結する.
hoge.txt : hoge
fuga.txt : fuga
>> hoge fuga
5) uniq hoge.txt
重複行を取り除いて表示
6) sort -n hoge.txt
hoge.txt内の数値をソートして表示
sortについてキチッとまとめようとするとかなりの量になる気がするので,細かいことは今度にします.一応以下がsortの参考ページ
sortコマンドで複数キーによるソート - あらびき日記
http://d.hatena.ne.jp/a_bicky/20110724/1311497192
Linuxコマンド集 - 【 sort 】 行を並び替える:ITpro