2016 年度計算数学Ⅰ 第 10 回 正規表現
Contents
1. 正規表現 2. AWK
3. まけ:Linux Journey 4. 本日 実習
5. 次回 告
正規表現 (regular expression)
正則表現 呼ぶ方 数学科的 し ませ
ソフ 業界 う呼 ます
決ま 文法 ー 従 え パター
ン 合致す 文字列 表します
変化 満 世 中 キ 情報 自動処理
す 上 大変助け 道具 す
ターす 仕事 楽 ます
※ 凝 す 注意
grep … g/re/p
● 入力 キ 文字列 探すフ タ
● 決ま 文字列 け 正規表現 え パターン 探す ます
sed … stream editor
● 入力 文字 流 stream し
● そ 中 正規表現 ッチす 文字列 探し
● 見 文字列 指定 変更 加え edit
AWK
awk -- pattern-directed scanning and processing language
● 作者:Aho, Weinberger, Kernighan
● 行 区切 キ ータ 処理
● 一行 中 複数 フ ー あ う
ータ 処理す 場合 便利
● 古 Unix/Linux 標準装備 い
最近 GNU awk シ プ
重宝 ます
● 古 しいし速 いけ 私 一井
結構好 す
$ cd miscfiles-1.5
$ head countries
# UN Code number: 2 letter ISO abbrev : 3 letter ISO abbrev : name : capital
004:AF:AFG:Afghanistan:Kabul 248:AX:ALA:Åland Islands:Mariehamn 008:AL:ALB:Albania:Tirana
012:DZ:DZA:Algeria:Algiers
016:AS:ASM:American Samoa:Pago Pago 020:AD:AND:Andorra:Andorra la Vella 024:AO:AGO:Angola:Luanda
660:AI:AIA:Anguilla:The Valley 010:AQ:ATA:Antarctica:
$ awk -F: '!/^#/ {print $2,$4}' countries | head AF Afghanistan
AX Åland Islands AL Albania DZ Algeria AS American Samoa AD Andorra AO Angola AI Anguilla AQ Antarctica
AG Antigua and Barbuda
まけ: Linux Journey
https://linuxjourney.com
“Linux Journey is ad-free for your viewing pleasure, please help us keep it that way.
All contributions go towards keeping the site up and running.”
※ 単 紹 す
特 勧 す いうわけ あ ませ
本日 実習/次回 告
例 実習資料集 課題 用意し います
● 正規表現 sed
● grep egrep 正規表現
● egrep
● sed
Linux標準教科書 第4.5節 参照し い
正規表現やsed, awk い Web上 情報 あ ます
回 Linux入門 一応終了 します
次回+次々回 プ 言語 プロ ン
扱います
● Python, Ruby, JavaScript, Perl etc.
● 毛 宗教戦 関 しませ