2015
12
09

HTMLのタグとタグの間にある文字列のみを抽出するsedの書き方

<html>Want to match here!</html>

sed -e 's/<[^>]*>//g'

上記のsedでHTMLタグのみを除去できます。
正確に説明すると、<[^>]*>はHTMLタグにマッチさせる正規表現になります。
そしてマッチしたHTMLタグをsedの置換で削除します。
するとHTMLタグに囲まれた部分だけ抽出することができます。

以上
Comment



Only the blog author may view the comment.

[147]

That is a very good tip especially to those new to the blogosphere.
Short but very accurate info… Thank you for sharing
this one. A must read article!

Trackback
Trackback URL

«  | HOME |  »

奇妙な風景 Unique Scene
<< >>

プロフィール


最新記事


最新コメント


最新トラックバック


月別アーカイブ


カテゴリ


スポンサード リンク


FC2カウンター


検索フォーム


RSSリンクの表示


リンク


ブロとも申請フォーム


QRコード