HTMLのタグとタグの間にある文字列のみを抽出するsedの書き方

<html>Want to match here!</html>

sed -e 's/<[^>]*>//g'

上記のsedでHTMLタグのみを除去できます。
正確に説明すると、<[^>]*>はHTMLタグにマッチさせる正規表現になります。
そしてマッチしたHTMLタグをsedの置換で削除します。
するとHTMLタグに囲まれた部分だけ抽出することができます。

以上

この記事へのComments:

管理人のみ通知 :

Trackbacks:


プロフィール

トニヒコ

Author:トニヒコ
趣味は旅行と読書とマンガ。
将来の夢はコスモポリタン!

リンク・フリーです。

My hobby is traveling and reading(include manga).
My dream is to become cosmopolitan!

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
スポンサード リンク
マクロミルへ登録
FC2カウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR