文字列のクレンジング
この機能は、テキストデータのクリーニングに役立ち、スペースや改行、HTML タグ、URL などを取り除くことができます。
また、全角文字を半角に変換したり、大文字を小文字に変換するなどの文字変換も可能です。
例えば、顧客データの住所情報から不要な空白や記号を削除して一貫性を持たせたり、ウェブサイトのテキストから HTML タグを除去して内容のみを抽出する場合に便利です。
入出力定義
定義 | 内容 |
---|---|
入力 | データ |
出力 | データ |
サンプル
仕様補足
- 改行コード、URL、HTML タグの除去では処理後に半角スペースに置換されます。
- 上記の処理は独立して行われるのでスペースの除去の影響は受けません。