Irregular whitespace not allowed

Vue.jsの開発中にLintのエラーが出た。

error  in ./src/App.vue 
 
  ✘  http://eslint.org/docs/rules/no-irregular-whitespace  Irregular whitespace not allowed 
  /Users/masa/.ghq/52.197.1.134/SumasapoWeb/web/src/App.vue:174:41 
        let lastName = this.name.split(/[ 　]/g)[0] 
                                           ^

姓と名を分割したいけど半角スペースと全角スペースのどちらが区切り文字かわからないという場合のコード。

変なとこで空白使うなよ、って話でこれをなんとかしたいという話。

結論

半角スペースと全角スペースをそれぞれ文字コードで指定してやればよい。

// uフラグを指定 
let lastName = this.name.split(/[\u{20}\u{3000}]/u)[0] 
 
// uフラグなし 
let lastName = this.name.split(/[\x20\u3000]/)[0]

半角スペースの文字コードが16進数で 20 で全角スペースの文字コードが16進数で 3000 となる。

正規表現での文字コードの指定

Javascriptの正規表現の中で文字コードを使う場合はバックスラッシュ文字 (\) を使った特殊文字を使う。

文字	意味
`\xhh`	hh（2 桁の 16 進数）コードからなる文字列にマッチします。
`\uhhhh`	hhhh（4 桁の 16 進数）コードからなる文字列にマッチします。
`\u{hhhh}`	uフラグがセットされた時のみ Unicode 値 hhhh (16 進数) からなる文字列にマッチします。

引用元 - 特殊文字の使い方

正規表現の中では半角スペースを \x20、全角スペースを \u3000 として指定することができる。

文字コードの調べ方

文字コードを調べるには String.prototype.codePointAt() を使う。 codePointAt()で出力される値は10進数なので、正規表現の中で使う場合は16進数に変換する必要がある。

$ node 
> ' '.codePointAt(0) 
32 
> '　'.codePointAt(0) 
12288 
// 16進数 
> ' '.codePointAt(0).toString(16) 
'20' 
> '　'.codePointAt(0).toString(16) 
'3000'

ひらがなの文字コード

ひらがなの文字コードはぁから始まりゖで終わるのでこの範囲を指定することでひらがなだけの文字列を正規表現で判定することができる。

それぞれの文字コードは String.prototype.codePointAt() で同様に調べるられる。

> 'ぁ'.codePointAt(0) 
12353 
> 'ゖ'.codePointAt(0) 
12438 
// 16進数 
> 'ぁ'.codePointAt(0).toString(16) 
'3041' 
> 'ゖ'.codePointAt(0).toString(16) 
'3096'

文字コードからString.fromCodePoint() を使って文字を出力することができる。

> for (i = 12352; i <= 12439; i++) { 
... console.log(String.fromCodePoint(i)) 
... } 
 
぀ 
ぁ 
あ 
// 略 
ゕ 
ゖ 
゗

ひらがなのだけの文字列判定は以下のようにできる。

'にんいのひらがなもじれつ'.match(/[\u{3042}-\u{3096}]+/u)

カタカナの文字コード

同様にカタカナの文字コードは以下の範囲になる。

> 'ァ'.codePointAt(0) 
12449 
> 'ヶ'.codePointAt(0) 
12534 
// 16進数 
> 'ァ'.codePointAt(0).toString(16) 
'30a1' 
> 'ヶ'.codePointAt(0).toString(16) 
'30f6' 
 
> for (var s='', i=12449; i<=12534; i++) { s=s+String.fromCodePoint(i) } 
'ァアィイゥウェエォオカガキギクグケゲコゴサザシジスズセゼソゾタダチヂッツヅテデトドナニヌネノハバパヒビピフブプヘベペホボポマミムメモャ ヤュユョヨラリルレロヮワヰヱヲンヴヵヶ'

カタカナだけの文字列判定は以下のようになる。

> 'ニンイノカタカナ'.match(/[\u{30a1}-\u{30f6}]+/u)

Unknown2021年5月7日 2:18
このコメントはブログの管理者によって削除されました。
返信削除
返信
Unknown2021年5月7日 2:18
このコメントはブログの管理者によって削除されました。
返信削除
返信
UK Live StreaminG NetWork2021年5月16日 2:59
このコメントはブログの管理者によって削除されました。
返信削除
返信
UK Live StreaminG NetWork2021年5月16日 2:59
このコメントはブログの管理者によって削除されました。
返信削除
返信
UK Live StreaminG NetWork2021年5月16日 2:59
このコメントはブログの管理者によって削除されました。
返信削除
返信

コメントを追加

このブログを検索

IT音痴アラフィフおやじのストック記事倉庫

Javascriptで全角スペースと半角スペースを正規表現で指定する

Irregular whitespace not allowed

結論

正規表現での文字コードの指定

文字コードの調べ方

ひらがなの文字コード

カタカナの文字コード

コメント

コメントを投稿

このブログの人気の投稿

投稿時間:2021-06-17 22:08:45 RSSフィード2021-06-17 22:00 分まとめ(2089件)

投稿時間:2021-06-20 02:06:12 RSSフィード2021-06-20 02:00 分まとめ(3871件)

投稿時間:2023-02-05 02:09:04 RSSフィード2023-02-05 02:00 分まとめ(9件)