正規表現用のエンコーディング

November 28, 2008,
tags: mb_regex_encoding php


このエントリーをはてなブックマークに追加

ここ最近、サーバの設定が変わりましたって案件が続いたのでちょっとメモしておきたいと思います。
いろいろとつまづいた箇所はあるのですが、とくにPHP正規表現の文字コード。
なんかmbstring設定がことごとくEUC-JPに変わってしまっていました。

もちろん正規表現しているところもうまく範囲指定できない。
で、いちお正規表現時の文字コードを確認する方法。

var_dump(mb_regex_encoding());

//以下、実行結果
string(6) "EUC-JP"

ということで、やっぱ予想通り、EUCになっていたと。
なんで正規表現の文字コードも指定することに。

mb_regex_encoding('UTF-8');

うーん、やっぱフォーム周りとかmbstringの設定をかなり受けるから、何とかなるようなアプリケーションを考えなきゃだなぁー。
がんばろう。。。

comments powered by Disqus