外資系で役立つ正規表現
自分以外の社員が全員外国人というところは別として、外資系日本法人の日常会話は日本語だし、資料もほとんど日本語で作っているだろう。少なくとも私が知っている範囲ではそうだ。
とはいっても、ワールドワイドでは英語が公用語なので、本社や他国のスタッフとコミュニケーションするためには、英語の資料を送らなければ話にならない。日本語で作った資料を翻訳することもあるし、英語が苦手だからいったん日本語で書き、ほかの誰かに翻訳してもらうということもある。ここで問題なのは、英語化した資料が、相手のパソコン環境できちんと表示されるかどうかだ。
文字化けは絶対に避けたい。文字化けメールをもらったときや、日本語化の不具合でGUIが文字化けしている製品を使ったときに、自分がどう感じたかを思い出そう。それと同じ感情を相手も抱くはずだ。資料の中身に入る前に悪印象を与えるのは損。直接会うときと同じく、文章でも第一印象が大切である。
文字化けをなくすためには、英文フォントだけを使い、ダブルバイト文字を使わないようにする。フォントについては、それほど神経質にならなくてもよい。つい日本語フォントを使ってしまっても、たぶん代替フォントが割り当てられるので、それほど致命的ではない。実際に検証したわけではないが、MS Pゴシックで書いたExcelを送っても文句を言われなかったから、おそらくそうなのだろう。
一方、ダブルバイト文字、俗に言う全角文字は致命的だ。確実に文字化けの原因となる。IMEをオフにしてゼロから英文を書けば、ダブルバイト文字が混入することはない。しかし上に書いたように、日本語で書いた文書を流用することが多い。Excelのセルをひとつずつ翻訳していったり、日本語のWord文書を書き換えていったりすると、ダブルバイト文字を残してしまうことがよくある。
英文字は、シングルバイト文字(半角)なのかダブルバイト文字(全角)なのか、一見しただけではわかりにくい。なかでも括弧記号「(」と「)」は要注意である。また、意外に見落としがちなのが「○」と「×」だ。たとえば製品のテスト結果一覧表を送る場合を考えよう。日本語版の一覧表は、結果がOKだった項目に「○」、問題の出た項目に「×」と書いてある。テスト項目をきちんと英語に翻訳したのに、○や×をうっかりそのままにしてしまうことがけっこう多いのだ。私自身が指摘されたことがあるし、同僚が同じミスをやりかけたのをレビューで見つけたこともある。
いずれにせよ、目視でチェックするのには限界がある。こういうところはコンピュータを活用して楽するべきだ。ダブルバイト文字を探すときに頭を使う必要はないから、脳の退化を心配しなくてよい。
私は、Office文書をテキストで出力して秀丸エディタで開き、以下の正規表現でダブルバイト文字を検索している。
[^ -~\t\n]
なおダブルクォーテーション記号「”」は、シングルバイトでWordやExcelに入力しても、テキスト出力するとダブルバイト文字になってしまう。Officeの仕様かもしれない。これだけは目視チェックする必要がある。
| 固定リンク
この記事へのコメントは終了しました。
コメント