-
はじめに
CSVファイルを扱っていると、「BOMあり」「BOMなし」という言葉を目にすることがあります。
特にExcelで開いたときに文字化けしてしまった経験がある方は、この違いが大きな意味を持つことを知っておくと便利です。
この記事では、BOMの基礎から、Excelやシステムでの扱い方、確認方法まで解説します。
BOMとは?
BOM(Byte Order Mark)は、テキストファイルの先頭に付与される特殊な「目印」です。
文字コードを示すために使われ、特にUTF-8では以下の3バイトがBOMになります。これがあるファイルを「BOMあり」、ないファイルを「BOMなし」と呼びます。
BOMありとBOMなしの違い
BOMあり
-
Excelなどで開くと文字化けしにくい
-
日本語環境のExcelではBOM付きの方が安全に扱える
BOMなし
-
Linux系のシステムやプログラムでは一般的
-
余計なバイトが含まれないためシステム連携や自動処理で好まれる
Sakuraエディタで違いが分からない理由
Sakuraエディタはとても優秀で、UTF-8のBOMがあってもなくても正しく解釈して表示します。
そのため、見た目では違いが分からないのです。
他のソフトでは「」のような文字が先頭に表示されることもありますが、Sakuraではそうした問題は起きません。
BOMの有無を確認する方法
1. Sakuraエディタで確認
-
メニュー → ファイル → 文字コード指定して開く
-
「UTF-8」または「UTF-8 (BOM付き)」が表示される
2. バイナリエディタで確認
-
BOMあり:ファイル先頭に
EF BB BF
-
BOMなし:すぐに「ID,名前,点数」などの内容が始まる
3. コマンドで確認
-
Windows (PowerShell)
→ BOMありなら
239 187 191
が表示されます -
Linux
→ BOMありなら
ef bb bf
が確認できます
利用シーン別の使い分け
利用シーン おすすめ設定 理由 ExcelでCSVを開く場合 BOMあり(UTF-8 BOM) 文字化けを防ぎ、正しく読み込める プログラムやLinux環境で処理 BOMなし(UTF-8) 不要なバイトがなく安定処理できる BOMの有無を確認したい場合 バイナリやコマンド 確実に判別可能
まとめ
CSVファイルの「BOMあり/なし」は目で見える違いはなく、特にSakuraエディタではどちらでも正しく開けます。
しかし、Excelでの文字化けやシステム連携時の不具合を避けるためには、利用シーンに応じた使い分けが重要です。-
Excel → BOMあり
-
プログラム処理 → BOMなし
ぜひ状況に合わせて正しく選択してください。
-