業務システム - 覚え書き.com

Javaで文字列の前後の空白を削除したいとき、多くの人がまず trim() を使います。しかし、実務で扱うデータはもっと複雑。
実は trim() では 取り除けない空白 が存在します。

この記事では、

trim() の弱点
完全に空白除去したいときのベストプラクティス
実務（CSV・外部連携・Webアプリ）でのよくある落とし穴

をわかりやすく整理します。

■ trim() は万能ではない：取り除けない空白がある

trim() はあくまで Unicodeの制御文字(0x00–0x20) のみを対象にしています。

▼ trim()で削除できる例

半角スペース " "
タブ \t
改行 \n
復帰 \r

▼ trim()で削除できない代表例

全角スペース（　）
ノーブレークスペース（）
ゼロ幅スペース（\u200B）
特殊なUnicode空白

外部システム連携やExcel由来データで**“見えないゴミ空白”**が混入し、trim()では除去できないケースは非常に多いです。

■ 前後の空白を「完全に」除去する方法

① 正規表現による空白除去（最も汎用的）

▼ ポイント

\s = 制御文字＋一般的な空白
\p{Z} = Unicodeの空白カテゴリ（全角スペースなど）
前後どちらも削除できる

trim() では消えない全角・特殊スペースもまとめて除去できます。

■ ② Apache Commons Langの StringUtils を使う方法（簡単）

Apache Commons Lang が使えるなら、こちらが最も便利。

▼ trim()との違い

全角スペースも削除できる
Unicode空白に幅広く対応

外部システムとの連携が多い業務システムでは定番です。

■ ③ カスタム実装で「ホワイトリスト方式」

どの空白を除去するかを 自分で定義したい場合。

よく問題になる空白だけに絞りたいときに有効です。

■ 比較表：どの方法を使うべき？（実務ベース）

方法	メリット	デメリット	実務での利用度
trim()	標準、軽量、速い	全角スペースに弱い	△
正規表現	完全除去できる	少し処理が重い	◎
Apache StringUtils	記述が最も簡単	ライブラリが必要	◎
カスタムRegex	精密に制御可能	コードの読みにくさ	○

■ 実務で多いトラブル例

● CSVインポート時に項目が一致しない

→ Excel入力データに 全角スペース が混入している
→ trim() では削除されずバリデーションNG

● 外部システムのレスポンス整形で意図せず不一致

→ JSONのフィールドに ノーブレークスペース が入っていた

● Webフォームの入力チェックで正しく弾けない

→ ゼロ幅スペース（\u200B）が悪さをしていた

Javaの文字列処理では 目に見えないUnicode空白 がしばしば問題を起こします。

■ まとめ：trim() だけに頼らないこと！

前後の空白を 100％除去 したいなら、

正規表現（\s + \p{Z}）
StringUtils.trim()

このどちらかが“安全策”です。

業務システム、外部連携、CSV処理など “実データを扱う場面” では trim() だけでは不十分なことが多いため、ぜひ今回の方法を取り入れてみてください。

はじめに

企業間やシステム間のデータ連携でよく利用されるファイル転送ソフトウェア「HULFT」。日常的にCSVやログファイルをやり取りしている方も多いと思います。
その際に必ず出てくるのが「ファイルモードの指定」。HULFTには 「テキスト指定（レコード指定）」 と 「バイナリ指定」 の2種類があり、どちらを使うべきか迷うケースが少なくありません。

本記事では 「CSVをバイナリ指定で送った場合どうなるのか？」 を中心に、メリット・デメリットや注意点を整理します。

バイナリ指定とは？

HULFTにおける「バイナリ指定」とは、ファイル内容を1バイト単位のデータとしてそのまま送受信するモードを指します。
この場合、HULFTは以下のような変換や処理を一切行いません。

改行コードの変換（CRLF⇔LFなど）
文字コードの変換（Shift-JIS⇔UTF-8など）
レコード単位の制御（固定長・可変長）

つまり「HULFTが何も手を加えずにコピーする」のがバイナリ指定です。

バイナリ指定のメリット

内容がそのまま届く
改行コードや文字コードが勝手に変換されないため、送信元のデータを完全に保持できます。
ファイル形式を問わない
CSVに限らず、Excel、PDF、ZIP、画像ファイルなども問題なく転送可能。
→ そのため「とりあえず壊れたくないファイルはバイナリ指定」で安全に扱えます。
異なるOS間でも安心
WindowsからLinux、Linuxからホスト系など、環境差異を気にせず転送できます。

バイナリ指定のデメリット

文字コード変換がされない
送信側がShift-JIS、受信側がUTF-8を前提としている場合、そのままでは文字化けします。
改行コードもそのまま
WindowsのCSV（CRLF）をLinuxで処理すると、アプリ側がLFを期待していた場合に不具合の原因になります。
レコード単位の扱いができない
COBOLやホストシステム連携など「固定長レコード前提」のファイルを扱う場合は不向きです。

CSVをバイナリ指定で送るとどうなる？

結論から言うと、基本的に悪影響はありません。
CSVは単なるテキストファイルですが、HULFT側で勝手に改行コードや文字コードを変換しないので、送信元と全く同じファイルが届きます。

ただし以下のケースでは注意が必要です。

文字コードが異なる場合
送信元がShift-JIS、受信先がUTF-8で解析 → 文字化けの可能性あり。
改行コードが異なる場合
Windowsで作成したCSVをLinuxで使うと、改行が意図通りに扱えないことがある。

そのため「受信側のシステムがどの文字コード・改行コードを想定しているか」を事前に確認しておくことが大切です。

まとめ

バイナリ指定は「ファイルをそのまま送りたいとき」に有効。
CSVを送る場合も基本的に問題はないが、受信側の文字コードや改行コードの前提条件によっては注意が必要。
迷ったらまずは「バイナリ指定」で送り、必要に応じて受信側で変換処理を入れるのが無難です。

👉 実際の業務では「相手先がどんなシステムで受けるのか」を確認してから指定するのが鉄則です。
もし「文字コード変換が必要」や「固定長レコード前提」のような要件がある場合は、バイナリ指定ではなくテキスト指定を選ぶ方が安全です。

覚え書き.com

「業務システム」タグアーカイブ

Java：trimだけじゃない！前後の空白を完全に除去する方法

■ trim() は万能ではない：取り除けない空白がある

▼ trim()で削除できる例

▼ trim()で削除できない代表例

■ 前後の空白を「完全に」除去する方法

① 正規表現による空白除去（最も汎用的）

▼ ポイント

■ ② Apache Commons Langの StringUtils を使う方法（簡単）

▼ trim()との違い

■ ③ カスタム実装で「ホワイトリスト方式」

■ 比較表：どの方法を使うべき？（実務ベース）

■ 実務で多いトラブル例

● CSVインポート時に項目が一致しない

● 外部システムのレスポンス整形で意図せず不一致

● Webフォームの入力チェックで正しく弾けない

■ まとめ：trim() だけに頼らないこと！

HULFTでCSVをバイナリ指定するとどうなる？使い方と注意点まとめ

はじめに

バイナリ指定とは？

バイナリ指定のメリット

バイナリ指定のデメリット

CSVをバイナリ指定で送るとどうなる？

まとめ

「駑馬十駕」を信念に IT系情報を中心に調べた事をコツコツ綴っています。

■ trim() は万能ではない：取り除けない空白がある

▼ trim()で削除できる例

▼ trim()で削除できない代表例

■ 前後の空白を「完全に」除去する方法

① 正規表現による空白除去（最も汎用的）

▼ ポイント

■ ② Apache Commons Langの StringUtils を使う方法（簡単）

▼ trim()との違い

■ ③ カスタム実装で「ホワイトリスト方式」

■ 比較表：どの方法を使うべき？（実務ベース）

■ 実務で多いトラブル例

● CSVインポート時に項目が一致しない

● 外部システムのレスポンス整形で意図せず不一致

● Webフォームの入力チェックで正しく弾けない

■ まとめ：trim() だけに頼らないこと！

関連記事

はじめに

バイナリ指定とは？

バイナリ指定のメリット

バイナリ指定のデメリット

CSVをバイナリ指定で送るとどうなる？

まとめ

関連記事

「駑馬十駕」を信念に IT系情報を中心に調べた事をコツコツ綴っています。

　関連記事

　関連記事