チューニング - 覚え書き.com

SQLの処理が遅いと感じたとき、多くの人が「サーバが遅いのでは？」と思いがちです。
しかし、実際の原因の多くは「インデックス（索引）」の使い方にあります。
この記事では、インデックスの基本構造から、実際のチューニング手法までを体系的に解説します。

1. インデックスとは？

インデックスとは、データベースが**検索を高速化するために作成する“索引”**のことです。
書籍の巻末索引のように、「この値はどこにあるか」を素早く見つけるための目次のような仕組みです。

🔹 例：インデックスなしの検索

このとき、インデックスが無ければ、データベースは全件を1件ずつ確認します（フルスキャン）。

🔹 例：インデックスありの検索

これにより、該当レコードを索引経由で一瞬で特定できるようになります。

2. インデックスの仕組みを理解する

🧩 B-treeインデックス

ほとんどのRDBMS（Oracle、MySQL、PostgreSQLなど）で採用されている構造です。
値が昇順に整理され、2分探索のように効率的に検索できます。

例えば「70」を探すとき、50より大きいので右に進み、次に70を発見します。
わずか2ステップで到達できるため、フルスキャンに比べて圧倒的に速いのです。

🧩 ビットマップインデックス（Oracleなど）

主に**値の種類が少ないカラム（性別、ステータスなど）**に有効です。
各値に対応するレコードのビットマップを管理することで、AND/OR検索が高速化します。

3. どんなカラムにインデックスを貼るべきか？

✅ 有効なケース

WHERE句で頻繁に検索される列
JOIN条件に使われる列
ORDER BYやGROUP BYの対象列
外部キー（FOREIGN KEY）列

🚫 不向きなケース

データ件数が極端に少ない列（例：性別など）
更新頻度が高い列（INSERT/UPDATEが多いと再構築コストが増大）
テーブル全件を常に取得するクエリ

4. 実行計画で確認する

SQLの速度改善は、**「インデックスが使われているか」**を確認することが第一歩です。

結果例（MySQLの場合）

type	key	rows	Extra
ref	idx_users_email	1	Using index

「Using index」と表示されていれば、インデックスが利用されています。
逆に「ALL」となっている場合はフルスキャンです。

5. インデックスを使った高速化テクニック

🌟 複合インデックス（複数列）

複数の列を組み合わせた検索で効果を発揮します。
ただし、先頭の列が条件に含まれないと使われない点に注意が必要です。

例：

🌟 カバリングインデックス（Covering Index）

インデックスに必要な列すべてを含めることで、テーブルアクセスをスキップできます。

テーブルを参照せずにインデックスだけで完結するため、極めて高速です。

🌟 LIKE検索の最適化

前方一致（Yui%）はインデックスが有効ですが、

のような部分一致はインデックス無効です。
対策としては、**全文検索エンジン（MySQLのFULLTEXT、PostgreSQLのGIN/GiST）**を使う方法があります。

6. 注意点：インデックスの弊害

インデックスは便利ですが、万能ではありません。
特に以下の点には注意が必要です。

リスク	説明
更新コスト増大	INSERTやUPDATE時にインデックスも更新されるため、処理が重くなる
ストレージ消費	大規模テーブルに多くのインデックスを張ると、容量が急増
メンテナンス負荷	不要なインデックスを放置すると、統計情報がずれて性能が劣化

🧹 定期的に ANALYZE TABLE や REBUILD INDEX を実施して、統計情報を更新しましょう。

7. 実践チューニング例

✏️ 例1：検索が遅いクエリ

🩹 改善策

✅ 実行計画の変化

変更前：type = ALL（フルスキャン）
変更後：type = ref（インデックス参照）

実行時間が数秒 → 数ミリ秒まで短縮されることもあります。

まとめ

ポイント	内容
インデックスとは	データ検索を高速化するための“索引”
構造	B-treeが主流。ビットマップは限定用途
効果的な付与	検索条件、JOIN、GROUP BY、ORDER BY列
落とし穴	更新負荷、容量増加、部分一致非対応
確認方法	EXPLAINで実行計画を必ずチェック

🚀 結論

インデックスを理解すれば、SQLの速度は10倍以上高速化することも珍しくありません。
なんとなく作るのではなく、「どう検索されるか」を意識して設計することが重要です。

企業システム間のデータ連携で定番の HULFT（ハルフト）。
日次バッチや帳票ファイルの受け渡しで使っていると、「転送が遅いのでは？」と感じることもあるでしょう。

この記事では、HULFTの転送速度の目安と、大容量ファイルを高速・安定的に送信するためのチューニング術をまとめます。
さらに、WinSCP や AWS CLI との比較も紹介します。

1. HULFTの転送速度の目安

HULFT自体は内部的に64bit整数でファイルを扱えるため、理論的な制限はほぼありません。
実際の速度は ネットワーク帯域 × HULFTの処理オーバーヘッド に左右されます。

📊 ファイルサイズ別の目安（1Gbps環境・実効70〜80%の場合）

ファイルサイズ	転送時間の目安	備考
100MB	1〜2秒	LAN環境なら一瞬
1GB	10〜15秒	WAN越しだと数分に延びることも
5GB	1〜2分	S3の1オブジェクト上限(5TB)には余裕あり

💡 100Mbpsの回線では、1GB送信に2分前後かかります。
つまり「回線帯域の影響が支配的」と言えます。

2. 回線速度ごとの目安

HULFTのオーバーヘッド込みで実効値を 70〜80% と仮定した場合の目安です。

回線速度	理論値	実効値(目安)	1GB転送時間
1Gbps回線（LAN内）	125MB/s	90〜100MB/s	約10〜12秒
100Mbps回線（VPN/クラウド接続）	12.5MB/s	8〜10MB/s	約100〜120秒（2分程度）
50Mbps回線（遅めのVPN）	6.25MB/s	約5MB/s	約200秒（3〜4分）
10Mbps回線（制限回線など）	1.25MB/s	約1MB/s	約15〜20分

👉 このように、回線帯域がボトルネックになるケースが大半です。

チューニングで改善できるのは「オーバーヘッド部分」ですが、根本は回線速度に依存します。

3. HULFTと他の手段の速度比較

同じ回線での「体感スピード」の比較イメージです。

手段	転送速度の傾向	特徴
HULFT	実効70〜80%（安定）	商用の運用性・再送制御が強い。監査/ジョブ連携向き
WinSCP (SFTP/FTP)	実効50〜70%	GUIで扱いやすいが大容量の再送制御は弱め
AWS CLI (S3 cp/sync)	実効80〜90%（並列化可）	高速だがジョブ管理や監査は限定的

👉 HULFTは「最高速」ではなく「確実性と運用性を優先した転送」という位置づけです。

特に基幹システム間の「失敗できない転送」ではHULFTが選ばれる理由があります。

4. 転送速度に影響する要因

HULFTの転送性能は、次の要素で大きく変わります。

ネットワーク帯域：1Gbpsか100Mbpsかで10倍以上の差
HULFTのバッファサイズ：デフォルト64KB → 1MBに拡張すると効率UP
再送制御：エラー時の挙動設定によって安定性と速度が変わる
ファイルシステムのI/O性能：HDDよりSSDの方が有利
暗号化や圧縮の有無：CPU負荷が上がると転送速度が落ちる

5. 高速化のためのチューニング術

大容量ファイルを送る際に有効なチューニング方法を整理します。

(1) バッファサイズ調整

パラメータ SEND_BUFFER_SIZE を 1024KB（1MB）程度 に拡張
WAN越しでもスループットが改善

(2) マルチパートアップロード（S3利用時）

HULFT Storage Option では 並列転送 に対応
1GBクラスなら1パートで十分だが、数GB以上なら 4〜8並列 に設定すると効果大

(3) 部分再送を有効化

転送途中で中断しても 途中から再開 できる
WAN経由や夜間バッチでの安定性向上に必須

(4) 圧縮の利用

CSVやテキストは圧縮転送で大幅短縮
バイナリ（PDFやZIP）は圧縮効果が薄い

(5) ネットワーク調整

TCPウィンドウサイズやNIC送信バッファを拡張

Linux例：

6. 運用上の工夫

速度チューニングだけでなく、運用面でも工夫が必要です。

ピーク時間を避けてスケジューリング（夜間バッチに実行）
再送回数を3回程度に設定し、エラー時のリカバリを自動化
ログ監視（HULFTの送受信ログ＋S3側のCloudWatch）で転送成功を二重確認
日付付きファイル名で履歴管理を容易に

まとめ

HULFT自体は大容量に強く、理論上は数TB〜EBまで対応可能
実効速度は 回線帯域 × バッファ調整 × 再送設定 がカギ
100MBなら数秒、1GBなら十数秒〜数分 が目安
HULFTは最高速よりも「確実性・運用性」を重視する製品
バッファ拡張・並列化・部分再送 で安定高速な運用が可能

覚え書き.com

「チューニング」タグアーカイブ

インデックスの仕組みを理解してSQLを劇的に高速化する方法

1. インデックスとは？

🔹 例：インデックスなしの検索

🔹 例：インデックスありの検索

2. インデックスの仕組みを理解する

🧩 B-treeインデックス

🧩 ビットマップインデックス（Oracleなど）

3. どんなカラムにインデックスを貼るべきか？

✅ 有効なケース

🚫 不向きなケース

4. 実行計画で確認する

結果例（MySQLの場合）

5. インデックスを使った高速化テクニック

🌟 複合インデックス（複数列）

🌟 カバリングインデックス（Covering Index）

🌟 LIKE検索の最適化

6. 注意点：インデックスの弊害

7. 実践チューニング例

✏️ 例1：検索が遅いクエリ

🩹 改善策

✅ 実行計画の変化

まとめ

🚀 結論

HULFTの転送速度はどのくらい？大容量ファイル送信を高速化するチューニング術

1. HULFTの転送速度の目安

📊 ファイルサイズ別の目安（1Gbps環境・実効70〜80%の場合）

2. 回線速度ごとの目安

3. HULFTと他の手段の速度比較

4. 転送速度に影響する要因

5. 高速化のためのチューニング術

(1) バッファサイズ調整

(2) マルチパートアップロード（S3利用時）

(3) 部分再送を有効化

(4) 圧縮の利用

(5) ネットワーク調整

6. 運用上の工夫

まとめ

「駑馬十駕」を信念に IT系情報を中心に調べた事をコツコツ綴っています。

1. インデックスとは？

🔹 例：インデックスなしの検索

🔹 例：インデックスありの検索

2. インデックスの仕組みを理解する

🧩 B-treeインデックス

🧩 ビットマップインデックス（Oracleなど）

3. どんなカラムにインデックスを貼るべきか？

✅ 有効なケース

🚫 不向きなケース

4. 実行計画で確認する

結果例（MySQLの場合）

5. インデックスを使った高速化テクニック

🌟 複合インデックス（複数列）

🌟 カバリングインデックス（Covering Index）

🌟 LIKE検索の最適化

6. 注意点：インデックスの弊害

7. 実践チューニング例

✏️ 例1：検索が遅いクエリ

🩹 改善策

✅ 実行計画の変化

まとめ

🚀 結論

関連記事

1. HULFTの転送速度の目安

📊 ファイルサイズ別の目安（1Gbps環境・実効70〜80%の場合）

2. 回線速度ごとの目安

3. HULFTと他の手段の速度比較

4. 転送速度に影響する要因

5. 高速化のためのチューニング術

(1) バッファサイズ調整

(2) マルチパートアップロード（S3利用時）

(3) 部分再送を有効化

(4) 圧縮の利用

(5) ネットワーク調整

6. 運用上の工夫

まとめ

関連記事

「駑馬十駕」を信念に IT系情報を中心に調べた事をコツコツ綴っています。

　関連記事

　関連記事