🧠 Pythonで学ぶ画像認識入門：TensorFlowとKerasで手書き数字を判定する方法(3) ～CNNによる高精度モデル編～

前回の記事

「🧠 Pythonで学ぶ画像認識入門：TensorFlowとKerasで手書き数字を判定する方法(2) ～実践サンプルコード編～」

では、全結合層（Dense Layer）のみを使った
シンプルなニューラルネットワークで手書き数字を認識しました。

今回はその続編として、
より高い精度を実現するために

🌀 CNN（畳み込みニューラルネットワーク）
🌊 Dropoutによる過学習防止
⚙️ 学習率調整（Learning Rate Scheduling）

を導入した「高精度モデル版」を構築します。

🧩 動作環境（同シリーズ共通）





	項目 バージョン・設定内容




	OS Windows 11 Pro（64bit）


	Python 3.13.7（公式版インストーラ）


	pip 25.2


	仮想環境 venv（C:\python_env\env）


	TensorFlow 2.20.0


	matplotlib 3.10.6

項目	バージョン・設定内容
OS	Windows 11 Pro（64bit）
Python	3.13.7（公式版インストーラ）
pip	25.2
仮想環境	venv（C:\python_env\env）
TensorFlow	2.20.0
matplotlib	3.10.6

🧱 ステップ①：CNNを使ったモデル構築

CNNは画像認識に特化したネットワーク構造で、
人間の「目」と同じように特徴（輪郭・形・濃淡）を自動的に抽出します。

import numpy as np
import matplotlib.pyplot as plt
from tensorflow.keras.datasets import mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout
from tensorflow.keras.optimizers import Adam

# ---------- フォント設定（日本語対策） ----------
plt.rcParams['font.family'] = ['Meiryo', 'Yu Gothic', 'MS Gothic']
plt.rcParams['axes.unicode_minus'] = False

# ---------- データ読み込み ----------
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# ---------- CNN用にデータ形状を変換 ----------
x_train = x_train.reshape(-1, 28, 28, 1) / 255.0
x_test = x_test.reshape(-1, 28, 28, 1) / 255.0

# ---------- モデル構築 ----------
model = Sequential([
    Conv2D(32, (3,3), activation='relu', input_shape=(28,28,1)),
    MaxPooling2D((2,2)),
    Conv2D(64, (3,3), activation='relu'),
    MaxPooling2D((2,2)),
    Flatten(),
    Dropout(0.5),  # 過学習防止
    Dense(128, activation='relu'),
    Dense(10, activation='softmax')
])

import numpy as np

import matplotlib.pyplot as plt

from tensorflow.keras.datasets import mnist

from tensorflow.keras.models import Sequential

from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout

from tensorflow.keras.optimizers import Adam

# ---------- フォント設定（日本語対策） ----------

plt.rcParams['font.family'] = ['Meiryo', 'Yu Gothic', 'MS Gothic']

plt.rcParams['axes.unicode_minus'] = False

# ---------- データ読み込み ----------

(x_train, y_train), (x_test, y_test) = mnist.load_data()

# ---------- CNN用にデータ形状を変換 ----------

x_train = x_train.reshape(-1, 28, 28, 1) / 255.0

x_test = x_test.reshape(-1, 28, 28, 1) / 255.0

# ---------- モデル構築 ----------

model = Sequential([

Conv2D(32, (3,3), activation='relu', input_shape=(28,28,1)),

MaxPooling2D((2,2)),

Conv2D(64, (3,3), activation='relu'),

MaxPooling2D((2,2)),

Flatten(),

Dropout(0.5), # 過学習防止

Dense(128, activation='relu'),

Dense(10, activation='softmax')

])

⚙️ ステップ②：学習率を調整して最適化

Adam オプティマイザの learning_rate を指定することで、
勾配更新のスピードを細かく制御できます。

optimizer = Adam(learning_rate=0.001)  # 通常より少し低めで安定化
model.compile(optimizer=optimizer,
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

optimizer = Adam(learning_rate=0.001) # 通常より少し低めで安定化

model.compile(optimizer=optimizer,

loss='sparse_categorical_crossentropy',

metrics=['accuracy'])

📈 ステップ③：学習を実行

学習中の精度や損失の推移がターミナルに表示されます👇

🧾 ステップ④：テストデータで評価

CNNを導入したことで、精度は 約99％前後 に向上します🚀

🧠 ステップ⑤：予測結果の可視化

📊 ステップ⑥：精度の推移をグラフ化（オプション）

plt.plot(history.history['accuracy'], label='train_acc')
plt.plot(history.history['val_accuracy'], label='val_acc')
plt.title('学習精度の推移')
plt.xlabel('Epoch')
plt.ylabel('Accuracy')
plt.legend()
plt.show()

plt.plot(history.history['accuracy'], label='train_acc')

plt.plot(history.history['val_accuracy'], label='val_acc')

plt.title('学習精度の推移')

plt.xlabel('Epoch')

plt.ylabel('Accuracy')

plt.legend()

plt.show()

このグラフで、学習が過学習に陥っていないか確認できます。

💾 手順まとめ：ファイル保存〜実行まで

① ファイルを作成

任意のテキストエディタ（例：VSCode、メモ帳、サクラエディタなど）で
以下のコードをコピーして貼り付けてください。

ファイル名は：

② コード内容（完全版）

# =========================================
# Pythonで学ぶ画像認識入門
# TensorFlow + Keras (CNN高精度モデル)
# =========================================

import numpy as np
import matplotlib.pyplot as plt
from tensorflow.keras.datasets import mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout
from tensorflow.keras.optimizers import Adam

# ---------- 日本語フォント設定 ----------
plt.rcParams['font.family'] = ['Meiryo', 'Yu Gothic', 'MS Gothic']
plt.rcParams['axes.unicode_minus'] = False

# ---------- データ読み込み ----------
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# ---------- CNN用にデータ形状を変換 ----------
x_train = x_train.reshape(-1, 28, 28, 1) / 255.0
x_test = x_test.reshape(-1, 28, 28, 1) / 255.0

# ---------- CNNモデル構築 ----------
model = Sequential([
    Conv2D(32, (3,3), activation='relu', input_shape=(28,28,1)),
    MaxPooling2D((2,2)),
    Conv2D(64, (3,3), activation='relu'),
    MaxPooling2D((2,2)),
    Flatten(),
    Dropout(0.5),
    Dense(128, activation='relu'),
    Dense(10, activation='softmax')
])

# ---------- オプティマイザ（学習率調整） ----------
optimizer = Adam(learning_rate=0.001)
model.compile(optimizer=optimizer,
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

# ---------- モデル学習 ----------
print("🔹 モデル学習開始中...")
history = model.fit(x_train, y_train, epochs=10, batch_size=128,
                    validation_data=(x_test, y_test))

# ---------- 評価 ----------
print("\n🔹 テストデータで評価中...")
test_loss, test_acc = model.evaluate(x_test, y_test)
print(f"✅ Test accuracy: {test_acc:.4f}")

# ---------- 予測 ----------
predictions = model.predict(x_test)
index = 0
plt.imshow(x_test[index].reshape(28,28), cmap='gray')
plt.title(f"予測結果: {np.argmax(predictions[index])}")
plt.show()

# ---------- 精度の推移グラフ ----------
plt.plot(history.history['accuracy'], label='train_acc')
plt.plot(history.history['val_accuracy'], label='val_acc')
plt.title('学習精度の推移')
plt.xlabel('Epoch')
plt.ylabel('Accuracy')
plt.legend()
plt.show()

# =========================================

# Pythonで学ぶ画像認識入門

# TensorFlow + Keras (CNN高精度モデル)

# =========================================

import numpy as np

import matplotlib.pyplot as plt

from tensorflow.keras.datasets import mnist

from tensorflow.keras.models import Sequential

from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout

from tensorflow.keras.optimizers import Adam

# ---------- 日本語フォント設定 ----------

plt.rcParams['font.family'] = ['Meiryo', 'Yu Gothic', 'MS Gothic']

plt.rcParams['axes.unicode_minus'] = False

# ---------- データ読み込み ----------

(x_train, y_train), (x_test, y_test) = mnist.load_data()

# ---------- CNN用にデータ形状を変換 ----------

x_train = x_train.reshape(-1, 28, 28, 1) / 255.0

x_test = x_test.reshape(-1, 28, 28, 1) / 255.0

# ---------- CNNモデル構築 ----------

model = Sequential([

Conv2D(32, (3,3), activation='relu', input_shape=(28,28,1)),

MaxPooling2D((2,2)),

Conv2D(64, (3,3), activation='relu'),

MaxPooling2D((2,2)),

Flatten(),

Dropout(0.5),

Dense(128, activation='relu'),

Dense(10, activation='softmax')

])

# ---------- オプティマイザ（学習率調整） ----------

optimizer = Adam(learning_rate=0.001)

model.compile(optimizer=optimizer,

loss='sparse_categorical_crossentropy',

metrics=['accuracy'])

# ---------- モデル学習 ----------

print("🔹 モデル学習開始中...")

history = model.fit(x_train, y_train, epochs=10, batch_size=128,

validation_data=(x_test, y_test))

# ---------- 評価 ----------

print("\n🔹 テストデータで評価中...")

test_loss, test_acc = model.evaluate(x_test, y_test)

print(f"✅ Test accuracy: {test_acc:.4f}")

# ---------- 予測 ----------

predictions = model.predict(x_test)

index = 0

plt.imshow(x_test[index].reshape(28,28), cmap='gray')

plt.title(f"予測結果: {np.argmax(predictions[index])}")

plt.show()

# ---------- 精度の推移グラフ ----------

plt.plot(history.history['accuracy'], label='train_acc')

plt.plot(history.history['val_accuracy'], label='val_acc')

plt.title('学習精度の推移')

plt.xlabel('Epoch')

plt.ylabel('Accuracy')

plt.legend()

plt.show()

③ 保存場所

わかりやすくするために、
これまでと同じフォルダ内（例：C:\python_env）に保存するのがおすすめです。

④ 実行手順

1️⃣ 仮想環境を有効化（重要）：

⑤ 実行結果

学習が進むと各 Epoch ごとの精度が表示される
終了時に

✅ Test accuracy: 0.9935

のような高精度結果が出る
その後、
- AIが予測した数字画像（例：「7」）
- 学習精度グラフ（train_acc / val_acc）
  が順に表示されます

⑥ 終了後

仮想環境を終了：

🚀 結果と考察

比較項目	前回（Dense）	今回（CNN＋Dropout）	考察
モデル構造	全結合層のみ	畳み込み+プーリング	CNNが画像の空間特徴を直接学習でき、汎化性能が向上
エポック数	5	10	学習回数は増えるが精度向上に寄与
学習時間（目安）	約5秒	約20秒	パラメータが増えるため計算時間は増加
精度（テスト）	約97.6%	約99.2%	CNN導入で+1〜2ポイント改善
過学習対策	なし	Dropout(0.5)	Dropoutにより汎化が改善し、過学習を抑制

CNNを導入することで、特徴抽出の自動化が進み、
より安定した高精度の画像認識が可能になりました。

💡 応用ポイント

🔹 BatchNormalization を追加するとさらに安定化
🔹 データ拡張（ImageDataGenerator） で汎化性能アップ
🔹 モデル保存：model.save("mnist_cnn_model.h5")

✅ まとめ

本記事では、

CNN（畳み込みニューラルネットワーク）＋Dropout＋学習率調整
を導入して、手書き数字認識AIを高精度化しました。

精度は 約99％ に到達し、実用的な画像認識モデルの基礎が完成です。

🔜 次回予告

「(4) 学習済みモデルを使って自分の手書き画像を判定する」

自分で描いた数字画像を読み込んで、
AIがそれを正しく識別できるか試してみましょう🖋️

覚え書き.com

🧩 動作環境（同シリーズ共通）

🧱 ステップ①：CNNを使ったモデル構築

⚙️ ステップ②：学習率を調整して最適化

📈 ステップ③：学習を実行

🧾 ステップ④：テストデータで評価

🧠 ステップ⑤：予測結果の可視化

📊 ステップ⑥：精度の推移をグラフ化（オプション）

💾 手順まとめ：ファイル保存〜実行まで

① ファイルを作成

② コード内容（完全版）

③ 保存場所

④ 実行手順

⑤ 実行結果

⑥ 終了後

🚀 結果と考察

💡 応用ポイント

✅ まとめ

🔜 次回予告

コメントを残す

「駑馬十駕」を信念に IT系情報を中心に調べた事をコツコツ綴っています。

🧩 動作環境（同シリーズ共通）

🧱 ステップ①：CNNを使ったモデル構築

⚙️ ステップ②：学習率を調整して最適化

📈 ステップ③：学習を実行

🧾 ステップ④：テストデータで評価

🧠 ステップ⑤：予測結果の可視化

📊 ステップ⑥：精度の推移をグラフ化（オプション）

💾 手順まとめ：ファイル保存〜実行まで

① ファイルを作成

② コード内容（完全版）

③ 保存場所

④ 実行手順

⑤ 実行結果

⑥ 終了後

🚀 結果と考察

💡 応用ポイント

✅ まとめ

🔜 次回予告

関連記事

コメントを残す コメントをキャンセル

「駑馬十駕」を信念に IT系情報を中心に調べた事をコツコツ綴っています。

　関連記事

コメントを残す