「画像認識」タグアーカイブ

前回

「🧠 Pythonで学ぶ画像認識入門：TensorFlowとKerasで手書き数字を判定する方法(4) ～学習済みモデルで自作画像を認識～」

の記事では、学習済みモデルを使って「1枚の手書き数字画像」を判定しました。
今回はさらに発展して、フォルダ内にある複数の画像を一括で認識してみましょう。

これにより、手書きで作成した「0〜9」の数字画像をまとめてテストできるようになります。

🧩 動作環境（共通）

項目	バージョン / ツール
OS	Windows 11 Pro 24H2
Python	3.12.6
pip	24.2
エディタ	PowerShell / VS Code
ライブラリ	pandas 2.x / matplotlib 3.x / openpyxl 3.x

📁 ステップ①：フォルダ構成を準備

まず、テスト用フォルダを作成します。

C:\python_env\
├─ mnist_cnn_model.h5        ← 前回の学習済みモデル
├─ test_images\
│   ├─ 0.png
│   ├─ 1.png
│   ├─ 2.png
│   ├─ 3.png
│   └─ 4.png
│   └─ 5.png
│   └─ 6.png
│   └─ 7.png
│   └─ 8.png
│   └─ 9.png
└─ predict_batch.py          ← 今回のスクリプト

C:\python_env\

├─ mnist_cnn_model.h5 ← 前回の学習済みモデル

├─ test_images\

│ ├─ 0.png

│ ├─ 1.png

│ ├─ 2.png

│ ├─ 3.png

│ └─ 4.png

│ └─ 5.png

│ └─ 6.png

│ └─ 7.png

│ └─ 8.png

│ └─ 9.png

└─ predict_batch.py ← 今回のスクリプト

各画像は 白背景 × 黒または青文字、中央寄せ、28×28ピクセル推奨です。

🧠 ステップ②：複数画像を一括認識するスクリプト

ファイル名：predict_batch.py

内容：

# =========================================
# 複数の自作画像を学習済みモデルで一括認識
# =========================================

import os
import numpy as np
import matplotlib.pyplot as plt
from tensorflow.keras.models import load_model
from tensorflow.keras.preprocessing import image

# ---------- フォント設定 ----------
plt.rcParams['font.family'] = ['Meiryo', 'Yu Gothic', 'MS Gothic']
plt.rcParams['axes.unicode_minus'] = False

# ---------- モデル読み込み ----------
model = load_model("mnist_cnn_model.h5")
print("✅ 学習済みモデルを読み込みました。")

# ---------- 画像フォルダ ----------
folder_path = "test_images"
files = sorted([f for f in os.listdir(folder_path) if f.endswith(('.png', '.jpg', '.jpeg'))])

# ---------- 一括推論 ----------
results = []
for file in files:
    img_path = os.path.join(folder_path, file)
    img = image.load_img(img_path, target_size=(28, 28), color_mode="grayscale")
    img_array = image.img_to_array(img)
    img_array = 255 - img_array   # 白背景×黒文字の反転補正
    img_array = img_array / 255.0
    img_array = np.expand_dims(img_array, axis=0)

    pred = model.predict(img_array)
    label = np.argmax(pred)
    results.append((file, label))
    print(f"{file} → 予測結果: {label}")

# ---------- 一覧表示 ----------
plt.figure(figsize=(10, 2))
for i, (fname, label) in enumerate(results):
    img_path = os.path.join(folder_path, fname)
    img = image.load_img(img_path, target_size=(28, 28), color_mode="grayscale")
    plt.subplot(1, len(results), i + 1)
    plt.imshow(img, cmap='gray')
    plt.title(f"{label}", fontsize=12)
    plt.axis("off")
plt.suptitle("一括予測結果", fontsize=14)
plt.show()

# =========================================

# 複数の自作画像を学習済みモデルで一括認識

# =========================================

import os

import numpy as np

import matplotlib.pyplot as plt

from tensorflow.keras.models import load_model

from tensorflow.keras.preprocessing import image

# ---------- フォント設定 ----------

plt.rcParams['font.family'] = ['Meiryo', 'Yu Gothic', 'MS Gothic']

plt.rcParams['axes.unicode_minus'] = False

# ---------- モデル読み込み ----------

model = load_model("mnist_cnn_model.h5")

print("✅ 学習済みモデルを読み込みました。")

# ---------- 画像フォルダ ----------

folder_path = "test_images"

files = sorted([f for f in os.listdir(folder_path) if f.endswith(('.png', '.jpg', '.jpeg'))])

# ---------- 一括推論 ----------

results = []

for file in files:

img_path = os.path.join(folder_path, file)

img = image.load_img(img_path, target_size=(28, 28), color_mode="grayscale")

img_array = image.img_to_array(img)

img_array = 255 - img_array # 白背景×黒文字の反転補正

img_array = img_array / 255.0

img_array = np.expand_dims(img_array, axis=0)

pred = model.predict(img_array)

label = np.argmax(pred)

results.append((file, label))

print(f"{file} → 予測結果: {label}")

# ---------- 一覧表示 ----------

plt.figure(figsize=(10, 2))

for i, (fname, label) in enumerate(results):

img_path = os.path.join(folder_path, fname)

img = image.load_img(img_path, target_size=(28, 28), color_mode="grayscale")

plt.subplot(1, len(results), i + 1)

plt.imshow(img, cmap='gray')

plt.title(f"{label}", fontsize=12)

plt.axis("off")

plt.suptitle("一括予測結果", fontsize=14)

plt.show()

⚙️ ステップ③：実行方法

仮想環境を有効化して、次を実行します：

🧾 ステップ④：出力結果（例）

コンソール出力例：

✅ 学習済みモデルを読み込みました。
0.png → 予測結果: 0
1.png → 予測結果: 1
2.png → 予測結果: 2
3.png → 予測結果: 3
4.png → 予測結果: 4
5.png → 予測結果: 5
6.png → 予測結果: 6
7.png → 予測結果: 7
8.png → 予測結果: 8
9.png → 予測結果: 9

✅ 学習済みモデルを読み込みました。

0.png → 予測結果: 0

1.png → 予測結果: 1

2.png → 予測結果: 2

3.png → 予測結果: 3

4.png → 予測結果: 4

5.png → 予測結果: 5

6.png → 予測結果: 6

7.png → 予測結果: 7

8.png → 予測結果: 8

9.png → 予測結果: 9

グラフ表示：

横一列に数字画像が並び、各画像の下にAIの判定結果が表示されます
一目でどの画像をどの数字と認識したか分かります

📊 ステップ⑤：結果と考察





	項目 内容




	処理対象 フォルダ内の全画像（png/jpg）を自動スキャン


	推論処理 load_modelでCNNモデルを再利用し、一括predictを実施


	表示形式 コンソール出力＋matplotlibで可視化


	精度 1枚ずつ推論と同等（約99%）を維持


	応用例 書類や帳票の一括認識、データセットの一括評価など


	考察 単一推論を拡張してバッチ処理化。フォルダ単位で実行できるため自動化が容易

項目	内容
処理対象	フォルダ内の全画像（png/jpg）を自動スキャン
推論処理	load_modelでCNNモデルを再利用し、一括predictを実施
表示形式	コンソール出力＋matplotlibで可視化
精度	1枚ずつ推論と同等（約99%）を維持
応用例	書類や帳票の一括認識、データセットの一括評価など
考察	単一推論を拡張してバッチ処理化。フォルダ単位で実行できるため自動化が容易

💡 発展ポイント

テーマ	内容
結果をCSV出力	pandas.DataFrame(results).to_csv('result.csv', index=False)
サブフォルダ対応	os.walk() を使えば階層フォルダも処理可能
推論速度UP	GPU環境なら処理時間が大幅短縮
異常画像の検出	サイズやフォーマットが不正な画像をスキップ処理可能

✅ まとめ

本記事では、学習済みモデルを使って複数の手書き数字画像をまとめて判定しました。
フォルダ単位で一括処理できるため、データテストやAIモデルの精度検証にも最適です。

次回は、

🧠 (6) 判定結果をCSV出力し、正解データと比較して精度を分析
として、「自作データセットの評価編」に進みます。

Python, ブログ, プログラミング

🧠 Pythonで学ぶ画像認識入門：TensorFlowとKerasで手書き数字を判定する方法(4) ～学習済みモデルで自作画像を認識～

2025年10月5日管理者コメントする

前回の

「🧠 Pythonで学ぶ画像認識入門：TensorFlowとKerasで手書き数字を判定する方法(3) ～CNNによる高精度モデル編～」

までで、MNISTデータセットを使い高精度なCNNモデルを作成しました。
今回はその学習済みモデルを再利用し、自分で描いた手書き数字画像を実際に判定してみましょう。

ステップ①：学習済みモデルの保存

前回での学習コードに以下を追加して、モデルを保存しておきます。

ステップ②：自作画像を準備する

1️⃣ 白背景に黒文字で「0〜9」の数字を描いた画像を用意
2️⃣ 画像サイズを 28×28ピクセル にリサイズ
3️⃣ ファイル形式は .png または .jpg でOK

（例）

※手書きペイントツールで描いてもOK。
できるだけ文字を中央に配置し、背景は白が理想です。

ステップ③：推論スクリプトを作成

ファイル名：

内容：

# =========================================
# 学習済みモデルを使って手書き画像を判定
# =========================================

import numpy as np
import matplotlib.pyplot as plt
from tensorflow.keras.models import load_model
from tensorflow.keras.preprocessing import image

# ---------- フォント設定 ----------
plt.rcParams['font.family'] = ['Meiryo', 'Yu Gothic', 'MS Gothic']
plt.rcParams['axes.unicode_minus'] = False

# ---------- モデルを読み込み ----------
model = load_model("mnist_cnn_model.h5")
print("✅ 学習済みモデルを読み込みました。")

# ---------- 画像を読み込み ----------
img_path = "my_digit.png"   # ← 自分の画像ファイル名
img = image.load_img(img_path, target_size=(28, 28), color_mode="grayscale")

# ---------- 前処理 ----------
img_array = image.img_to_array(img)
img_array = 255 - img_array        # 白黒反転（白背景×黒文字対応）
img_array = img_array / 255.0
img_array = np.expand_dims(img_array, axis=0)

# ---------- 予測 ----------
pred = model.predict(img_array)
predicted_label = np.argmax(pred)

# ---------- 結果表示 ----------
plt.imshow(img_array[0].reshape(28, 28), cmap='gray')
plt.title(f"予測結果: {predicted_label}")
plt.show()

# =========================================

# 学習済みモデルを使って手書き画像を判定

# =========================================

import numpy as np

import matplotlib.pyplot as plt

from tensorflow.keras.models import load_model

from tensorflow.keras.preprocessing import image

# ---------- フォント設定 ----------

plt.rcParams['font.family'] = ['Meiryo', 'Yu Gothic', 'MS Gothic']

plt.rcParams['axes.unicode_minus'] = False

# ---------- モデルを読み込み ----------

model = load_model("mnist_cnn_model.h5")

print("✅ 学習済みモデルを読み込みました。")

# ---------- 画像を読み込み ----------

img_path = "my_digit.png" # ← 自分の画像ファイル名

img = image.load_img(img_path, target_size=(28, 28), color_mode="grayscale")

# ---------- 前処理 ----------

img_array = image.img_to_array(img)

img_array = 255 - img_array # 白黒反転（白背景×黒文字対応）

img_array = img_array / 255.0

img_array = np.expand_dims(img_array, axis=0)

# ---------- 予測 ----------

pred = model.predict(img_array)

predicted_label = np.argmax(pred)

# ---------- 結果表示 ----------

plt.imshow(img_array[0].reshape(28, 28), cmap='gray')

plt.title(f"予測結果: {predicted_label}")

plt.show()

ステップ④：実行

仮想環境を有効化して、次のコマンドを実行：

ステップ⑤：結果と考察

項目	内容
予測結果	AIが自作の手書き数字を正しく認識し、予測結果が画面に表示される
処理時間	数百ミリ秒程度で即時に判定が完了
注意点	白背景×黒文字の前提で学習しているため、背景と文字が逆の場合は反転処理を削除
応用例	手書き書類の数字抽出、郵便番号や伝票番号の自動読み取りなどに応用可能
考察	CNNモデルにより自作データでも高い精度を維持。前処理（反転・正規化）が認識精度に大きく影響

💡 ワンポイント

もし背景が黒で文字が白の場合は、
次の行を削除してください：

✅ まとめ

これで「自分の描いた手書き数字」をAIが正しく認識できるようになりました。
この流れを応用すれば、より複雑な画像分類（例えば「猫と犬」や「手書き文字分類」）にも発展できます。

Python, ブログ, プログラミング

🧠 Pythonで学ぶ画像認識入門：TensorFlowとKerasで手書き数字を判定する方法(3) ～CNNによる高精度モデル編～

2025年10月5日管理者コメントする

前回の記事

「🧠 Pythonで学ぶ画像認識入門：TensorFlowとKerasで手書き数字を判定する方法(2) ～実践サンプルコード編～」

では、全結合層（Dense Layer）のみを使った
シンプルなニューラルネットワークで手書き数字を認識しました。

今回はその続編として、
より高い精度を実現するために

🌀 CNN（畳み込みニューラルネットワーク）
🌊 Dropoutによる過学習防止
⚙️ 学習率調整（Learning Rate Scheduling）

を導入した「高精度モデル版」を構築します。

🧩 動作環境（同シリーズ共通）





	項目 バージョン・設定内容




	OS Windows 11 Pro（64bit）


	Python 3.13.7（公式版インストーラ）


	pip 25.2


	仮想環境 venv（C:\python_env\env）


	TensorFlow 2.20.0


	matplotlib 3.10.6

🧱 ステップ①：CNNを使ったモデル構築

CNNは画像認識に特化したネットワーク構造で、
人間の「目」と同じように特徴（輪郭・形・濃淡）を自動的に抽出します。

import numpy as np
import matplotlib.pyplot as plt
from tensorflow.keras.datasets import mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout
from tensorflow.keras.optimizers import Adam

# ---------- フォント設定（日本語対策） ----------
plt.rcParams['font.family'] = ['Meiryo', 'Yu Gothic', 'MS Gothic']
plt.rcParams['axes.unicode_minus'] = False

# ---------- データ読み込み ----------
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# ---------- CNN用にデータ形状を変換 ----------
x_train = x_train.reshape(-1, 28, 28, 1) / 255.0
x_test = x_test.reshape(-1, 28, 28, 1) / 255.0

# ---------- モデル構築 ----------
model = Sequential([
    Conv2D(32, (3,3), activation='relu', input_shape=(28,28,1)),
    MaxPooling2D((2,2)),
    Conv2D(64, (3,3), activation='relu'),
    MaxPooling2D((2,2)),
    Flatten(),
    Dropout(0.5),  # 過学習防止
    Dense(128, activation='relu'),
    Dense(10, activation='softmax')
])

import numpy as np

import matplotlib.pyplot as plt

from tensorflow.keras.datasets import mnist

from tensorflow.keras.models import Sequential

from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout

from tensorflow.keras.optimizers import Adam

# ---------- フォント設定（日本語対策） ----------

plt.rcParams['font.family'] = ['Meiryo', 'Yu Gothic', 'MS Gothic']

plt.rcParams['axes.unicode_minus'] = False

# ---------- データ読み込み ----------

(x_train, y_train), (x_test, y_test) = mnist.load_data()

# ---------- CNN用にデータ形状を変換 ----------

x_train = x_train.reshape(-1, 28, 28, 1) / 255.0

x_test = x_test.reshape(-1, 28, 28, 1) / 255.0

# ---------- モデル構築 ----------

model = Sequential([

Conv2D(32, (3,3), activation='relu', input_shape=(28,28,1)),

MaxPooling2D((2,2)),

Conv2D(64, (3,3), activation='relu'),

MaxPooling2D((2,2)),

Flatten(),

Dropout(0.5), # 過学習防止

Dense(128, activation='relu'),

Dense(10, activation='softmax')

])

⚙️ ステップ②：学習率を調整して最適化

Adam オプティマイザの learning_rate を指定することで、
勾配更新のスピードを細かく制御できます。

optimizer = Adam(learning_rate=0.001)  # 通常より少し低めで安定化
model.compile(optimizer=optimizer,
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

optimizer = Adam(learning_rate=0.001) # 通常より少し低めで安定化

model.compile(optimizer=optimizer,

loss='sparse_categorical_crossentropy',

metrics=['accuracy'])

📈 ステップ③：学習を実行

学習中の精度や損失の推移がターミナルに表示されます👇

🧾 ステップ④：テストデータで評価

CNNを導入したことで、精度は 約99％前後 に向上します🚀

🧠 ステップ⑤：予測結果の可視化

📊 ステップ⑥：精度の推移をグラフ化（オプション）

plt.plot(history.history['accuracy'], label='train_acc')
plt.plot(history.history['val_accuracy'], label='val_acc')
plt.title('学習精度の推移')
plt.xlabel('Epoch')
plt.ylabel('Accuracy')
plt.legend()
plt.show()

plt.plot(history.history['accuracy'], label='train_acc')

plt.plot(history.history['val_accuracy'], label='val_acc')

plt.title('学習精度の推移')

plt.xlabel('Epoch')

plt.ylabel('Accuracy')

plt.legend()

plt.show()

このグラフで、学習が過学習に陥っていないか確認できます。

💾 手順まとめ：ファイル保存〜実行まで

① ファイルを作成

任意のテキストエディタ（例：VSCode、メモ帳、サクラエディタなど）で
以下のコードをコピーして貼り付けてください。

ファイル名は：

② コード内容（完全版）

# =========================================
# Pythonで学ぶ画像認識入門
# TensorFlow + Keras (CNN高精度モデル)
# =========================================

import numpy as np
import matplotlib.pyplot as plt
from tensorflow.keras.datasets import mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout
from tensorflow.keras.optimizers import Adam

# ---------- 日本語フォント設定 ----------
plt.rcParams['font.family'] = ['Meiryo', 'Yu Gothic', 'MS Gothic']
plt.rcParams['axes.unicode_minus'] = False

# ---------- データ読み込み ----------
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# ---------- CNN用にデータ形状を変換 ----------
x_train = x_train.reshape(-1, 28, 28, 1) / 255.0
x_test = x_test.reshape(-1, 28, 28, 1) / 255.0

# ---------- CNNモデル構築 ----------
model = Sequential([
    Conv2D(32, (3,3), activation='relu', input_shape=(28,28,1)),
    MaxPooling2D((2,2)),
    Conv2D(64, (3,3), activation='relu'),
    MaxPooling2D((2,2)),
    Flatten(),
    Dropout(0.5),
    Dense(128, activation='relu'),
    Dense(10, activation='softmax')
])

# ---------- オプティマイザ（学習率調整） ----------
optimizer = Adam(learning_rate=0.001)
model.compile(optimizer=optimizer,
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

# ---------- モデル学習 ----------
print("🔹 モデル学習開始中...")
history = model.fit(x_train, y_train, epochs=10, batch_size=128,
                    validation_data=(x_test, y_test))

# ---------- 評価 ----------
print("\n🔹 テストデータで評価中...")
test_loss, test_acc = model.evaluate(x_test, y_test)
print(f"✅ Test accuracy: {test_acc:.4f}")

# ---------- 予測 ----------
predictions = model.predict(x_test)
index = 0
plt.imshow(x_test[index].reshape(28,28), cmap='gray')
plt.title(f"予測結果: {np.argmax(predictions[index])}")
plt.show()

# ---------- 精度の推移グラフ ----------
plt.plot(history.history['accuracy'], label='train_acc')
plt.plot(history.history['val_accuracy'], label='val_acc')
plt.title('学習精度の推移')
plt.xlabel('Epoch')
plt.ylabel('Accuracy')
plt.legend()
plt.show()

# =========================================

# Pythonで学ぶ画像認識入門

# TensorFlow + Keras (CNN高精度モデル)

# =========================================

import numpy as np

import matplotlib.pyplot as plt

from tensorflow.keras.datasets import mnist

from tensorflow.keras.models import Sequential

from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout

from tensorflow.keras.optimizers import Adam

# ---------- 日本語フォント設定 ----------

plt.rcParams['font.family'] = ['Meiryo', 'Yu Gothic', 'MS Gothic']

plt.rcParams['axes.unicode_minus'] = False

# ---------- データ読み込み ----------

(x_train, y_train), (x_test, y_test) = mnist.load_data()

# ---------- CNN用にデータ形状を変換 ----------

x_train = x_train.reshape(-1, 28, 28, 1) / 255.0

x_test = x_test.reshape(-1, 28, 28, 1) / 255.0

# ---------- CNNモデル構築 ----------

model = Sequential([

Conv2D(32, (3,3), activation='relu', input_shape=(28,28,1)),

MaxPooling2D((2,2)),

Conv2D(64, (3,3), activation='relu'),

MaxPooling2D((2,2)),

Flatten(),

Dropout(0.5),

Dense(128, activation='relu'),

Dense(10, activation='softmax')

])

# ---------- オプティマイザ（学習率調整） ----------

optimizer = Adam(learning_rate=0.001)

model.compile(optimizer=optimizer,

loss='sparse_categorical_crossentropy',

metrics=['accuracy'])

# ---------- モデル学習 ----------

print("🔹 モデル学習開始中...")

history = model.fit(x_train, y_train, epochs=10, batch_size=128,

validation_data=(x_test, y_test))

# ---------- 評価 ----------

print("\n🔹 テストデータで評価中...")

test_loss, test_acc = model.evaluate(x_test, y_test)

print(f"✅ Test accuracy: {test_acc:.4f}")

# ---------- 予測 ----------

predictions = model.predict(x_test)

index = 0

plt.imshow(x_test[index].reshape(28,28), cmap='gray')

plt.title(f"予測結果: {np.argmax(predictions[index])}")

plt.show()

# ---------- 精度の推移グラフ ----------

plt.plot(history.history['accuracy'], label='train_acc')

plt.plot(history.history['val_accuracy'], label='val_acc')

plt.title('学習精度の推移')

plt.xlabel('Epoch')

plt.ylabel('Accuracy')

plt.legend()

plt.show()

③ 保存場所

わかりやすくするために、
これまでと同じフォルダ内（例：C:\python_env）に保存するのがおすすめです。

④ 実行手順

1️⃣ 仮想環境を有効化（重要）：

⑤ 実行結果

学習が進むと各 Epoch ごとの精度が表示される
終了時に

✅ Test accuracy: 0.9935

のような高精度結果が出る
その後、
- AIが予測した数字画像（例：「7」）
- 学習精度グラフ（train_acc / val_acc）
  が順に表示されます

⑥ 終了後

仮想環境を終了：

🚀 結果と考察

比較項目	前回（Dense）	今回（CNN＋Dropout）	考察
モデル構造	全結合層のみ	畳み込み+プーリング	CNNが画像の空間特徴を直接学習でき、汎化性能が向上
エポック数	5	10	学習回数は増えるが精度向上に寄与
学習時間（目安）	約5秒	約20秒	パラメータが増えるため計算時間は増加
精度（テスト）	約97.6%	約99.2%	CNN導入で+1〜2ポイント改善
過学習対策	なし	Dropout(0.5)	Dropoutにより汎化が改善し、過学習を抑制

CNNを導入することで、特徴抽出の自動化が進み、
より安定した高精度の画像認識が可能になりました。

💡 応用ポイント

🔹 BatchNormalization を追加するとさらに安定化
🔹 データ拡張（ImageDataGenerator） で汎化性能アップ
🔹 モデル保存：model.save("mnist_cnn_model.h5")

✅ まとめ

本記事では、

CNN（畳み込みニューラルネットワーク）＋Dropout＋学習率調整
を導入して、手書き数字認識AIを高精度化しました。

精度は 約99％ に到達し、実用的な画像認識モデルの基礎が完成です。

🔜 次回予告

「(4) 学習済みモデルを使って自分の手書き画像を判定する」

自分で描いた数字画像を読み込んで、
AIがそれを正しく識別できるか試してみましょう🖋️

Python, ブログ, プログラミング

🧠 Pythonで学ぶ画像認識入門：TensorFlowとKerasで手書き数字を判定する方法(2) ～実践サンプルコード編～

2025年10月5日管理者 1件のコメント

前回の記事
「🧠Pythonで学ぶ画像認識入門：TensorFlowとKerasで手書き数字を判定する方法(1) ～環境構築編～」

では、

「Python公式版＋仮想環境を使ったTensorFlow開発環境構築」
を行い、AI開発の準備が整いました。

今回はその続編として、
実際にTensorFlowとKerasを使って手書き数字を判定するAIモデルを作る実践編 を解説します。
データの読み込みからモデルの学習・評価・予測までを、
最小限のシンプルなコードで体験してみましょう。

🧩 動作環境（前回と同じ構成）





	項目 バージョン・設定内容




	OS Windows 11 Pro（64bit）


	Python 3.13.7（公式版インストーラ）


	pip 25.2


	仮想環境 venv（C:\python_env\env）


	TensorFlow 2.20.0


	matplotlib 3.10.6

🧠 ステップ①：MNISTデータセットを読み込む

TensorFlowには「手書き数字データ（MNIST）」が標準で付属しています👇

from tensorflow.keras.datasets import mnist
import matplotlib.pyplot as plt

# データ読み込み（訓練用6万枚、テスト用1万枚）
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# 画像を確認
plt.imshow(x_train[0], cmap='gray')
plt.title(f"Label: {y_train[0]}")
plt.show()

from tensorflow.keras.datasets import mnist

import matplotlib.pyplot as plt

# データ読み込み（訓練用6万枚、テスト用1万枚）

(x_train, y_train), (x_test, y_test) = mnist.load_data()

# 画像を確認

plt.imshow(x_train[0], cmap='gray')

plt.title(f"Label: {y_train[0]}")

plt.show()

🧩 ステップ②：データの前処理

🧩 ステップ③：モデル構築（Keras Sequential）

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten

model = Sequential([
    Flatten(input_shape=(28, 28)),  # 28x28ピクセル → 1次元ベクトル
    Dense(128, activation='relu'),  # 隠れ層
    Dense(10, activation='softmax') # 出力層（0〜9）
])

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

from tensorflow.keras.models import Sequential

from tensorflow.keras.layers import Dense, Flatten

model = Sequential([

Flatten(input_shape=(28, 28)), # 28x28ピクセル → 1次元ベクトル

Dense(128, activation='relu'), # 隠れ層

Dense(10, activation='softmax') # 出力層（0〜9）

])

model.compile(optimizer='adam',

loss='sparse_categorical_crossentropy',

metrics=['accuracy'])

🧩 ステップ④：学習を実行

🧩 ステップ⑤：テストデータで評価

🧩 ステップ⑥：実際に予測してみる

import numpy as np

predictions = model.predict(x_test)
index = 0

plt.imshow(x_test[index], cmap='gray')
plt.title(f"予測結果: {np.argmax(predictions[index])}")
plt.show()

import numpy as np

predictions = model.predict(x_test)

index = 0

plt.imshow(x_test[index], cmap='gray')

plt.title(f"予測結果: {np.argmax(predictions[index])}")

plt.show()

AIが画像を認識して、数字を正しく判定してくれます👀✨

ステップ①～⑥のコードについて

各ステップは、順番に実行される処理の流れを分けて説明しているだけで、
実際のプログラムとしては 連続して動く1つのコード になります。

つまり、実際に実行する場合は次のようにすべてまとめて書いて問題ありません👇

✅ 例：`mnist_sample.py` として保存する内容

# =========================================
# Pythonで学ぶ画像認識入門
# TensorFlow + Keras 実践サンプル（MNIST判定）
# 文字化け対策版
# =========================================

import numpy as np
import matplotlib.pyplot as plt
from tensorflow.keras.datasets import mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten

# ---------- 日本語フォント設定 ----------
plt.rcParams['font.family'] = ['Meiryo', 'Yu Gothic', 'MS Gothic']  # Windows向け
plt.rcParams['axes.unicode_minus'] = False  # マイナス記号の文字化け防止

# ---------- データ読み込み ----------
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# ---------- 前処理 ----------
x_train = x_train / 255.0
x_test = x_test / 255.0

# ---------- モデル構築 ----------
model = Sequential([
    Flatten(input_shape=(28, 28)),      # 画像を1次元に変換
    Dense(128, activation='relu'),      # 中間層
    Dense(10, activation='softmax')     # 出力層（0～9）
])

# ---------- モデルのコンパイル ----------
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

# ---------- 学習 ----------
print("🔹 モデル学習開始中...")
model.fit(x_train, y_train, epochs=5)

# ---------- 評価 ----------
print("\n🔹 テストデータで評価中...")
test_loss, test_acc = model.evaluate(x_test, y_test)
print(f"✅ Test accuracy: {test_acc:.4f}")

# ---------- 予測 ----------
predictions = model.predict(x_test)
index = 0
predicted_label = np.argmax(predictions[index])

# ---------- 結果表示 ----------
plt.imshow(x_test[index], cmap='gray')
plt.title(f"予測結果: {predicted_label}")
plt.show()

# =========================================

# Pythonで学ぶ画像認識入門

# TensorFlow + Keras 実践サンプル（MNIST判定）

# 文字化け対策版

# =========================================

import numpy as np

import matplotlib.pyplot as plt

from tensorflow.keras.datasets import mnist

from tensorflow.keras.models import Sequential

from tensorflow.keras.layers import Dense, Flatten

# ---------- 日本語フォント設定 ----------

plt.rcParams['font.family'] = ['Meiryo', 'Yu Gothic', 'MS Gothic'] # Windows向け

plt.rcParams['axes.unicode_minus'] = False # マイナス記号の文字化け防止

# ---------- データ読み込み ----------

(x_train, y_train), (x_test, y_test) = mnist.load_data()

# ---------- 前処理 ----------

x_train = x_train / 255.0

x_test = x_test / 255.0

# ---------- モデル構築 ----------

model = Sequential([

Flatten(input_shape=(28, 28)), # 画像を1次元に変換

Dense(128, activation='relu'), # 中間層

Dense(10, activation='softmax') # 出力層（0～9）

])

# ---------- モデルのコンパイル ----------

model.compile(optimizer='adam',

loss='sparse_categorical_crossentropy',

metrics=['accuracy'])

# ---------- 学習 ----------

print("🔹 モデル学習開始中...")

model.fit(x_train, y_train, epochs=5)

# ---------- 評価 ----------

print("\n🔹 テストデータで評価中...")

test_loss, test_acc = model.evaluate(x_test, y_test)

print(f"✅ Test accuracy: {test_acc:.4f}")

# ---------- 予測 ----------

predictions = model.predict(x_test)

index = 0

predicted_label = np.argmax(predictions[index])

# ---------- 結果表示 ----------

plt.imshow(x_test[index], cmap='gray')

plt.title(f"予測結果: {predicted_label}")

plt.show()

💾 保存と実行

C:\python_env などに上記を mnist_sample.py として保存
仮想環境を有効化：

MS DOS

cd C:\python_env env\Scripts\activate

1

cd C:\python_env env\Scripts\activate
実行：

MS DOS

python mnist_sample.py

1

python mnist_sample.py
実行例

📊 補足：精度向上のヒント

CNN（畳み込みニューラルネットワーク） を導入する
Dropout で過学習を防止
エポック数や学習率 の調整

これらを追加すると、より実践的なモデルになります。

🚀 まとめ

本記事では、
TensorFlowとKerasを用いて「手書き数字判定AI」を実装しました。

これで、

データの前処理
モデル構築
学習・評価・予測
というAIの基本的な流れを一通り理解できたはずです。

次回

「🧠 Pythonで学ぶ画像認識入門：TensorFlowとKerasで手書き数字を判定する方法(3) ～CNNによる高精度モデル編～」

は、CNNを用いた高精度モデル化（第3回） に挑戦します🔥

Python, ブログ, プログラミング

🧠 Pythonで学ぶ画像認識入門：TensorFlowとKerasで手書き数字を判定する方法(1) ～環境構築編～

2025年10月4日管理者 1件のコメント

AIや機械学習に興味がある方にとって、「画像認識」は最初の一歩として最適なテーマです。
今回は Python + TensorFlow + Keras を使って、手書き数字を自動判定するプログラムを実際に作ってみましょう。
有名な「MNIST（エムニスト）」という手書き数字データセットを使うことで、数十行のコードで高精度な認識が可能になります。

～公式版インストールから仮想環境・動作確認まで～

💻 環境例

項目	バージョン・設定内容
OS	Windows 11 Pro（64bit）
Python	3.13.7（公式版インストーラ）
pip	25.2
仮想環境	venv（C:\python_env\env）
TensorFlow	2.20.0
matplotlib	3.10.6

🧩 ステップ①：公式Pythonのインストール

1️⃣ Python公式サイトへアクセス

👉 https://www.python.org/downloads/windows/

2️⃣ 最新の「Windows installer (64-bit)」をダウンロード

①Downloads → Windows を選択し、「Latest Python 3 Release – Python 3.13.7」をクリック

②画面下にある「Windows installer (64-bit)」をクリックしてダウンロード

3️⃣ インストーラ起動後の設定

以下のチェックを必ず確認してください。

✅ Add python.exe to PATH
✅ Use admin privileges when installing py.exe
➡ 「Customize installation」を選択して進む

4️⃣ Advanced Options の設定

☑ Install Python 3.13 for all users
☑ Add Python to environment variables
☑ Precompile standard library
📁 インストール先を以下に変更：

C:\Python313

5️⃣ 「Install」をクリックして完了！

🧩 ステップ②：インストール確認

インストール完了後、コマンドプロンプトで以下を実行👇

🧩 ステップ③：仮想環境の作成と有効化

プロジェクト専用の仮想環境を作成して、ライブラリの競合を防ぎます。

🧩 ステップ④：TensorFlowとmatplotlibをインストール

仮想環境が有効な状態で以下を実行👇

🧩 ステップ⑤：動作確認

TensorFlowが正常に動作しているか確認します。

※ oneDNN に関する警告が表示されても正常です。
性能最適化のための通知なので無視してOKです。

🧩 ステップ⑥：仮想環境の管理コマンドまとめ

操作内容	コマンド
仮想環境を終了	deactivate
仮想環境を再開	cd C:\python_env && env\Scripts\activate
ライブラリ一覧確認	pip list
仮想環境の削除	rmdir /s /q C:\python_env

✅ まとめ

この手順で構築すれば、
Windows上で安定して動作する TensorFlow + Keras + matplotlib 環境が整います。
AI学習・画像認識・データ分析など、あらゆるPython開発に対応可能です💡

💬 次回予告

「🧠 Pythonで学ぶ画像認識入門：TensorFlowとKerasで手書き数字を判定する方法(2) ～実践サンプルコード編～」

では、「TensorFlowとKerasで手書き数字を判定する」実践サンプルコード

を紹介します。
実際にMNISTデータセットを使って、
AIが数字を“読む”プロセスを一緒に学んでいきましょう。

🧩 動作環境（共通）

📁 ステップ①：フォルダ構成を準備

🧠 ステップ②：複数画像を一括認識するスクリプト

⚙️ ステップ③：実行方法

🧾 ステップ④：出力結果（例）

📊 ステップ⑤：結果と考察

💡 発展ポイント

✅ まとめ

関連記事

ステップ①：学習済みモデルの保存

ステップ②：自作画像を準備する

ステップ③：推論スクリプトを作成

ステップ④：実行

ステップ⑤：結果と考察

💡 ワンポイント

✅ まとめ

関連記事

🧩 動作環境（同シリーズ共通）

🧱 ステップ①：CNNを使ったモデル構築

⚙️ ステップ②：学習率を調整して最適化

📈 ステップ③：学習を実行

🧾 ステップ④：テストデータで評価

🧠 ステップ⑤：予測結果の可視化

📊 ステップ⑥：精度の推移をグラフ化（オプション）

💾 手順まとめ：ファイル保存〜実行まで

① ファイルを作成

② コード内容（完全版）

③ 保存場所

④ 実行手順

⑤ 実行結果

⑥ 終了後

🚀 結果と考察

💡 応用ポイント

✅ まとめ

🔜 次回予告

関連記事

🧩 動作環境（前回と同じ構成）

🧠 ステップ①：MNISTデータセットを読み込む

🧩 ステップ②：データの前処理

🧩 ステップ③：モデル構築（Keras Sequential）

🧩 ステップ④：学習を実行

🧩 ステップ⑤：テストデータで評価

🧩 ステップ⑥：実際に予測してみる

ステップ①～⑥のコードについて

✅ 例：mnist_sample.py として保存する内容

💾 保存と実行

📊 補足：精度向上のヒント

🚀 まとめ

関連記事

💻 環境例

🧩 ステップ①：公式Pythonのインストール

1️⃣ Python公式サイトへアクセス

2️⃣ 最新の「Windows installer (64-bit)」をダウンロード

3️⃣ インストーラ起動後の設定

4️⃣ Advanced Options の設定

5️⃣ 「Install」をクリックして完了！

🧩 ステップ②：インストール確認

🧩 ステップ③：仮想環境の作成と有効化

🧩 ステップ④：TensorFlowとmatplotlibをインストール

🧩 ステップ⑤：動作確認

🧩 ステップ⑥：仮想環境の管理コマンドまとめ

✅ まとめ

💬 次回予告

関連記事

「駑馬十駕」を信念に IT系情報を中心に調べた事をコツコツ綴っています。

　関連記事

　関連記事

　関連記事

✅ 例：`mnist_sample.py` として保存する内容

　関連記事

　関連記事