スマホで撮るだけで問題を解説するAIの仕組み｜OCR×LLMをやさしく説明

2025年11月17日 2025年11月17日

まさのり先生

近年、Uknow AIをはじめとする「写真を撮るだけで問題を解説するAIアプリ」が急速に普及しています。
しかし、この〝魔法のような機能〟は、いくつもの高度なAI技術が組み合わさった結果として実現しています。

ここでは、AIが「写真 → 解説」まで行う裏側の仕組みを、できる限りわかりやすく説明します。

Contens

1 1.OCR（光学文字認識）で問題文・数式・図形を読み取る
- 1.1 ■ OCRが行っていること
2 2.AIが問題を“理解”し、構造を分解する
- 2.1 AIが分類する情報の例
- 2.2 ■ AIは以下のように構造化して理解する
3 3. ChatGPT系のLLMが“解き方（プロセス）”を生成する
4 4. “不正防止設計”により答えだけは返さない仕組みも
5 5. これらの技術を組み合わせると、写真 → 解説が数秒でできる

1.OCR（光学文字認識）で問題文・数式・図形を読み取る

スマホで撮影された問題画像は、まず OCR（Optical Character Recognition） と呼ばれる技術によって文字データに変換されます。

■ OCRが行っていること

手書き文字の認識
教科書のフォントの読み取り
数式の解析（x²、√、∠ABC など）
図形問題の線・角度の抽出
理科・社会の写真や絵の特徴抽出

最新のOCRは「AI-OCR」と呼ばれ、従来のOCRよりも精度が高く、
特に 写真・絵入り問題への対応力が急上昇 しています。

2.AIが問題を“理解”し、構造を分解する

OCRで取り込んだデータは、次に AI分類モデルによって「どんな問題か」を理解されます。

AIが分類する情報の例

算数の文章問題
中学数学の方程式
図形問題（平面 or 空間）
国語の文法・読解
理科・社会の説明文
英語の文法・読解

■ AIは以下のように構造化して理解する

問題文の主語・述語を抽出
図形の頂点・角度・長さの関係を整理
数式の未知数・条件を把握
必要な公式や定理を推定
国語や英語の場合は文構造を解析

つまり、AIは人間のように「問題のパターン」を認識したうえで最適な解法を選んでいます。

3. ChatGPT系のLLMが“解き方（プロセス）”を生成する

問題の種類が確定すると、今度は ChatGPT系の大規模言語モデル（LLM） が解説を作成します。

ここで重要なのは、✨ AIは「答えだけ」ではなく✨ 理由 → 手順 → 結論 の流れで生成している点です。

例：数学の方程式の場合

なぜこの式変形をするのか
どこがポイントなのか
計算手順の順序
最後の答えの意味

国語や英語では

文構造
文法の根拠
説明文の要点抽出

といった「思考過程」が説明されます。

4. “不正防止設計”により答えだけは返さない仕組みも

Googleポリシー・学習アプリの倫理ガイドラインにより多くのアプリは

❌ 答えだけ返す

ことを避けるようになっています。

代わりに、

✔ 解き方のヒント
✔ 手順の詳細
✔ 理由の説明
✔ 関連する考え方

が返されるよう最適化されています。

その結果、暗記ではなく「理解につながる学習」が主流になりつつあります。

5. これらの技術を組み合わせると、写真 → 解説が数秒でできる

まとめると、

AI-OCR：写真から文字・数式・図形・絵を読み取る
分類AI：問題の種類を判定し、構造化
LLM（ChatGPT系）：解き方・説明を生成
不正防止AI：答えだけの出力を防ぐ

この4つの工程が一瞬で行われ、あなたのスマホに「分かりやすい解説」が表示されるわけです。
ただ答えを知るだけでなく、AIの仕組みを理解しながら学習することで、より効率的で深い理解につなげることができます。
私たちもAIの力を活用しつつ、自分なりの学習方法を磨いていきましょう。

まずは、スマホで写真を撮るだけで問題を解説してくれるアプリ 「Uknow AI」 を試してみませんか？
きっと、あなたの学習をぐっと効率的にしてくれますよ。
記事はこちら　↓↓↓
写真で撮るだけ！問題の解き方を教えてくれるAIアプリ｜Uknow AI【最新版】

カテゴリー: 学習アイテム

スマホで撮るだけで問題を解説するAIの仕組み｜OCR×LLMをやさしく説明

1.OCR（光学文字認識）で問題文・数式・図形を読み取る

■ OCRが行っていること

2.AIが問題を“理解”し、構造を分解する

AIが分類する情報の例

■ AIは以下のように構造化して理解する

3. ChatGPT系のLLMが“解き方（プロセス）”を生成する

4. “不正防止設計”により答えだけは返さない仕組みも

5. これらの技術を組み合わせると、写真 → 解説が数秒でできる

Melody Scanner｜音源から楽譜を自動作成するAIアプリ【最新版】

写真・画像からAIが類似問題を作成！「すごい暗記帳」アプリ徹底解説

1.OCR（光学文字認識）で問題文・数式・図形を読み取る

■ OCRが行っていること

2.AIが問題を“理解”し、構造を分解する

AIが分類する情報の例

■ AIは以下のように構造化して理解する

3. ChatGPT系のLLMが“解き方（プロセス）”を生成する

4. “不正防止設計”により答えだけは返さない仕組みも

5. これらの技術を組み合わせると、写真 → 解説 が数秒でできる

Melody Scanner｜音源から楽譜を自動作成するAIアプリ【最新版】

写真・画像からAIが類似問題を作成！「すごい暗記帳」アプリ徹底解説

5. これらの技術を組み合わせると、写真 → 解説が数秒でできる