スマホで撮るだけで問題を解説するAIの仕組み|OCR×LLMをやさしく説明

近年、Uknow AIをはじめとする「写真を撮るだけで問題を解説するAIアプリ」が急速に普及しています。
しかし、この〝魔法のような機能〟は、いくつもの高度なAI技術が組み合わさった結果として実現しています。
ここでは、AIが「写真 → 解説」まで行う裏側の仕組みを、できる限りわかりやすく説明します。
Contens
1.OCR(光学文字認識)で問題文・数式・図形を読み取る
スマホで撮影された問題画像は、まず OCR(Optical Character Recognition) と呼ばれる技術によって文字データに変換されます。
■ OCRが行っていること
- 手書き文字の認識
- 教科書のフォントの読み取り
- 数式の解析(x²、√、∠ABC など)
- 図形問題の線・角度の抽出
- 理科・社会の写真や絵の特徴抽出
最新のOCRは「AI-OCR」と呼ばれ、従来のOCRよりも精度が高く、
特に 写真・絵入り問題への対応力が急上昇 しています。
2.AIが問題を“理解”し、構造を分解する
OCRで取り込んだデータは、次に AI分類モデルによって「どんな問題か」を理解されます。
AIが分類する情報の例
- 算数の文章問題
- 中学数学の方程式
- 図形問題(平面 or 空間)
- 国語の文法・読解
- 理科・社会の説明文
- 英語の文法・読解
■ AIは以下のように構造化して理解する
- 問題文の主語・述語を抽出
- 図形の頂点・角度・長さの関係を整理
- 数式の未知数・条件を把握
- 必要な公式や定理を推定
- 国語や英語の場合は文構造を解析
つまり、AIは人間のように「問題のパターン」を認識したうえで最適な解法を選んでいます。
3. ChatGPT系のLLMが“解き方(プロセス)”を生成する
問題の種類が確定すると、今度は ChatGPT系の大規模言語モデル(LLM) が解説を作成します。
ここで重要なのは、✨ AIは「答えだけ」ではなく✨ 理由 → 手順 → 結論 の流れで生成している点です。
例:数学の方程式の場合
- なぜこの式変形をするのか
- どこがポイントなのか
- 計算手順の順序
- 最後の答えの意味
国語や英語では
- 文構造
- 文法の根拠
- 説明文の要点抽出
といった「思考過程」が説明されます。
4. “不正防止設計”により答えだけは返さない仕組みも
Googleポリシー・学習アプリの倫理ガイドラインにより多くのアプリは
❌ 答えだけ返す
ことを避けるようになっています。
代わりに、
✔ 解き方のヒント
✔ 手順の詳細
✔ 理由の説明
✔ 関連する考え方
が返されるよう最適化されています。
その結果、暗記ではなく「理解につながる学習」が主流になりつつあります。
5. これらの技術を組み合わせると、写真 → 解説 が数秒でできる
まとめると、
- AI-OCR:写真から文字・数式・図形・絵を読み取る
- 分類AI:問題の種類を判定し、構造化
- LLM(ChatGPT系):解き方・説明を生成
- 不正防止AI:答えだけの出力を防ぐ
この4つの工程が一瞬で行われ、あなたのスマホに「分かりやすい解説」が表示されるわけです。
ただ答えを知るだけでなく、AIの仕組みを理解しながら学習することで、より効率的で深い理解につなげることができます。
私たちもAIの力を活用しつつ、自分なりの学習方法を磨いていきましょう。
まずは、スマホで写真を撮るだけで問題を解説してくれるアプリ 「Uknow AI」 を試してみませんか?
きっと、あなたの学習をぐっと効率的にしてくれますよ。
記事はこちら ↓↓↓
写真で撮るだけ!問題の解き方を教えてくれるAIアプリ|Uknow AI【最新版】

