ファイル添付・画像入力・Canvas・音声モードの活用
このモジュールで学ぶこと
- ファイル添付(PDF・Excel・Word)の使い方と限界
- 画像入力でできること(図表読み取り・スクショ解析)
- Canvas の長文・コード編集ワークフロー
- 音声モードの業務シナリオ
学習目標
- 業務文書を添付して要約・抽出・分析を依頼できる
- 画像の中の情報をChatGPTに読み取らせて活用できる
- Canvas で長文・コードを効率的に編集できる
- 音声モードを使う場面を判別できる
目次
セクション1: ファイル添付の基本
ChatGPTは入力欄の「+」ボタンから、以下のファイル形式を添付できる。
| 形式 | 主な用途 |
|---|---|
| 契約書・論文・社内資料の要約 | |
| Word(.docx) | 文書の校正・章立て見直し |
| Excel(.xlsx)・CSV | 表データの集計・傾向分析 |
| テキスト(.txt・.md) | 既存ドキュメントの再構成 |
| プレゼン(.pptx) | スライド構成のレビュー |
| 画像(PNG・JPG) | 画像内容の読み取り |
| 音声(MP3など) | 文字起こし・要約 |
添付の基本フロー
- 入力欄の「+」をクリック
- ファイルを選択
- アップロード完了を待つ
- プロンプトに 何をしてほしいか を書いて送信
「ファイルを添付しただけ」では何もしてくれない。必ず動詞を含む指示を添える。
効果的な指示の例
添付した契約書(PDF)について、以下の観点で整理してください。
1. 自動更新の有無と更新条件
2. 解約予告の期間
3. 違約金の発生条件
4. 個人情報の取り扱い
出力形式: 上記4観点ごとに、該当箇所の引用 + 解説をMarkdownで。
要約だけでなく 観点別に抽出する 指示が業務では効く。
ファイル添付の限界
- 巨大ファイル(数百MB級)は処理しきれない場合がある
- 機密情報・個人情報を含むファイルは社内ポリシーに従う
- スキャン画像のPDFは精度が落ちる場合がある(OCR品質依存)
セクション2: 画像入力の活用
ChatGPTのVisionは画像内の文字・図表・写真の内容を読み取れる。
業務での活用例
| 用途 | 具体例 |
|---|---|
| 図表の言語化 | 競合分析の図 → 文章で要約 |
| スクショの解説 | エラー画面 → 原因と対処を提案 |
| 手書きメモのデジタル化 | ホワイトボード写真 → 議事録化 |
| 製品画像の比較 | 2枚並べて違いを指摘 |
| 名刺・領収書 | 情報抽出と一覧化 |
効果的な依頼例
(画像を添付)
この画像は当社の組織図です。
以下の観点で分析してください。
1. レポートラインの階層数
2. 各部門の規模感(人数の偏り)
3. 意思決定が遅くなりそうな構造上の弱点
注意: 個人名は伏字(A氏・B氏)にして言及してください。
「これ何?」ではなく 観点を与えて分析させる のが正解だ。
注意点
- 顧客情報・社員個人情報が映り込んだ画像は社内ガイドラインに従う
- 文字の小さい画像はOCR精度が落ちる
- 機密性の高い情報を含む図表は社外漏洩リスクを意識する
セクション3: Canvas の編集ワークフロー
Canvas は 長文・コードを横にエディタで開いて編集 できる機能だ。通常チャットだと「やり直し」が全文再生成になるが、Canvas なら部分編集ができる。
Canvas を開く
- プロンプトで「Canvasで書いてください」と依頼
- 既存応答の右上にあるアイコンから「Open in canvas」をクリック
使い分けの目安
| 場面 | 通常チャット | Canvas |
|---|---|---|
| 短文の確認 | 〇 | × |
| 100字程度の修正 | 〇 | △ |
| 1,000字以上の文書編集 | × | 〇 |
| 段落単位の差替え | × | 〇 |
| コードの部分修正 | × | 〇 |
| 複数ファイルの並行編集 | × | △ |
Canvas での部分編集
Canvas 上では、修正したい段落を選択して「ここを〇〇に変えて」と指示できる。全文を再生成せず、 指定箇所のみが差し替わる。
これにより、長文の 8割は気に入っているが残り2割を直したい という場面の作業効率が大幅に上がる。
セクション4: 音声モードの使い所
音声モード(Voice Mode)は、ChatGPTと 音声で対話 する機能だ。
出典: Wikipedia "ChatGPT" Voice Mode(取得日: 2026-05-20・URL: https://en.wikipedia.org/wiki/ChatGPT )
業務での使い所
- 移動中・運転中・運動中の情報整理
- 議事録の口頭振り返り
- 会議前の論点リハーサル
- 英語のスピーキング練習
使わない方がよい場面
- オフィスの周囲に人がいる場合(音漏れ)
- 機密情報を扱う場合
- 正確な引用が必要な場合(音声は誤認識リスクあり)
キーボード入力と使い分け
「考える時間が欲しい」ときは音声、「正確な指示を入れたい」ときはキーボードが向く。 どちらが優れているかではなく、場面で使い分ける のが基本姿勢だ。
セクション5: 複合シナリオ
実務では複数の機能を組み合わせる場面が多い。代表シナリオを3つ示す。
シナリオ1: 議事録作成
- 会議の録音ファイル(MP3)を添付
- 「文字起こしして、議題ごとに整理してください」と指示
- 出力をCanvasで開き、 誤認識を修正
- 「最終議事録としてMarkdownで仕上げてください」と再依頼
シナリオ2: 競合資料の比較
- 競合A社・B社・C社のPDFを3つ添付
- 「3社を価格・機能・対象規模で比較するMarkdownテーブルを作ってください」
- Canvas で開いて部分編集(自社目線の評価コメント追加)
- 「経営会議用のサマリーを300字で」と短縮依頼
シナリオ3: 製品エラー画面の対処
- エラー画面のスクショを添付
- 「このエラーの考えられる原因と、ユーザー側で試せる対処を3つ」
- 「同じ症状が再発しないための設定変更も提案してください」
これらをテンプレ化しておくと、同じシナリオで毎回ゼロから組み直す必要がなくなる。
まとめ
- ファイル添付は 観点を与えて抽出させる 指示が効く
- 画像入力は図表・スクショ・手書きメモを言語化できる
- Canvas は長文・コードの部分編集で効率が大幅に上がる
- 音声モードは移動中・口頭リハーサルで使う
- 業務では複数機能を組み合わせるシナリオをテンプレ化する
次のモジュールでは Custom GPTs を作って、自分専用のChatGPTを設計する。