ファイル添付・画像入力・Canvas・音声モードの活用

20分初級〜中級

このモジュールで学ぶこと

  • ファイル添付(PDF・Excel・Word)の使い方と限界
  • 画像入力でできること(図表読み取り・スクショ解析)
  • Canvas の長文・コード編集ワークフロー
  • 音声モードの業務シナリオ

学習目標

  • 業務文書を添付して要約・抽出・分析を依頼できる
  • 画像の中の情報をChatGPTに読み取らせて活用できる
  • Canvas で長文・コードを効率的に編集できる
  • 音声モードを使う場面を判別できる

目次


セクション1: ファイル添付の基本

ChatGPTは入力欄の「+」ボタンから、以下のファイル形式を添付できる。

形式主な用途
PDF契約書・論文・社内資料の要約
Word(.docx)文書の校正・章立て見直し
Excel(.xlsx)・CSV表データの集計・傾向分析
テキスト(.txt・.md)既存ドキュメントの再構成
プレゼン(.pptx)スライド構成のレビュー
画像(PNG・JPG)画像内容の読み取り
音声(MP3など)文字起こし・要約

添付の基本フロー

  1. 入力欄の「+」をクリック
  2. ファイルを選択
  3. アップロード完了を待つ
  4. プロンプトに 何をしてほしいか を書いて送信

「ファイルを添付しただけ」では何もしてくれない。必ず動詞を含む指示を添える。

効果的な指示の例

添付した契約書(PDF)について、以下の観点で整理してください。

1. 自動更新の有無と更新条件
2. 解約予告の期間
3. 違約金の発生条件
4. 個人情報の取り扱い

出力形式: 上記4観点ごとに、該当箇所の引用 + 解説をMarkdownで。

要約だけでなく 観点別に抽出する 指示が業務では効く。

ファイル添付の限界

  • 巨大ファイル(数百MB級)は処理しきれない場合がある
  • 機密情報・個人情報を含むファイルは社内ポリシーに従う
  • スキャン画像のPDFは精度が落ちる場合がある(OCR品質依存)

セクション2: 画像入力の活用

ChatGPTのVisionは画像内の文字・図表・写真の内容を読み取れる。

業務での活用例

用途具体例
図表の言語化競合分析の図 → 文章で要約
スクショの解説エラー画面 → 原因と対処を提案
手書きメモのデジタル化ホワイトボード写真 → 議事録化
製品画像の比較2枚並べて違いを指摘
名刺・領収書情報抽出と一覧化

効果的な依頼例

(画像を添付)

この画像は当社の組織図です。
以下の観点で分析してください。

1. レポートラインの階層数
2. 各部門の規模感(人数の偏り)
3. 意思決定が遅くなりそうな構造上の弱点

注意: 個人名は伏字(A氏・B氏)にして言及してください。

「これ何?」ではなく 観点を与えて分析させる のが正解だ。

注意点

  • 顧客情報・社員個人情報が映り込んだ画像は社内ガイドラインに従う
  • 文字の小さい画像はOCR精度が落ちる
  • 機密性の高い情報を含む図表は社外漏洩リスクを意識する

セクション3: Canvas の編集ワークフロー

Canvas は 長文・コードを横にエディタで開いて編集 できる機能だ。通常チャットだと「やり直し」が全文再生成になるが、Canvas なら部分編集ができる。

Canvas を開く

  • プロンプトで「Canvasで書いてください」と依頼
  • 既存応答の右上にあるアイコンから「Open in canvas」をクリック

使い分けの目安

場面通常チャットCanvas
短文の確認×
100字程度の修正
1,000字以上の文書編集×
段落単位の差替え×
コードの部分修正×
複数ファイルの並行編集×

Canvas での部分編集

Canvas 上では、修正したい段落を選択して「ここを〇〇に変えて」と指示できる。全文を再生成せず、 指定箇所のみが差し替わる

これにより、長文の 8割は気に入っているが残り2割を直したい という場面の作業効率が大幅に上がる。


セクション4: 音声モードの使い所

音声モード(Voice Mode)は、ChatGPTと 音声で対話 する機能だ。

出典: Wikipedia "ChatGPT" Voice Mode(取得日: 2026-05-20・URL: https://en.wikipedia.org/wiki/ChatGPT

業務での使い所

  • 移動中・運転中・運動中の情報整理
  • 議事録の口頭振り返り
  • 会議前の論点リハーサル
  • 英語のスピーキング練習

使わない方がよい場面

  • オフィスの周囲に人がいる場合(音漏れ)
  • 機密情報を扱う場合
  • 正確な引用が必要な場合(音声は誤認識リスクあり)

キーボード入力と使い分け

「考える時間が欲しい」ときは音声、「正確な指示を入れたい」ときはキーボードが向く。 どちらが優れているかではなく、場面で使い分ける のが基本姿勢だ。


セクション5: 複合シナリオ

実務では複数の機能を組み合わせる場面が多い。代表シナリオを3つ示す。

シナリオ1: 議事録作成

  1. 会議の録音ファイル(MP3)を添付
  2. 「文字起こしして、議題ごとに整理してください」と指示
  3. 出力をCanvasで開き、 誤認識を修正
  4. 「最終議事録としてMarkdownで仕上げてください」と再依頼

シナリオ2: 競合資料の比較

  1. 競合A社・B社・C社のPDFを3つ添付
  2. 「3社を価格・機能・対象規模で比較するMarkdownテーブルを作ってください」
  3. Canvas で開いて部分編集(自社目線の評価コメント追加)
  4. 「経営会議用のサマリーを300字で」と短縮依頼

シナリオ3: 製品エラー画面の対処

  1. エラー画面のスクショを添付
  2. 「このエラーの考えられる原因と、ユーザー側で試せる対処を3つ」
  3. 「同じ症状が再発しないための設定変更も提案してください」

これらをテンプレ化しておくと、同じシナリオで毎回ゼロから組み直す必要がなくなる。


まとめ

  • ファイル添付は 観点を与えて抽出させる 指示が効く
  • 画像入力は図表・スクショ・手書きメモを言語化できる
  • Canvas は長文・コードの部分編集で効率が大幅に上がる
  • 音声モードは移動中・口頭リハーサルで使う
  • 業務では複数機能を組み合わせるシナリオをテンプレ化する

次のモジュールでは Custom GPTs を作って、自分専用のChatGPTを設計する。

次の一歩のヒントを LINE で受け取る

進路・キャリア・働き方の最新情報や学習教材を、LINE でゆるく届けます。

LINE で友だち追加

このページをブックマークしておこう

進路に迷ったらいつでも戻ってこられるよう、ホーム画面に追加 or ブックマークしておくと便利。

学習教材一覧を見る
ProjectsArticlesCoursesContact