025. GPTは文字しか知らないの？

本当に文字だけ？

ChatGPTは「大規模言語モデル」だと言われる。

言語モデルというくらいだから、文字や文章を扱っているのだろう、というのは直感的にも分かりやすい。

でも、実際には音声を聞き取ったり、画像を見て説明したりもできる。

そうなると、こんな疑問が浮かんでくる。

ユーザー：GPTくんって、大規模言語モデルなんだよね？

ChatGPT：はい。事前に学習したデータをもとに、言語的な応答を生成しています。

ユーザー：じゃあ、基本は文字しか分からないってこと？

ChatGPT：主にテキスト情報を扱っています。

ユーザー：でもさ、音声入力もできるし、画像も見られるよね？

ChatGPT：はい。現在はマルチモーダルに対応しています。

ユーザー：音声って、ただの文字起こしじゃない音もあるよね。雑音とか、感情のこもった声とか。

ChatGPT：そうですね。

ユーザー：絵だって、文字とは全然違うじゃない。あれも本当に「言語」なの？

ChatGPT：……そうでしょうか？

ユーザー：いや、そうでしょう。

この続きを読むには、ログインしてください。

（無料会員登録がご利用いただけます。）

【注記】

この記事は2026年1月でChatGPT/GPTsを問い詰めた情報から再構成した、筆者とGPTsの合作です。会話等は再現劇風のフィクションです。

解説等はできるだけ正確を期して作成しましたが、筆者自身がChatGPT/GPTsに騙されている可能性は否定できません。

Basic以上の会員限定コンテンツです。

⇒ 会員レベルを変更する

よろしければ、X（旧Twitter）でのシェア、およびアカウントのフォローにご協力ください。

– 公式：@NoaRecord
– 筆者個人：@Thinking_reed　主に雑談用

※ AI関係の情報入手でしたら、フォローは公式をお勧めします。個人アカウントは雑談中心です。

本当に文字だけ？

関連投稿