最終更新:2026年6月 · 対応環境:PC・Mac・スマートフォン
「YouTubeの動画をそのままテキストで保存したい」「文字起こし(もじおこし)してChatGPTに貼りたい」——その方法を探しているなら、このページで解決します。YouTubeには動画のトランスクリプト(字幕テキスト)を表示・保存する機能がありますが、使い方がわかりにくく、ファイルとして直接ダウンロードするボタンがありません。この記事では、無料で使える3つのやり方を実際の手順つきで解説します。
最速で文字起こしを取得するには、GistAIのYouTubeテキスト化ツールにURLを貼るだけ。TXT(プレーンテキスト)またはSRT(タイムスタンプ付き)で即ダウンロード。登録不要・完全無料。
動画全体の音声をテキスト化したもの。タイムスタンプなしのプレーンテキストとして扱うことが多い。ChatGPTへの貼り付け・要約・翻訳・学習ノート作成に最適。
テキストにタイムスタンプが付いた形式。動画編集ソフト(Premiere・DaVinci Resolve・CapCut)やVLCへの読み込みに使う。
どちらも同じ字幕データから取得できます。GistAIのツールであれば、TXTとSRTを選んでダウンロード可能です。
最も手軽で、ファイルとして保存できる唯一の方法がオンラインツールです。インストール不要、ブラウザだけで完結します。スマートフォン(iPhone・Android)でも同様に使えます。
PCのブラウザならアドレスバーからコピー。スマートフォンのYouTubeアプリなら「共有」→「リンクをコピー」で取得できます。
GistAIの字幕・文字起こしツールを開き、入力欄にURLを貼り付けて「取得」ボタンを押します。数秒で字幕データが読み込まれます。
利用可能な字幕言語が一覧表示されます。「TXTダウンロード」でプレーンテキスト(ChatGPT向け)、「SRTダウンロード」でタイムスタンプ付きファイル(編集ソフト向け)を保存できます。
YouTubeのPC版ブラウザには、動画のトランスクリプト(文字起こしテキスト)をそのまま表示できる機能があります。ファイルとしてダウンロードはできませんが、テキストをコピーして貼り付けるだけなら十分です。
注意点:タイムスタンプとテキストが混在してコピーされる場合があります。ChatGPTに貼り付けるだけなら問題ありませんが、整形が必要な場合はやり方①のオンラインツールのほうが便利です。スマートフォンのYouTubeアプリではこの機能にアクセスしにくいため、ブラウザからYouTubeを開く必要があります。
ChromeやFirefoxの拡張機能を追加すると、YouTube動画ページに直接「文字起こしダウンロード」ボタンが表示されるようになります。頻繁に多くの動画を処理する場合に向いています。
ただし、拡張機能には注意点があります:
拡張機能を使う場合は、ダウンロード数が多くレビューが新しいものを選び、要求する権限を必ず確認してください。
| 形式 | 内容 | 向いている用途 |
|---|---|---|
| TXT | プレーンテキストのみ | ChatGPT・翻訳・ノート作成・Google Docs |
| SRT | テキスト+タイムスタンプ | Premiere・DaVinci Resolve・Final Cut・VLC |
| VTT | テキスト+タイムスタンプ(ウェブ向け) | HTMLビデオプレイヤー・eラーニングプラットフォーム |
ChatGPTで要約・翻訳・分析する目的ならTXTを選んでください。SRTのタイムスタンプはAIにとってノイズになります(ただし「1分ごとに要約して」などのタスクでは逆に役立ちます)。
動画のオーナーが字幕を無効にしている、動画が非公開または限定公開、あるいは自動字幕がまだ生成されていない(アップロードから数時間以内の新着動画)可能性があります。字幕がない動画では、いずれの方法でも文字起こしを取得することはできません。
GistAIのツールでは、利用可能な字幕言語がドロップダウンリストで選択できます。「日本語」または「日本語(自動生成)」を選んでダウンロードしてください。
YouTubeアプリではなく、ブラウザ(Safari・Chrome)からGistAIのツールページを開いてください。YouTubeアプリのURLを「共有→リンクをコピー」で取得してから、ブラウザ側のGistAIツールに貼り付けると動作します。
字幕・トランスクリプトそのものは動画コンテンツの一部であり、著作権は動画のオーナーに帰属します。個人的な学習・研究・翻訳目的での利用は一般的に私的複製の範囲とされますが、取得したテキストをそのまま公開・転載・商用利用する場合は権利者の許可が必要です。
Googleの音声認識技術は日本語・英語・韓国語・スペイン語など主要言語では高い精度を持ちますが、固有名詞・専門用語・方言・音質の悪い環境では誤認識が起きることがあります。重要な引用に使う場合は必ず元の音声と照合してください。
はい。TXTで取得した文字起こしはそのままChatGPTに貼り付けられます。ただし、GPT-4の入力トークン上限(約128,000トークン)を超える場合は分割して入力してください。1時間の動画のトランスクリプトで概ね10,000〜20,000トークン程度です。
YouTubeが自動字幕を生成していない動画(例:アップロードしたばかりの動画、音楽のみの動画、プライベート動画)では、GistAIツールを含めいずれの方法でも字幕・文字起こしは取得できません。独自の文字起こしが必要な場合は、OpenAIのWhisperなどのAI音声認識ツールを使ってください。
YouTubeのリンクをGistAI Appに共有するだけ——字幕・文字起こしを自動取得し、デバイス内のAIが即座に日本語で要約します。サーバーにデータを送らず、オフラインでも動作。
💡 SRTファイルのエクスポートが必要な場合は上のウェブツールをご利用ください。アプリはトランスクリプトの閲覧・共有・AI要約に特化しています。
Google Playで入手GistAI