Googleが開発しているNotebookLMは、pdfやYouTubeのリンクなどをソースとして、AIを活用して情報を自動的に整理することができるツールです。YouTubeの文字起こしデータを取り込むこともできるので、動画ではなく、テキストとして情報を保存することもできます。逆にそこから、ポッドキャスト風の会話データとしてまとめなおす機能も追加されました。この記事では、実際にYouTubeの動画を取り込み、どのように文字起こしされ、まとめることができるのかをご紹介しています。
NotebookLMでYouTube動画から文字起こしする方法
NotebookLMの文字起こしで、自動翻訳された日本語で利用する方法、元言語のまま利用する方法をご紹介します。
NotebookLMとは
「NotebookLM」とは、Googleが提供している、AIノートアプリです。
アップロードしたファイルや、外部リンクなどを「ソース」として、AIとチャットをしながら情報を整理することができます。
基本は無料で利用できますが、ノート数や、1日あたりのチャットリクエスト数に制限があります。
「NotebookLM Plus」を利用すると、制限が緩和され、より高度なモデルも使用できるようになります。
「NotebookLM PLUS」は、「Google One」や「Google Workspace」のプランに含まれています。
文字起こしは簡単だが、英語が日本語翻訳されてしまう
NotebookLMは、YouTubeで公開されている動画もソースとして利用することができます。
そこから文字起こしすることも簡単なのですが、現状、英語の動画なのに、勝手に日本語に翻訳されてしまうという問題があります。
ここでは、Googleが2024年8月に行った基調講演の動画を例として、簡単に使い方と注意点をご説明します。
NotebookLMのサイトにアクセスし、初めての場合は、「NotebookLMを試す」をクリックします。
「ノートブックを新規作成」をクリックします。
ソースとして「YouTube」を選択します。
YouTUbeのURLを入力し、「挿入」をクリックします。
動画が挿入されると、すぐに日本語で概要が表示されます。
ソースファイルの方をクリックすると、文字起こしされた内容を確認できます。
NotebookLMが、このタイミングで文字起こしをしているのではなく、既にYouTubeが文字起こししたデータを読み込んでいるだけです。
元動画は英語なのですが、日本語に翻訳された文字起こしデータが読み込まれています。
日本語に翻訳するのであれば、手間が省けたというところですが、英語の原文を確認したい時に困ったことになります。
それで、何とか英語データを読み込もうと、いろいろ試したのですが、頑なに日本語データを読み込んできます。
方法が無いわけではないと思うのですが、そこまで手間をかけるのはどうなのかということで、諦めました。
今後のアップデートで選択できるようになるのではないかと期待しています。
英語を英語のまま文字起こしするなら
文字起こしは既にYouTubeが行っているので、それを表示する外部ツールはたくさん公開されています。
それらを使えば、英語の文字起こしデータをダウンロードすることもできます。
ここでは、Webサービスの「https://www.youtube-transcript.io/」をご紹介します。
サイトにアクセスし、YouTubeのURLを入力し、「Extract transcript」をクリックします。
右上の言語選択で「auto-generated」を選択すれば、元言語(ここでは英語)の文字起こし内容を確認できます。
「⋮」から、テキストファイルとしてダウンロードすることもできます。
メモ帳で開くとこんな感じです。
タイムスタンプを除くこともできますが、改行位置は変わりませんでした。
これをソースとして、NotebookLMに読み込むこともできます。
ただし内容を分析した時の精度は、YouTubeを直接読み込んだものの方が良かったので、以下の説明ではそちらの方を使っています。
NotebookLMで文字起こしした内容をまとめる方法
文字起こしされたテキストデータを使って、NotebookLMで何ができるのかと、最近追加された音声概要と注意点について解説します。
チャット・メモ
文字起こしされた内容に対し、チャットで指示をすることができます。
「要約してください」と指示したところ、以下のようになりました。
チャットは、リロードすると消えてしまいます。
「メモに保存」をクリックすれば、履歴として残すことができます。
要約・ブリーフィング
チャットで指示しなくても、右の「ブリーフィング・ドキュメント」をクリックすれば、内容をきれいにまとめてくれます。
プロンプトが調整されているのか、こちらの方がはるかに正確でした。
時系列・タイムライン
「タイムライン」をクリックすれば、時系列でのイベントや、登場人物をまとめてくれます。
これは、今回のような基調講演をまとめるには、とても便利だと思います。
よくある質問・FAQ
「よくある質問」では、ポイントとなる事項を、質問と回答形式でまとめてくれます。
学習ガイド・クイズ
「学習ガイド」では、内容の理解度テストを自動生成してくれます。
学校の先生などには便利な機能です。
(逆に生徒側もAIで回答を探せるということになりますが)
マインドマップ
「マインドマップ」を自動生成することもできます。
今回のような基調講演では、内容を視覚的に整理するのに役立ちます。
さらのノードをクリックすると、追加の議論が、チャットで自動生成されます。
音声概要・ポッドキャスト
「音声概要」では、ポッドキャスト風に、二人がこのソースをテーマにして議論するという形で、音声ファイルを生成してくれます。
利用するには、音声概要の「生成」をクリックします。
元動画は1時間20分ありますが、それが7分の音声にまとめられました。
wavファイルとしてダウンロードすることもできます。
それに、ChatGPTで生成した1枚画像をあわせ、「Shotcut」でmp4に変換したものがこちらです。(wavファイルのままではXにアップロードできないため)
Googleの2024年基調講演の動画(1時間20分)を、NotebookLMの音声概要機能で、7分のポッドキャスト風音声にまとめたものです。
— VPN大全 (@vpn_taizen) May 2, 2025
ダウンロードしたwavファイルに、ChatGPTで生成した1枚画像をあわせ、mp4に変換しました。 pic.twitter.com/VBPB3Ee3d9
こんなものが、簡単に作成できてしまうというのは、驚くばかりです。
全工程で15分程度です。
音声概要の注意点
音声概要機能は、数日前に日本語対応され、Xを中心に大きな話題となっています。
「分かりやすい」という声が多いのですが、私は、分かりやすいのではなく、「思考停止」しているだけであり、危険だと思っています。
今までご紹介した「ブリーフィング」「タイムライン」「よくある質問」「学習ガイド」「マインドマップ」「音声概要」は全て、同じソースを別の角度からまとめなおしているだけです。
外部の情報や意見は取り入れられていません。
情報量は変わっていないのですが、会話風になると、無条件に信じてしまいがちになるのです。
例えば、
この料理おいしいですか?
と聞かれたら、「うーん、どうだろう?」と自分で考えることになると思います。
ところが、自分に話しかけられず、
この料理おいしいね!
うん、めっちゃおいしい!
という会話を、外から聞いているだけだと、(そうなんだ)と根拠もなく納得してしまいます。
これは、詐欺やネットワークビジネスの現場で、実際に使われているテクニックでもあります。
私がこれを強く警告しているのは、AIは決して中立ではなく、思想誘導のツールとして、実際に使われ始めているためです。
今後、「音声概要」を利用した動画ファイルが乱立してくると思いますが、掛け合い形式になっている時点で、騙されるかもしれないという危機感を持つ必要があると思います。
まとめ NotebookLMでYouTubeの情報をまとめる方法
NotebookLMを使えば、YouTubeのリンクを貼るだけで、簡単に文字起こしすることができます。
自動的に翻訳されるので、言語の壁も心配ありません。
要約したり、時系列にしたり、さらには会話風の音声を自動生成したりと、様々な角度から情報を整理することができます。
長い動画を見る必要がなくなり、テキストで情報収集することができるので、効率が跳ね上がります。
思想誘導の話はともかくとして、かなり強力なツールだと思います。
