TTSで音声学習をしようとする際、高品質な音声データが必要となりますが、BGMやノイズが入っていたりして、なかなか適切な素材を用意することは大変です。Audacityを使用すれば、完璧ではありませんが、ある程度のノイズは簡単に取り除いてくれます。この記事では、Audacityの標準機能と、AIプラグインのOpenVINOを使ったら、ノイズ除去の方法について解説します。
Audacity単体でノイズ除去する方法
Muse Hubを使用しないAudacityのインストール方法、ノイズを除去する方法、追加のエフェクト処理について解説します。
Audacityとは
「Audacity」は、無料かつオープンソースの、音声編集アプリです。
録音から波形編集、エフェクト加工まで、一通りのことができます。
2000年に公開されて以降、オープンソースコミュニティ主導で開発が進められてきましたが、2021年にキプロスを拠点とするMuse Groupに買収されました。
その際に、アプリの使用状況(テレメトリ)を収集する方針としたことで、以前からのユーザーと揉めましたが、最終的にオプトイン形式となりました。
現在でもオープンソースの開発体制が継続されています。
Audacityのインストール
Windows PCにAudacityをインストールする方法をご案内します。
ダウンロード
Audacity公式サイトの、トップ画面からアプリをダウンロードすると、「Muse Hub」というMuse Groupの統合管理ツールが一緒にインストールされます。
Muse Hubが不要な場合は、画面上部の「Downloads」をクリックします。
「Windows」をクリックします。
一番上はMuse Hubと一緒のものなので、その下のインストーラーかZipファイルを選択します。
今回は、Zipファイルとしました。
初回起動
ダウンロードしたZipファイルを展開すれば、そのまま使えます。
「Audacity.exe」をダブルクリックして実行します。

拡張子「.aup3」の関連付けについて聞かれます。
これは「はい」を選択したほうが良いでしょう。
これが、使用状況の収集の確認です。
オプトアプトするには「UUIDを無効化」をクリックします。
毎回お知らせ画面が表示されるので、「次回からは起動時に表示しない」のチェックは入れたほうが良いでしょう。
このような画面となれば完了です。
ノイズ除去する方法
Audacityの基本機能を使って、ノイズを除去する方法をご案内します。
音声ファイルの読み込み
「ファイル」-「開く」から、音声ファイルを読み込みます。
今回は、ラジオのような、BGMを流しながら一人で喋っている音源を使用しています。
カットなどの基本的な編集方法については、割愛させていただきます。
ノイズプロファイルの取得
まず、ノイズだけの部分(ここでは、喋っていなくてBGMだけの部分)を範囲選択します。
「エフェクト」-「ノイズ除去と修復」-「ノイズを軽減」をクリックします。
「ノイズプロファイルを取得」をクリックします。

ノイズ除去の実行
「Ctrl+A」で、オーディオ全体を選択した後、同じ画面を開きます。
パラメーターを調整します。
- ノイズ低減: 12
- 感度: 6
- 周波数平滑化: 3
程度が良いようです。

結果は、「完璧ではないが、軽減はされた」という感じです。
特に、話し声の裏で流れているBGMの除去は難しいようです。
ハイパスフィルター/ローパスフィルター
追加の処理として、人間の声の周波数帯以外をカットすることで、ノイズが軽減されることがあります。
「エフェクト」-「Dominic Mazzoni」-「ハイパスフィルター/ローパスフィルター」をクリックします。
- ハイパスフィルター: 100Hz
- ローパスフィルター: 4,000Hz
で「適用」します。
コンプレッサー
さらに「コンプレッサー」を適用すると、聞きやすくなることがあります。
「エフェクト」-「音量と圧縮」-「コンプレッサー」をクリックします。
パラメーターは、初期設定のままでも、概ね大丈夫なようです。
AudacityのOpenVINOプラグインでノイズ除去する方法
AIツールOpenVINOを使った、BGMとボーカルの分離、ノイズ軽減処理について解説します。
OpenVINOとは
「OpenVINO」(Open Visual Inference and Neural network Optimization)とは、Intelが開発したAIツールキットです。
画像や音声を、リアルタイムかつ高速にAI処理することができます。
Audacityは、OpenVINOを使用して、以下の機能を持つプラグインを提供しています。
- 高音質化
- 音楽生成
- 文字起こし
- ノイズ軽減
- ボーカルと楽器パートの分離
ここでは、「ノイズ軽減」と「ボーカルと楽器パートの分離」機能の使い方をご紹介します。
OpenVINOプラグインのインストール
Audacityの「エフェクト」-「AIエフェクトを取得」をクリックします。
ブラウザでダウンロードページが開くので、「Download OpenVINO AI Plugins」をクリックします。
ダウンロードしたファイル(audacity-win-v3.7.1-R4.2-64bit-OpenVINO-AI-Plugins.exe)を実行します。
利用規約を確認し、「Next」をクリックします。
インストール先を確認し、「Next」をクリックします。
Audacityのフォルダを、自動検知してくれました。(Zipファイルを展開しただけなのに、なぜ分かったのでしょうか)
インストールするモデルを選択します。
「Noise Suppression(ノイズ軽減)」のモデル「noise-suppression-denseunet-II-0001」にデフォルトでチェックが入っていなかったので、一応入れておくことをおすすめします。
「Install」をクリックします。
「Finish」をクリックします。
ここで、Audacityアプリを開いたままだった場合は、一度閉じて、再起動します。
再起動しないと、次のモジュール画面に出てこないようです。
「編集」-「環境設定」をクリックします。
「モジュール」から「mod-openvino」を「有効」に変更し、「OK」をクリックします。
OKとした後、もう一度Audacityの再起動が必要です。
再起動後に、OpenVINOプラグインを使用できるようになります。
ノイズ除去する方法
OpenVINOプラグインを使い、BGMとノイズを除去する方法をご案内します。
3つのモデルでノイズ除去
Audacityの標準機能とは異なり、ノイズプロファイルの取得は必要ありません。
「Ctrl+A」で全選択した後、「エフェクト」-「OpenVINO AI Effects」-「OpenVINO Noise Suppression」をクリックします。
モデルが3つインストールされているので、どれかを選びます。
deepfilternet2
今回使用している音源は、声が高めの女性の話し声なのですが、deepfilternet2では高音部分が歪んでしまいました。
deepfilternet3
deepfilternet3は、より強力にノイズを除去することができますが、波形を見ると分かる通り、ほとんどの声が消されてしまいました。
noise-suppression-denseunet-II-0001
noise-suppression-denseunet-II-0001では、さらに強力に、声がかき消されてしまいました。
話し声とBGMを分離
今回の音源は、歌ではなく、BGMを流しながら喋っているだけなのですが、ボーカルと楽器を分離する機能を使用してみたいと思います。
「エフェクト」-「OpenVINO AI Effects」-「OpenVINO Music Separation」をクリックします。
楽器のパート分けは不要なので、「(2 Stem)Instrumental, Vocals」を選択します。
かすかにではありますが、BGMが分離されました。
こちらのパートは使用しないので、「✕」で閉じておきます。
パラメータの調整
あらためて、Noise Suppressionを実行します。
いろいろ試した結果、今回は、
- モデル: deepfilternet3
- Attenuation Limit: 12
がいい感じとなりました。
数字によって、かなり劇的に結果が変わるので、調整は必須になるかと思います。
文字起こしもできる
余談ではありますが、「解析」-「OpenVINO Whisper Transcription」から文字起こしをすることもできます。
ただし、文字起こししたデータをエクスポートできないようなので、以前ご紹介したObsidianを使ったやり方の方が、汎用性は高いと思います。
-
WhisperとObsidianを使ってWindowsローカルで文字起こしする方法
会議の音声データを文字起こししたいためだけにYouTubeに機密情報をアップし、情報漏洩に繋がったという事故が確認されています。それは論外だとしても、クラウドサービスに機密情報や個人情報を預けることは ...
まとめ Audacityを使ったノイズ除去とは
Audacityは、無料で使える音声編集アプリです。
標準機能で、ある程度のノイズ除去をすることができます。
OpenVINOプラグインを使えば、より簡単に、BGMやノイズを除去することができるようになります。
どちらの方法も完璧ではありませんが、実用的には十分かと思います。
これにより、より正確な文字起こしをしたり、TTSモデルの学習用素材に活用したりすることができます。
-
5秒の音声データからAI音声を生成できるGPT-SoVITSの使い方
2025/5/30 AivisSpeech, AI彼女, AI彼氏, TTS
GPT-SoVITSは、数秒程度の音声サンプルから、似た声の音声を生成できるTTSです。これにより、自分の声や、好きな声を使って、AIボイスを簡単に生成することができます。この記事では、Windows ...