ObsidianにAI画像認識やOCRプラグインを追加して検索強化する方法

2025年6月26日

このページには広告が含まれています

Obsidianはテキスト以外のファイルを扱うこともできますが、検索に対応していません。しかし複数のプラグインを組み合わせれば、PDFの中身や、画像検索をすることも可能となります。この記事では、Obsidianのプラグインである「Omnisearch」「Text Extractor」「AI Image Analyzer」の使い方と注意点について解説します。

Obsidianと検索強化/OCR/AI画像認識プラグイン

Obsidian、Omnisearch、Text Extractor、AI Image Analyzerの概要をご紹介します。

Obsidianとは

「Obsidian」とは、ローカル環境で動作するノートアプリです。

全てのノートはMarkdown（.md）形式のテキストファイルとして保存され、Wikiのように双方向でリンクを張ることができます。

コミュニティによるプラグイン開発が盛んで、AI連携も容易であることから、人気が高まっています。

フォルダ管理が容易

私がObsidianで気に入っている点は、システムのフォルダ構造がそのまま引き継がれるという点です。

例えば、以下のような画像フォルダがあったとします。

それをそのままObsidianの保管庫フォルダに移動すれば、自動的に取り込まれます。

インポート/エクスポートのような作業はなく、OSと一体化しているので、とても使いやすいです。

メディア管理は弱い

ただしObsidianは、基本的にはMarkdown形式のテキストファイルを扱うものなので、画像や動画のようなメディアファイルを管理することには不向きです。

例えば「猫」で検索をしても、上記の画像はヒットしません。（これは通常のOSでも同じですが）

しかし、AIプラグインを組み合わせることで、自動的に画像認識をして、画像検索をすることができるようになります。

Omnisearchプラグインとは

「Omnisearch」は、Obsidianの検索機能を強化するプラグインです。

通常のObsidianの検索機能は、（おそらく）検索インデックスが作成されず全ノートに対して検索処理が走るので、ノート数が数千を超えると、とても遅くなります。

Omnisearchは以下のような機能を持っています。

検索インデックスを作成して高速化
あいまい検索
検索ワードの周辺表示
検索行に直接ジャンプ

さらに別のプラグイン「Text Extractor」「AI Image Analyzer」と連携することで、PDF検索、画像検索も可能となります。

Text Extractorプラグインとは

「Text Extractor」は、PDFと画像ファイルからテキストを抽出するプラグインです。

PDFファイルからは直接テキストが抽出されますが、画像ファイルに対してはOCRが用いられます。

Omnisearchと連携することで、検出結果をインデックスし、検索対象とすることができます。

AI Image Analyzerプラグインとは

「AI Image Analyzer」は、ローカル環境でAI（LLM）を実行する「Ollama」を使用して、画像解析をするプラグインです。

別途Ollamaがインストールされている必要があります。

Omnisearchと連携することで、解析結果をインデックスし、検索対象とすることができます。

ObsidianのOmnisearchプラグインとPDF/画像検索をする方法

Omnisearch、Text Extractor、AI Image Analyzer、Ollamaのインストールと設定、注意点、使ってみた感想についてご紹介します。

Obsidianのインストール

Obsidianのインストールと、基本的な使い方については、下記の記事をご参照ください。

ここでは、Windows環境での使用を前提としています。

モバイル版アプリは、一部のプラグインが動作しないようです。

: ノートをリンクでつないで管理できるObsidianの使い方
2025/4/22 Obsidian, カナダ
情報をただ保存するだけでなく、いじくり回しながらアイデアをまとめたいという方に向いているノートアプリがObsidianです。Obsidianは、ノート間のリンクを重視しているので、発想を広げたり、まと ...
ノート

Ominisearchプラグインのインストール

「設定」-「コミュニティプラグイン」から、「Omnisearch」をインストールします。

上部の検索アイコンはObsidian標準のもので、左に表示されている検索アイコンがOmnisearchのものです。

Text Extractorプラグインのインストール

次に「Text Extractor」プラグインをインストールします。

「Text Extractor」の設定画面を開き、「OCR Languages」に「日本語（jpn）」を追加します。

「Omnisearch」の設定画面を開き、「PDFs content indexing」「Image OCR indexing」「Documents content indexing」をオンにします。

その後、Obsidianの再起動が必要となります。

Text Extractorプラグインの使い方

インデックス作成が完了したら、後はOmnisearchで検索をするだけです。

PDF解析

テストとして、デジタル庁が配布している「DS-100 デジタル・ガバメント推進標準ガイドライン」で試したところ、正常に検索をすることができました。

ところが、Nintendo Switch2の「安全に使用するために」では、何もヒットしません。

違いがあるかの確認のため、ファイルを右クリックし「Extract Text to clipboard」を選択します。

デジタル庁のPDFファイルからは正常にテキスト抽出されましたが、任天堂のPDFファイルは空となりました。

この問題はバグ報告されており、15%のPDFファイルで抽出に失敗するようです。

アップデートで改善されることを待つしかないと思われます。

OCR

こちらは、Wikipediaのページのスクリーンショット画像です。

この画像に対してのOCR結果は、以下のようになっています。

1文字ごとに分割されていて、文章として体を成していないので、検索に利用できることはほぼないと思います。

むしろ、検索の邪魔になりそうです。

Ollamaのインストール

「AI Image Analyzer」の前に、「Ollama」をインストールし、起動しておく必要があります。

モデルのダウンロードは、とりあえず不要です。

詳細は下記の記事をご参照ください。

: 中国のAI「DeepSeek-R1」をOllamaを使ってWindowsローカルで動かす方法
2025/2/18 LLM, Ollama, 中国
中国企業が開発した生成AIモデル「DeepSeek-R1」が話題となっており、アプリストアでもランキングを伸ばしていますが、プライバシー保護の観点から利用することは待ったほうが良いです。この記事では、 ...
AI

AI Image Analyzerプラグインのインストール

Obsidianに「AI Image Analyzer」プラグインをインストールします。

「AI Image Analyzer」では、下記のモデルを使用することができます。

llava-llama3（8B）
llama3.2-vision（11B）
llama3.2-vision（90B）
llava（7B）
llava（13B）
llava（34B）

いくつか試しましたが、結局標準の「llava-llama3（8B）」が一番バランスが良いと感じました。

他のモデルは、処理に時間がかかったり、プロンプトが無視されたりしたので、色々と調整が必要になると思います。

使用するモデルを決めたら、「Pull Model」をクリックします。

自動的に、Ollamaでモデルがダウンロードされます。

初期設定では、プロンプトが以下のようになっています。

Describe the image. Just use Keywords. For example: cat, dog, tree. This must be Computer readable. The provided pictures are used in an notebook. Please provide at least 5 Keywords. It will be used to search for the image later.

（画像を説明してください。キーワードのみを使用してください。例えば：「猫」「犬」「木」などです。これはコンピューターが読み取れる形式である必要があります。提供された画像はノートブックで使用されます。後で画像を検索するために、少なくとも5つのキーワードを提供してください。）

このままでは英語で出力されるので、日本語でも検索できるように、以下のプロンプトを追加します。

Describe the image. Just use Keywords. For example: cat, dog, tree. This must be Computer readable. The provided pictures are used in a notebook. Please provide at least 5 Keywords. It will be used to search for the image later. Also, include a Japanese translation of each keyword in parentheses.

（画像を説明してください。キーワードのみを使用してください。例えば：「猫」「犬」「木」などです。これはコンピューターが読み取れる形式である必要があります。提供された画像はノートブックで使用されます。後で画像を検索するために、少なくとも5つのキーワードを提供してください。各キーワードには日本語訳を括弧内に含めてください。）

「Omnisearch」の設定画面で、「Image AI Indexing」をオンにします。

その後、Obsidianの再起動が必要となります。

AI Image Analyzerプラグインの使い方

画像がどのように解析されたかは、ファイルを右クリックして「Analyze image to clipboard」から確認できます。

例えばこの車の画像は、最初の英語のプロンプトの場合は、以下のような結果となりました。

Car, silver car, city street, brick road, graffiti on building

少し物足りなくはありますが、それなりに正しい結果と言えると思います。

次に、こちらの猫の画像で、日本語翻訳プロンプトを追加したバージョンで試してみます。

以下の結果となりました。

cat（ねこ）, white（はいばさ）, pink（ぴんくす）, table（テーブル）

うーん……

画像解析の結果自体がいまいちではありますが、日本語翻訳が壊滅的です。（はいばさとは一体……）

また「ねこ」にしても、「猫」や「ネコ」ではヒットしないという、表記ブレが問題となります。

もう少し賢いAIモデルであれば、この辺りも正確に処理してくれるとは思いますが、「llava-llama3（8B）」では無理なようでした。

上位モデルでも試してみたのですが、プロンプトが完全に無視されて、箇条書きではなく、長文で回答されました。英語のみで使うのであれば、それでもいいかもしれません。

日本語翻訳は、無いよりはマシとは言えるかもしれませんが、中途半端にあるくらいであれば、逆に邪魔になるかもしれません。

まとめ ObsidianでPDF/画像検索できるようにするプラグインについて

Obsidianは、ノートファイルが数千を超えると、検索が遅くなるという問題があります。

Omnisearchプラグインは、検索インデックスを作成することで、この問題を解決します。

Text Extractorは、PDFからのテキスト抽出と、画像のOCR機能を提供するプラグインです。PDFは抽出に稀に失敗することがあります。OCRは、文章が1文字ごとに分割されるので、検索にはほぼ役に立ちません。

AI Image Analyzerは、画像解析をするプラグインですが、日本語翻訳に（ほぼ）対応しておらず、日本語で検索をすることができません。

Omnisearchは便利ですが、Text ExtractorとAI Image Analyzerの信頼性は低いです。

今後のアップデートに期待したいところです。

Obsidianで“育てる”最強ノート術 —— あらゆる情報をつなげて整理しよう

著:増井敏克

¥2,156 （2025/11/10 19:01時点 | Amazon調べ）

Amazon

楽天市場

ポチップ

ローカルで動く無料のアウトライナー「cherrytree」の使い方

cherrrytreeは、無限の階層構造を持つことができる軽量なノートアプリです。機能は少ないですが、キーボード操作だけで完結する軽量なノートアプリを探しているのであれば、向いているかもしれません。この記事では、cherrytreeの使い方と注意点、使ってみた感想についてご紹介しています。 cherrytreeとは cherrytreeの概要と特徴をご紹介します。 cherrytreeの概要「cherrytree」とは、Windows、macOS、Linuxで動作する、アウトライナー（アウトラインプロセ ...

ノート

2025/9/19

Obsidianの保管庫をVPNを使ってスマホから閲覧する方法

ObsidianのデータをPCとスマホで同期しようとすると色々大変ですが、閲覧のみであれば比較的簡単です。この記事では、Obsidian Local Vault ServerプラグインとTailscaleを使用し、スマホのブラウザから、PC内のObsidianファイルを直接参照する方法をご紹介します。 ObsidianのPCとスマホの同期は難しい Obsidianとは Obsidianで同期をする方法同期の問題点閲覧のみなら簡単 Obsidianとは「Obsidian」とは、ローカルで動作するノート ...

ノート

2025/3/30

完全オフラインで利用できるNotion代替アプリ AppFlowyとは

Notionは便利だけど、サーバー管理者にデータを見られるのが気になるという場合に試してみたいアプリがAppFlowyです。AppFlowyは、完全にオフラインで利用できるだけでなく、オンプレミスのサーバー環境で同期をすることもできます。この記事では、AppFlowyの概要と使い方、使ってみた感想をご紹介しています。ポイント AppFlowyの機能と料金 AppFlowyの使い方使ってみた感想 AppFlowyとは AppFlowyの概要と、Notionとの違い、料金プランについて解説します AppF ...

ノート

2025/5/3

NotebookLMでYouTubeから文字起こしして、自動で要約したり、ポッドキャストを作成したりする方法

Googleが開発しているNotebookLMは、pdfやYouTubeのリンクなどをソースとして、AIを活用して情報を自動的に整理することができるツールです。YouTubeの文字起こしデータを取り込むこともできるので、動画ではなく、テキストとして情報を保存することもできます。逆にそこから、ポッドキャスト風の会話データとしてまとめなおす機能も追加されました。この記事では、実際にYouTubeの動画を取り込み、どのように文字起こしされ、まとめることができるのかをご紹介しています。 NotebookLMでYo ...

ノート

2025/4/23

ObsidianのCopilotプラグインで、ローカルLLMと連携する方法

最近のクラウドノートアプリは、AIサポート機能が当たり前となっていますが、ローカルノートアプリのObsidianでも、プラグインをインストールすれば、AI連携できるようになります。完全にオフラインで動作するので、プライバシーの心配もありません。この記事では、Obsidianと、Copilotプラグイン、およびLM Studioを使って、ローカルで動作するノートアプリ+AIアシスタント環境を構築する方法と、使い方をご紹介します。 ObsidianとCopilotとは ObsidianとCopilotの概要、 ...

ノート

2025/7/27

Obsidianで読書ノートを作る方法「Book Search」プラグイン+他

Obsidianで読書ノートを作成するならばBook Searchプラグインが便利です。ただし画像を表示したり、一覧表示したりしようとすると、やや複雑な設定が必要となります。この記事では、例となるテンプレートをご紹介します。ポイント Book Search： Googleブックスの情報を取得 Templater：オンラインまたはローカル保存した表紙画像を自動的に表示 Dataview： Book Searchで作成したノートを一覧表示 Obsidianで読書ノートを作るための3つのプラグイン Obsi ...

異なるOS間で簡単にファイル共有できる「LocalSend」の使い方

Wi-Fiに接続すると、他のユーザーや管理者に検索履歴はバレる？

ObsidianにAI画像認識やOCRプラグインを追加して検索強化する方法

Obsidianと検索強化/OCR/AI画像認識プラグイン

Obsidianとは

フォルダ管理が容易

メディア管理は弱い

Omnisearchプラグインとは

Text Extractorプラグインとは

AI Image Analyzerプラグインとは

ObsidianのOmnisearchプラグインとPDF/画像検索をする方法

Obsidianのインストール

ノートをリンクでつないで管理できるObsidianの使い方

Ominisearchプラグインのインストール

Text Extractorプラグインのインストール

Text Extractorプラグインの使い方

PDF解析

OCR

Ollamaのインストール

中国のAI「DeepSeek-R1」をOllamaを使ってWindowsローカルで動かす方法

AI Image Analyzerプラグインのインストール

AI Image Analyzerプラグインの使い方

まとめ ObsidianでPDF/画像検索できるようにするプラグインについて

おすすめVPNと、厳選プライバシー保護ツール

VPN大全デジタルプライバシー Weeklyレポート 2026年4月第1週

VPN大全デジタルプライバシー Weeklyレポート 2026年3月第5週

テレグラムのアカウントを完全に削除する方法相手への表示やデータの扱いも解説

BeRealの位置情報はバレる？精度・危険性・オフ設定を徹底解説【2026年最新】

BeRealのスクショや画面録画はバレる？仕組みと注意点を解説