メインコンテンツへスキップ

電子書籍やPDF、テキストファイルなどをローカルでインデックスして全文検索できるようにする

··1079 文字·3 分·
ソフトウェア Recoll
著者
Admin
目次

電子書籍マネージャーに全文検索機能がない
#

自分は電子書籍の管理にCalibreというソフトを使っているが、残念なことに全ての本の内容を検索するといった機能は実装されていない。
どうしても全文検索したいので調べていたら、Recollというソフトウェアを見つけたので試してみることにした。

Recoll
#

Linux, Windows, Mac OS Xに対応している様々な種類のファイルの内容をインデックスして検索できるソフト。

対応しているファイルの種類
#

インストール
#

プロジェクト公式のaptリポジトリも提供されているが、自分の環境のaptでも見つかり、数バージョンしか遅れていなかったのでそちらを利用することにした。

🔗https://www.lesbonscomptes.com/recoll/pages/index-recoll.html

indexしてみる
#

cliとguiが提供されている。

recoll

でguiが起動される。

まずIndex Configurationを開いてログのパスや対象ディレクトリを選択する。
今回はCalibreのデータディレクトリを選択した。
これによってCalibreで管理している全ての本を検索できるようになる。

デフォルトだと~/内全てが対象になっているので注意。

Indexing Scheduleの設定はcronで定期的に実行するか常時起動のdaemonでリアルタイムでファイルが追加されるたびに自動でindexingが行われるか指定できる。
手動でやりたいのでどちらも選ばすに、start indexingを選択。

するとindexが開始されて完了すると検索画面がでてくるので検索できるようになる。

新規ファイルを配置した後にインデックスするには?
#

左上からできる。

日本語の文章の検索に対応しているのか?
#

とりあえずいくつかの文献で試したところ、単純な検索は普通に機能した。

感想
#

便利だ。
cliだともっと細かく制御できるのかもしれない。

追記
#

英単語を検索するときにスペースが入っているとうまく動かない。
two girlsと検索したいならtwo+girlsと入れる必要がある。

ここらへんに書いてありそうだがなかなか見つからない。
🔗https://www.lesbonscomptes.com/recoll/usermanual/webhelp/docs/RCL.SEARCH.LANG.html
🔗https://www.lesbonscomptes.com/recoll/usermanual/webhelp/docs/RCL.SEARCH.GUI.SIMPLE.html

複雑なクエリの打ち方を習得したら追記しようと思う。

Related

無料の帳簿ソフト、GnuCashのインストール、設定、基本的な利用方法
··3497 文字·7 分
ソフトウェア GnuCash 帳簿
gnucashを導入する。
[Linux] TeXLiveの環境構築、パッケージ管理メモ
··2212 文字·5 分
ソフトウェア 数学 Latex TeXLive
Latexを利用するために環境を整える。TeXLiveを自力でインストール。
Mattermostのバージョン更新作業メモ
··1028 文字·3 分
ソフトウェア Mattermost
毎回更新方法を忘れるので。