重複を見つける

このツールは、文書メタデータおよび、ファイル・プロパティを比較して、等しい文書の候補を、グループ化するものです。
同じページ数、同じ作成日、同じファイル・サイズの PDF は、明らかに重複している可能性があります。
その他のファイルやメタデータの属性は、異なる用途で使うことができます。
 この簡素化選択と、CRC(Cyclic Redundancy Check:周期冗長検査)比較を備えた厳密選択と、並べて表示しマニュアル比較する方法を使って、2つの文書の重複を、容易に判断することができます。
除外する重複ファイルを選択で、各重複グループを処理するために、動的に選択する機能もあります。これは、保持しておきたいファイルを除いて、カスタム定義の基準に一致するファイルをすべて選択するために使われます。

Find duplicates tool screenshot

ツールには、ファイルを、削除、コピー、移動するオプションがあります。このオプションを使って、見つかった重複を、容易に管理できます。

操作は、比較したい PDF のリストで、ツールを始めます。リストには、PDF 文書用に、自動的に走査したいフォルダーを、サブフォルダーを含めて、組込むことができます。

指定した、すべての文書のメタデータとファイル属性を収集した後、ツールは、デフォルト、あるいは最後に使用された設定を使って、属性の同一性によって文書をグループ化して比較するために、属性のリストを表示します。
等しいものが見つからないときは、等しいグループを表示しません。しかし、ファイルのリストは内部に保持されています。 このため、属性のリストを変更して、再度、他の可能性を容易に試みることができます。

比較する属性のリストは、上のツールバーの関連するボタンを使って、対話しながら構成します。
ツールバーの左ボタンは、最後に使った比較を集めて、容易に再使用できるようにっています; プラス(+)の符号ボタンは、さらに追加の項目を加えるために使います; 各項目のボタンは、別の属性に変更したり、比較からこれを取り除くオプションを持っています。
このメニューの下には、項目という名前のスクリプトがあり、カスタム定義されたスクリプト関数にアクセスできます。
スクリプト関数は、スクリプトの管理項目から起動したビルトイン・スクリプトエディタを使って作成します。
スクリプト関数は、名前変更ツール のスクリプト機能で使われるものと同じルールを使って作成され、他のすべてのファイルの関連する値と比較される文字列を返す必要があります。
これは、たとえば、PDF テキストのチェックサムや、 ページサイズを表す値などです。

「適用」という名のボタンを押すと、現在の比較項目リストを使って、新しい比較を実行します。

左側のツールバーで、重複管理機能にアクセスすることができます:
- CRCボタンは、選択したグループごとにCRC32型チェックサムの結果を比較し、そのグループ内で同じチェックサムを持たないファイルをすべて除外します。 正確なファイルの重複を検索する場合に便利です。
除外されたファイルは、内部のファイルリストから削除されないので、再度比較操作をして、また衝突が検出されれば、再度表示されます。

- 動的選択機能は、選択されたグループのそれぞれの中で、選択基準に一致するすべてのファイルを抽出するために使われます。例えば、最新の更新日を持つすべてのファイルを選択するとか、短尺の名前を持つすべてのファイルを選択するなどです。
このようにして、削除する重複ファイルを簡単に選択することができます。
セレクタはスクリプトで、いつでも新しいカスタム選択スクリプトを作成して、重複を除外するシナリオを最適に定義することができます。

削除と移動の操作は、影響を受けたファイルを、文書の内部リストから取り除きます。したがって、さらに比較操作をした場合、これらは含まれません。

CSV に出力するボタンは、CSV 形式ファイルに、表示された重複グループを出力します。結果を、他のアプリの処理で使うことができます。

(c) 2006-2021 RTT, Makoto WATANABE