1

Тема: OFF: Автоматизация поиска файлов PDF/DJVU — без OCR-слоя

Имеется ли инструмент, с которым можно выявлять по дискам файлы PDF и DJVU, без текстового слоя.

2

Re: OFF: Автоматизация поиска файлов PDF/DJVU — без OCR-слоя

Для начала ознакомьтесь с  PDF and text layer.
Можно установить факт отсутствия рендеринга текста в файле.
Текстовые данные обычно хранятся в файле pdf в круглых скобках, на каждый символ - 1 байт.

+ DD