Поставив strigi, увімкнув, індексний файл вже перевалив за гіг, бомба продовжує стрибати. А чогось такого, більш традиційного (вікноподібного: бере файл, переглядає, знаходить) немає?
Щодо pdftotext: я не дуже розуміюся на конвеєрах, можете детальніше описати?