Convierte archivos de PDF a TXT, combinado con el comando grep también se puede usar para buscar cadenas de texto en PDFs.
pdftotext mi-archivo.pdf convierte el archivo mi-archivo.pdf a txt y lo guarda en un archivo llamando mi-archivo.txt
pdftotext mi-archivo.pdf - | grep -i 'hola' busca en el archivo mi-archivo.pdf todas las líneas que contengan la cadena hola
find /home/adrian/mis-pdfs -iname '*.PDF' -print -exec pdftotext '{}' - \; | grep -i "hola" > salida.txt buscar en todos los PDFs de la carpeta /home/adrian/mis-pdfs la cadena hola y el resultado lo guarda en salida.txt
Felicidades por tu trabajo y dedicación.
solo soy un entusiasta de la informática y el Internet y lo relacionado a linux
quizás no es importante pero solo como observación te digo que en tu pagina de inicio en la referencia a pdftotext, hay un pequeño error ortográfico dice "convierte archivos DPF a TXT," en lugar de "Convierte archivos PDF a TXT,"
por todo lo demás excelente.
con toda mi admiración.
PS. estaré esperando tus nuevas publicaciones de libros.