pdftotext [1]
Convierte archivos de PDF a TXT, combinado con el comando grep [2] también se puede usar para buscar cadenas de texto en PDFs.
pdftotext mi-archivo.pdf convierte el archivo mi-archivo.pdf a txt y lo guarda en un archivo llamando mi-archivo.txt
pdftotext mi-archivo.pdf - | grep -i 'hola' busca en el archivo mi-archivo.pdf todas las líneas que contengan la cadena hola
find /home/adrian/mis-pdfs -iname '*.PDF' -print -exec pdftotext '{}' - \; | grep -i "hola" > salida.txt buscar en todos los PDFs de la carpeta /home/adrian/mis-pdfs la cadena hola y el resultado lo guarda en salida.txt