No sé cómo sería para unir el spacy con el extractor, el spacy hasta donde sé solo tiene cliente en python.
Para la instalación depende de cada sistema operativo: Install spaCy · spaCy Usage Documentation
Es un requerimiento usar el modelo es_core_news_md
así que se tiene que instalar con :
python -m spacy download es_core_news_md
¿Para el archivo de las reglas no importa que sean listas de palabras muy extensas? digo por si hay algún orden o límite.