Calidad de las frases de wikipedia

No sé cómo sería para unir el spacy con el extractor, el spacy hasta donde sé solo tiene cliente en python.

Para la instalación depende de cada sistema operativo: Install spaCy · spaCy Usage Documentation

Es un requerimiento usar el modelo es_core_news_md así que se tiene que instalar con :

python -m spacy download es_core_news_md

¿Para el archivo de las reglas no importa que sean listas de palabras muy extensas? digo por si hay algún orden o límite.