Irgendwann vor meiner Zeit hier gab es diese Diskussion wohl schon einmal und man hat sich dagegen entschieden Texte automatisiert auf ihre Qualität zu prüfen. Alles muss entweder durch den manuellen sentence-collecotor Reviewprozess durch oder bei großen Sammlungen wie den Europarl-Corpus muss ein relativ großes, zufälliges Sample reviewt werden.
Ja man kann die Languagetools auch lokal laufen lassen, ich glaube dann gibt es ein paar weniger Funktionen als in der kommerziellen Variante.
Ich finde man kann dieses Tool gut benutzen, um große Sammlungen für den Sentence-Collector vorzubereiten. Dann hat man dort eine kleine, sauberere Satzsammlung, die man viel schneller manuell kontrollieren kann. Ich denke nicht, dass 90% der Chat Nachrichten rausgefiltert werden, aber Rechtschreibfehler und falsche Satzzeichen erkennt das Tool ziemlich zuverlässig. Damit nimmt man sich schon mal eine gute Portion Arbeit ab.