Arbeit mit Datensatz

Besteht die Möglichkeit die Aufnahmen nach Sprechern zu sortieren oder zu filtern? Ich arbeite für ein Projekt an unserer Uni mit dem Datensatz DE und bekomme aktuell das Problem nich gelöst, dass einzelne Sprecher ja immer wieder auftauchen.
Liebe Grüße

Hi Niklas,
Ja es gibt in den .tsv-Tabellen (validated.tsv,…) eine client_id, mit der man den Datensatz nach Sprecher sortieren kann.

sorry, nur mein Kommentar noch dazu: Man muss sich nicht registrieren, um Aufnahmen zu machen (oder zu reviewen). Daher vermute ich, dass der Großteil entweder eine generische oder zufällige ID hat (?) oder (hoffentlich, da besser erkennbar) gar keine!

Wenn man nicht eingeloggt arbeitet, werden die Aufnahmen teilweise über Monate im Frontend mit hoch gezählt. Deswegen vermute ich, es wird bei nicht eingeloggten eine ID pro Session benutzt. Wenn jemand anonym 40 Sätze einspricht, haben diese Sätze eine gemeinsame ID. Man erkennt diese User aber daran, dass sie sonst keine Daten haben (Alter, Muttersprache, usw.)