Skip to content

Kleine Ergänzungen #6

New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Open
wants to merge 3 commits into
base: master
Choose a base branch
from
Open

Kleine Ergänzungen #6

wants to merge 3 commits into from

Conversation

notesjor
Copy link

Erst einmal vielen Dank für das wunderbare Korpus.
Folgende Ergänzungen würde ich gerne hinzufügen:

  1. Die Datei italian/short19-20/anno/it0156.xml hat in Zeile 28 einen kleinen Auszeichnungsfehler.
  2. Mittels TRANG habe ich XSD Dateien erzeugt. Da sich TEI-Rohtexte und annotierte TEI-Dateien unterscheiden, gibt es zwei unterschiedliche XSD-Versionen.
  3. Mir ist aufgefallen, dass die Benennung der Ordner nicht einheitlich erfolgt. Dies würde die automatisierte Auswertung erleichtern. >>> Darüber hinaus wäre es hilfreich, wenn es einen Workflow/Skript zur einheitlichen Aufbereitung aller Ordner gäbe. Die einzelnen Sprachen haben einen teilweise sehr unterschiedlichen Datenstand.

@hennyu
Copy link
Contributor

hennyu commented Mar 20, 2018

Vielen Dank für die Hinweise auf Fehler und die Anregungen! Es ist sehr schön, dass die Textbox auch außerhalb des Projekts, in dem sie entstanden ist, benutzt wird.
Da wir in regelmäßigen Abständen Releases machen, würden wir die Änderungen aber nicht driekt in den master übernehmen, sondern zunächst in den next-Branch, der dann für den nächsten Release übernommen wird.

  • Den Fehler in it0156 habe ich korrigiert und in den next-Branch gepusht
  • Als Schema-Format verwenden wir bisher RelaxNG. Die Schemata liegen in einem separaten Repository: https://github.com/cligs/reference Dort gibt es auch ein Schema für die nicht annotierte und eines für die annotierte Version der Dateien. Es wäre sicher gut, wenn wir diese Informationen in die Beschreibung des Textbox-Repositoriums übernehmen.
  • Die Vereinheitlichung der Ordnerstrukturen und wie wir einen einheitlichen Workflow beschreiben und die Skripte dafür zur Verfügung stellen könnten, müssten wir erst in der Nachwuchsgruppe besprechen. Einige Skripte stehen bereits hier in der "Toolbox" zur Verfügung: https://github.com/cligs/toolbox

@notesjor
Copy link
Author

  • Vielen Dank für den Hinweis zum RelaxNG Repository. Vielleicht wäre es hilfreich https://github.com/cligs/textbox/blob/master/README.md um einen Hinweis/Link zu erweitern. Für mich war das spontan nicht ersichtlich.
  • Zu der Ordner: Auch hier wäre ein Link zur Toolbox hilfreich. Darüber hinaus sollte man immer an Nutzer*innen denken, die eigene Skripte schreiben und evtl. nicht die Toolbox nutzen. Die aktuelle Ordnerstruktur erfordert einige (unnötige) Sonderbehandlungen. Daher wäre eine einheitliche Benennung sehr hilfreich.

@hennyu
Copy link
Contributor

hennyu commented Apr 24, 2018

Ok, wir werden diese Dinge mit dem nächsten Release verbessern: Hinweise und Links zu Schema und Toolbox und Vereinheitlichung der Ordnerstrukturen und -namen.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants