Textextraktion aus pdfs
Strukturierung und Analyse linguistischer Korpusdaten WS 16/17
Christian Riepl, Stephan Lücke
Gliederung:
1. Sitzung (19.12.2016)
2. SQL: Joins (09.01.2017)
3. Tree-Tagger (16.01.2017)
4. SQL-Funktionen (23.01.2017)
5. TreeTagger-Chunks; MySQL-Variable (06.02.2017)
Allgemeine Beiträge zur Veranstaltung:
Kurze Einführung in die digitale Zeichenkodierung (ITG/slu)
UTF-8 (ITG/slu)
Byte Order Mark (BOM) (ITG/slu)
Die regulären Ausdrücke (ITG/slu)
Webextraktion mit wget
Linguistische Datenverarbeitung mit python
XML-Extraktion mit python
Die Programmiersprache AWK: Grundlagen (ITG/slu)
Datenmodellierung - Das relationale Datenmodell (ITG/slu)
Datenimport in MySQL-Datenbank mit Programm mysqlimport (ITG/slu)
Backticks, Hochkommata, Anführungszeichen ... (ITG/slu)
SQL: Umgang mit Groß-/Kleinschreibung (Kollationierung) (ITG/slu)
Reguläre Ausdrücke (RAs) in MySQL (ITG/slu)
UTF-8 (ITG/slu)
Byte Order Mark (BOM) (ITG/slu)
Die regulären Ausdrücke (ITG/slu)
Webextraktion mit wget
Linguistische Datenverarbeitung mit python
XML-Extraktion mit python
Die Programmiersprache AWK: Grundlagen (ITG/slu)
Datenmodellierung - Das relationale Datenmodell (ITG/slu)
Datenimport in MySQL-Datenbank mit Programm mysqlimport (ITG/slu)
Backticks, Hochkommata, Anführungszeichen ... (ITG/slu)
SQL: Umgang mit Groß-/Kleinschreibung (Kollationierung) (ITG/slu)
Reguläre Ausdrücke (RAs) in MySQL (ITG/slu)
Zeige alle in der Veranstaltung veröffentlichten Beiträge.