Preserving Metadata from Parliamentary Debates

Published on 2018-05-30632 Views

Alina Karakanta

Multilingual parliaments have been a useful source for monolingual and multilingual corpus collection. However, it is often the case that extra-textual information about speakers or the original langu

ParlaCLARIN Workshop 2018 - Miyazaki

Related categories

Presentation

ParlaCLARIN Workshop: Creating and Using Parliamentary Corpora, Miyazaki 201800:00

EuroParl-UdS: Preserving and Extending Metadata in Parliamentary Debates00:10

Outline00:39

Introduction00:59

Motivation01:55

EuroParl-UdS04:31

Corpus processing - 105:41

Corpus processing - 205:52

Metadata - Proceedings06:35

Metadata - MEPs07:45

Corpus processing - 308:28

Corpus processing - 409:20

Sorting and alignment10:05

Corpus structure10:28

Corpus statistics 1510:46

Possible applications11:30

Thank you!12:15