Seminare Flashcards

(33 cards)

1
Q

Definition Strukturalismus

A
  • Richtung der Linguistik
  • von Schweizer
  • Grundidee: Beobachtung, dass Zeichenketten immer nur im Bezug auf andere Zeichenketten einen Sinn und Funktion besitzen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Strukturalismus - lokaler Kontext

A
  • alle Wörter, die mit einem zu beobachtenden Wort in einem Satz auftreten
  • 1 Wort, hat n lokale Kontexte
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Strukturalismus - globaler Kontext

A
  • Menge der Idealen Kontexte eines Wortes
  • 1 Wort hat 1 globalen Kontext
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Ortographische Muster

A
  • syntagmatisch
    -> gemeinsames Auftreten in einem gemeinsamen lokalen Kontext
    -> Aufgabe: Vorhersagen des Kontextes
  • paradigmatisch
    -> ähnliche Kontexte (globaler Kontext)
    -> Aufgabe: Vorhersage eines Wortes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

statistische Signifikanz

A
  • funktionaler u. inhaltlicher Zusammenhang für alle Ebenen einer Sprache
  • 3 Ebenen:
    -> morphologisch, syntaktische, semantische
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Morphologie - Definition

A
  • Gebiet der Linguistik, das sich mit Gesetzmäßigkeiten der Wortbildung beschäftigt
  • Gegenstand der Morphologie ist das Morphem, sowie die Art und Weise, wie Morpheme zu Wortformen kombiniert werden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Morphem - Definition

A

die kleinste bedeutungstragende Einheit der Spreche

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Allmorphem - Definition

A
  • verschiedene Varianten eines Morphems
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Arten von Morphemen

A
  • Basismorpheme
    -> beschreiben Sachverhalte d. außersprachlichen Wlet
    -> auch Stamm eines Wortes genannt
    -> Bsp.: Kind, seh
  • Derivative
    -> werden an Wortstämme angefügt
    -> unterscheidung Primär- und Sekundärstamm, jenachdem wie viele Affixe dem Stamm schon hinzugefügt wurden
  • grammatische Morpheme/Flexive
    -> tragen nur grammatische Bedeutung
    -> werden an Wortstämme angefügt (affgiert)
    -> z. B. geh > geht oder Kind > Kinder
  • Freie Morpheme: können ohne Affixe im Text auftreten
  • gebundene Morpheme: können NICHT ohne Affixe im Text auftreten; alle grammatikalischen Morpheme, Derivate und einige Basismorpheme
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Operationen zur Bildung von Wortformen

A
  • Flexion
    -> dient der Ableitung grammatischer Wortformen aus einem Stamm und schafft syntaktische Oberfächenvarianten ein und desselben Wortstammes
    -> im Deutschen meist durch Anhängen von Flexionssuffxen, wie z. B. Kind > Kinder
    -> aber auch Um- und Ablaute auf (Haus> Häuser od. singen > sang), die zur Entstehung von Allomorphen führen
  • Komposition
    -> schafft ebenfalls Wortneubildungen, bei denen diesmal aber zwei Stämme (bzw. zwei freie Morpheme) aneinandergefügt werden
    -> Ergebnis ist Kompositum
  • Derivation
    -> schafft neue Wörter durch Anfügung (Affgierung) von Derivativen an
    Wortstämme.
    -> meisten Derivative haben dabei eine charakteristische Bedeutung, die sie dem Stamm hinzufügen
    -> Derivationssuffxe ändern zudem meist die Wortart des
    Stamms.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Bedeutung für Text-Mining

A
  • morphologische Strukturen müssen dann verarbeitet werden, wenn morphologische Klassifikation versch. Wortformen für weitere Analyse nötig ist
  • Allmorphie ist Problem, wenn man Wortform durch Abschneiden einer Endung auf Stamm reduziert würden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Grundformreduktion

A
  • Lemmatisierung
  • eien Wortform wird auf eine im Lexikon aufgezeichnete Form zurückgeführt
  • Häser > Haus
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Stammformreduktion

A
  • Stemming
  • Verschiedene Wortformen werden auf selben Stamm zurückgeführt
    -> in versch. Sprachen unterschiedlich schwer
    -> im Englischen oft verwendetes Verfahren: Porter-Stemmer
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Fachtexte - Definition

A
  • informieren Fachleute desselben Faches und ermöglichen eine Kommunikation mit vertretern anderer Disziplinen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Terminologie - Definition

A
  • Sammlung von Fachausdrücken, die in Form eines Thesaurus geschrieben sind
  • Thesaurus: Nennung von Sachgebiet, Synonyme usw.
  • Fachausdrücke: Nomina, Vebren, einezelne Wörter oder Mehrworteinheiten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Ausnahmen und Sonderfälle in Fachsprache

A
  • inkonkrte Rechrscheibung und unübliche Schreibweise
    -> ae statt ä, alte Rechtschreibung, Schreibweisen in sozialen Medien (z.B.:thx)
  • Sonderregelungen der Sprache
  • Sonderfälle: geringe Fehlerquote kann toleriert werden
16
Q

Operatinale Semantik

A

Wirkugn von Programmen, die den Zustand einer Maschine verändern

17
Q

Semantische Repräsentation - Grundprinzip

A

Der Semantischenrepräsentationssprache (SRS) wird durch semantische Interprätation eine Bedeutung zugeteilt

17
Q

Referentielle Semantik

A

Bedeutung - Das mit einem Ausdruck bezeichnete Objekt

18
Q

Prozedurale Semantik

A

Gebrauch sprachlicher Ausdrücke legt ihre Bedeutung fest

18
Q

Axiomatische Semantik

A

Transformation von logischen Aussagen über Zustände

18
Q

Semantische Relationen

A
  • Synonyme
  • Gegensätze
  • Ober- u. Unterbegriffe
  • Antonyme (hell - dunkel, im Bezug auf Licht)
  • Komplementärbegriffe (lebendig - tot, im Bezug auf Körperzustand)
18
Q

Denotationale Semantik

A

weist jedem Programm die Ergebniss der zu berechnenden Funktion als Semantik zu

19
Q

Strukturalistische Semantik

A

Bedeutung eines Ausdrucks ist abhängig von Kontext

20
Syntax - Definition
Wissenschaft des Prinzips und Prozesses nach dem Sätze in bestimmten Sprachen konstruiert werden
21
Dependenzstruktur
* Dependenz: Stellt bestehende Abhängigkeiten zwischen Wörtern winws Satzes dar * Löschtest -> Sinnverlust eines Wortes nach löschen eunes anderen Wortes --> gelöschtes Wort diesem übergeortnet * Dependenzbaum -> Wurzel immer Verb -> repräsentiert flexible und effektive syntaktische Zusammenhänge * Anwendung -> inhaltlich-funktionale Kategotrien (Subjekt, Objekt...)
22
Konstituentenstruktur
* Konstituenten: Unmittelbare Bausteine von Sätzen (Wörter und Wortkombinationen) * Verschiebetest: Bestimmung der Konstituenten * Phasen-Struktur-Grammatik -> Konst: Wort oder eine Phrase, die von einer syntaktischen Regel als Einheit behandelt wird -> Rahmen für syntaktischen Regeln ist kontextfreie Ersetzungsgrammatik (also in der Chomsky-Hierarchie eine Typ-2 Grammatik) mit allen Wörtern einer Sprache als terminalen Symbolen, den syntaktischen Kategorien und Phrasen als nichtterminalen Symbolen und den syntaktischen Regeln als Produktionsregeln -> Grundlegende Konstituenten sind dabei die syntaktischen Kategorien Nomen (N), Verb (V), Adjektiv/Adverb (A), Präposition (P) und Artikel (Art), sowie die nichtterminalen Phrasen NP, VP, AP und PP -> Syntaktische Strukturen werden in Form eines Syntaxbaums beschrieben, mit dem auch syntaktische Mehrdeutigkeiten dargestellt werden können * Anwendung -> automat. Syntaxanalyse -> POS-Tags
23
Ziel Syntaktisce Repräsentation
Angabe gramatischer Regeln zur Bestimmung einer Menge an syntaktisch korrekter Sätze in einer Sprache
24
Probabilistische Parsen
* regelbasiertes Paradigma -> mehrdeutige syntaktische Struktur einer Folge von Wörtern -> Bestimmung ob Folge von Wörtern in Sprache zulässig * Wahrscheinlichkeit -> Berechnung mittels Wkt Auftreten von Wortkombinationen in einem Corpus -> Darstellung von Mehrdeutigkeiten eines Satzes * Probailistische kontextfreie Grammatik (PCFG) -> Anwendung von Datenbanken für die Regeln
25
Fachsprache Definition
* Texte, die Wissen zu einem bestimmten Thema vermitteln * Unterschiede zu Allgemeinsprache: -> Syntaktische und semantische Beschränkungen (z. B. Grammatik) -> Fachgebietsspezifische lexikalische Beschränkungen (z. B. Fachterminologie) -> Fachgebietsspezifische Morphologie (z. B. Charakteristische Morpheme)
26
Welchen Einfluss haben Sprachregister auf die Verwendung von Sprache
* Sprachregister sind bestimmt durch situative Faktoren: -> Kanalfaktoren (z. B. Email, Telefon) -> Soziale Rollen (z. B. Höflichkeitsformen) -> Reglementierte Formulierungen * Sprachregister bestimmen Form des Textes
27
Möglichkeiten der Segmentierung von Text
* Satzsegmentierung -> Regeln für Satzanfang -> Regeln für Satzende: -> Abkürzungen (mit „.“) * Wortformensegmentierung -> Trennung mit Trennsymbo -> Berücksichtigung erlaubter Zeichen
28
Herausforderungen bei der Segmentierung von Text und einige Lösungsstrategien
* Grundgedanke: -> Die Segmentierung im Sinne der Textverarbeitung meint die algorithmische Zerlegung von Texten in Sätze und von Sätzen in Wörter. Für die Trennung der einzelnen Elemente werden dabei Trennregeln benötigt. * Schwierigkeiten: -> Auftreten von Ausnahmefällen bei denen allgemeine Trennregeln nicht verwendbar sind → Aufstellung zusätzlicher Regeln und Ausnahmelisten