Das Modell der strukturierten Dokumente Flashcards

1
Q

Wie wird das Modell der strukturierten Dokumente unterteilt?

A
  • textuellen Inhalt
  • logische Struktur
  • grafisches Format
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was sind Vorteile des Modells der strukturierten Dokumente?

A
  • Es bietet ein hohes Maß an Flexibilität
  • Dokumente können als Daten betrachtet werden und mit Hilfe von Computersystemen verwaltet und manipuliert werden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was ermöglicht die Unabhängigkeit der Stylesheets?

A
  1. Ein- und dasselbe Dokument kann durch Kombination mit verschiedenen Stylesheets passend zum Anwendungszweck formatiert werden
  2. Man kann verschiedene Dokumente durch Kombination mit ein- und demselben Stylesheet einheitlich formatieren.
  3. Die Struktur kann man beim Erstellen und Lesen von Dokumenten nutzen (z.B. zur Navigation)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was ist eine Modellierung?

A

Die Modellierung ist eine vereinfachte und auf das im aktuellen Kontext Wesentliche reduzierte und – unter geeigneten Gesichtspunkten – systematisierte Darstellung.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wozu dienen Modelle?

A
  1. Zur Entwicklung einer gemeinsamen Sicht und Terminologie
  2. der Vermittlung erprobter Vorgehensweisen und Techniken
  3. dem rationalen Beweisen oder Widerlegen von Hypothesen
  4. der Ableitung von Handlungsempfehlungen.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was besagt der ursprüngliche Dokumentenbegriff?

A

Dokument als physisches Objekt, Gegenstand, die als einmalige Träger eines in menschliche Sprache gekleideten und schriftlich festgehaltenen Gedankens oder Sachverhalts fungieren.

Authentizität des Trägermediums, durch Wasserzeichen, Stempel, Siegel, Barcode oder Ähnliches

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was besagt der neuere Dokumentenbegriff?

A

Informationsträger
Die Schriftform ist immer noch wesentlich, aber das Trägermedium und die Art, wie die Information auf das Trägermedium aufgebracht ist, sind nebensächlich.
Auf den sprachlichen Ausdruck kommt es an.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Worin besteht der Unterschied zwischen dem ursprünglichen und dem neueren Dokumentenbegriff?

A

Dokumente ursprünglicher und neuerer Art unterscheiden sich auch dadurch, wie viele Exemplare es von einem Dokument geben kann und wie viele Leser gleichzeitig Gebrauch von so einem Dokument machen können.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Worin bestehen Gemeinsamkeiten zwischen dem ursprünglichen und dem neueren Dokumentenbegriff?

A

Das Gemeinsame an Dokumenten ursprünglicher und neuerer Art ist, dass sie durch ihre Schriftform eine ursprünglich sprachliche Mitteilung von der auditiven in die visuelle Übertragungsform und von der Flüchtigkeit der mündlichen Erzählung in die Dauerhaftigkeit des geschriebenen Wortes umsetzen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was besagt der moderne Dokumentenbegriff?

A

Moderne Dokumente sind Informationsträger.
Moderne Dokumente müssen deshalb in ihrer Urform elektronisch gespeichert sein und je nach Anwendungszweck unterschiedliche Präsentationsmedien unterstützen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wie lautet eine Kurzformel der Informationswissenschaft?

A

Information ist Wissen in Aktion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Erläutere Kuhlens „pragmatische Primat der Informationsverarbeitung“ („pragmatic primacy of Information Work”).

A
  • Basiert auf der Unterscheidung der Konzepte Wissen und Information
  • Information als Teilmenge von Wissen
  • Es ist definiert, dass Information zur Lösung eines konkreten Problems durch eine Person benötigt wird, aber nicht verfügbar ist
  • Kuhlen geht nicht auf den Grund der Nicht-Verfügbarkeit ein
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Welche Schlussfolgerung zieht Kuhlen für die Informationsverarbeitung und das Design von Informationssystemen?

A

Die Hauptaufgabe jeglicher Informationsverarbeitung besteht darin, Wissen in [nutzbare] Information zu transformieren und dabei Randbedingungen wie Zeitbedarf, Kosten, soziale Aspekte, kognitive Fähigkeiten und Ziele der jeweiligen Organisation zu berücksichtigen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was bedeutet der Dokumentenbegriff der Informations- und Wissensbegriff im Verständnis von Kuhlen?

A

Im Dokumentenbegriff ist Wissen enthalten.
Dieses Wissen wird für einen Menschen erst in dem Moment zu Information, in dem er es benötigt.
Und auch das nur insoweit, als es nicht bereits Bestandteil seines menschlichen Wissens ist.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wie wird das Bedürfnis nach Wissen wird in der Informationswissenschaft bezeichnet?

A

Informationsbedürfnis

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Worauf kommt es bei der maschinellen Verarbeitung von Dokumenten an?

A

Nicht nur darauf ankommt, dort Wissen zu codieren, sondern dass es auch darauf ankommt, Dokumentinhalte nach Wissen durchsuchbar zu machen, welches für ein real existierendes menschliches Informationsbedürfnis relevant und damit Information im Sinne von Kuhlen ist.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Wozu führt Daten-, Dokumenten- und Informationsverarbeitung mithilfe von Computerprogrammen?

A

Zum modernen Dokumentenbegriff

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Beispiele für Tätigkeiten im Bereich der modernen Informationsverarbeitung.

A
  • Gedankengänge organisieren und Dokumente planen,
  • Gedanken verbalisieren und Dokumente erfassen,
  • Dokumente editieren, formatieren und publizieren, also der Öffentlichkeit zugänglich machen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Was besagt das Konzept des Anomalous State of Knowledge (ASK)?

A

Unter einem ASK versteht „man einen „anormalen“ Wissenszustand, womit gemeint ist, dass einem Menschen Wissen fehlt.

Unter einem „normalen“ Wissenszustand wird dabei verstanden, dass der Mensch das benötigte Wissen bereits besitzt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Warum stellt aus ASK resultierende Informationsbedürfnis somit eine wichtige Anwendung der automatisierten Dokumentverarbeitung dar?

A

Computersysteme, die durch automatische Dokumentverarbeitung Informationsbedürfnisse erfüllen können, indem sie relevantes Wissen in den Dokumenten suchen, heißen Informationssysteme. Umgangssprachlich werden sie oft als Suchmaschinen bezeichnet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Was wird als „Informational Behaviour“ bezeichnet?

A

Die implizite Beschreibung einer Interaktion eines Nutzers mit einer Suchmaschine während des Versuchs das ASK zu formulieren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Welche zwei Suchstrategien gibt es?

A

„Lookup“ (Nutzung der Textsuche einer Suchmaschine) und „Examine“ (das Anzeigen von Titeln und Texten).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Zeichne das Modell der Informationssuche.

A

xxxxxxxxxxx|Active |Passive|
Directed |Searching | Monitoring|
Undirected | Browsing | Being Aware

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Unterscheide zwischen aktiver und passiver, sowie gerichteter und ungerichteter Suche.

A
  1. direkte Suche als aktive Versuche, Fragen zu einem speziellen Thema zu beantworten und das Informationsbedürfnis zu befriedigen
  2. Monitoring als aktiver Aufbau von Hintergrundwissen zu Interessengebieten und möglichen zukünftigen möglichen Fragestellungen
  3. Browsing als das Gegenteil von Monitoring, um neues Wissen ohne konkretes Informationsbedürfnis durch aktive Auseinandersetzung mit neuen Inhalten zu erwerben
  4. allgemeine Aufmerksamkeit als ungerichtete und passive Form der Informationsbeschaffung. Laut Bates „gives us 80 percent of all we know”.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Beschreibe das SECI-Modell.

A
  1. Sozialisation (implizit zu implizit): Menschen kommunizieren direkt mit Menschen oder wenden den Wissensaustausch durch Erfahrungsaustausch an. Heutzutage werden viele fortschrittliche Technologien eingeführt, aber das Sozialisieren bleibt wichtig und kann nicht ersetzt werden.
  2. Externalisierung (implizit bis explizit): Zusammen mit der Erfindung des Schreibens kann Wissen vom Gehirn auf andere Medien wie z.B. Bücher, Videos usw. Dieser Vorgang wird als Externalisierung bezeichnet.
  3. Kombination (explizit zu explizit): Dieser Prozess besteht darin, das Wissen zu organisieren und Teile davon in neuen Formen zu kombinieren, damit es sinnvoller ist oder neue Erkenntnisse erklärt.
  4. Internalisierung (explizit zu implizit): Personen können neues Wissen erwerben, indem sie explizites Wissen wahrnehmen. Einmal verinnerlicht, kann neues Wissen wiederverwendet, dokumentiert oder an andere Personen weitergegeben werden.
26
Q

Skizziere das SECI-Modell

A

xxxxxx|implizit |explizit|
implizit|Sozialisation | Externalisierung |
explizit | Internalisierung |Kombination|

27
Q

Was sind moderne Textdokumente?

A

Textdokumente, die in weltweit verteilten Informationssystemen für die unterschiedlichen Nutzungsarten und Anwendungszwecke bereitgestellt werden.

28
Q

Was sind dynamisch-aktive Dokumente?

A

Sie enthalten aktive Komponenten, mit denen Leserinnen und Leser interagieren können. Es können sich auch der Inhalt und das Format dynamisch ändern.

29
Q

Erkläre die Inahltsebene (erste Ebene im Modell der strukturierten Dokumente).

A

Bezieht sich auf den Inhalt eines Dokuments.
Gemeint sind damit die rein textuellen Inhalte in Form von Buchstaben und Zeichen, die beim Verarbeiten / Lesen zu Wörtern zusammengesetzt und mit Bedeutung versehen werden.

30
Q

Was versteht man unter Semantik?

A

Die Belegung von Symbolen mit Bedeutungen wird Semantik genannt.

31
Q

Wie lautet die zweite Ebene der strukturierten Dokumente?

A

Die zweite Ebene (Strukturebene) bezeichnet die explizite Repräsentation der Struktur des Dokuments, die über das Einfügen von z. B. Markup realisiert wird.

32
Q

Wie lautet die dritte Ebene der strukturierten Dokumente?

A

Formatebene, die sich auf die Formatierung der bereits strukturierten Inhalte bezieht.
Das zu den Textelementen passende Format kann aus einer separaten Formatvorlage, auch Stylesheet genannt, erzeugt werden.

33
Q

Was sind Vorteile des Dokumentenmodells?

A
  • Flexibilität
34
Q

Welche drei Strukturdarstellungen gibt es?

A

1.) ineinander geschachtelte Rechtecke oder Boxen, die mit dem Namen des jeweiligen Elementes gekennzeichnet sind, genutzt.

2.) mit Einrückungen und Ikonen, könnte aus Dateibrowsern bereits bekannt sein.

3.) die logische Struktur als einen Baum darzustellen.

35
Q

Was ist ein Tag?

A

Markierung (engl. tag) im Text zu versehen und damit zu serialisieren.

Zu diesem Zweck wird jeder Textbereich, der Inhalt eines logischen Elementes ist, an seinem Anfang und an seinem Ende mit einer öffnenden und einer schließenden Markierung versehen, die den Namen des entsprechenden Strukturelementes enthält.

36
Q

Was versteht man unter eingebetteter Auszeichnung/ embedded Markup?

A

Da die Auszeichnungen mit im Text enthalten sind, wenn auch über syntaktische Konventionen vom eigentlichen Inhalt getrennt.

37
Q

Warum ist Repräsentation der hierarchischen Struktur durch ein-gebetteten Markup ist technisch am einfachsten zu handhaben? (Vor- und Nachteile)

A

Sie hat den Vorteil, dass Dokumente mit eingebettetem Markup mit jedem einfachen ASCII-Texteditor angesehen und bearbeitet werden können.

Die Darstellungsweise ist allerdings unübersichtlich und nicht sehr eingängig.

38
Q

Warum wird das Modell der strukturierten Dokumente eingesetzt?

A

Dokumente für die Computerverarbeitung vorzubereiten.

Die zentrale Idee ist, die Kerndaten des Dokuments redundanzfrei in einer Art Reinform vorzuhalten, wie man es auch beim Design relationaler Faktendatenbanken mit Normalformen verfolgt.

39
Q

Wozu dient das Modell der strukturierten Dokumente?

A

Inhalt und Struktur eines Dokumentes, auf denen die automatische Verarbeitung basieren soll, zu repräsentieren.

Dient als Werkzeug, um Texte zu gut zu verwaltenden Texten weiterzuentwickeln und die maschinelle Lesbarkeit und automatisierte Verarbeitung zu ermöglichen.

40
Q

Was ist ein wichtiger Anwendungsfall des Dokumentenmanagements?

A

Formatierung

41
Q

Wie unterscheiden sich die im Kurstext beschriebenen Konzepte zur grafischen Markierung der Strukturelemente eines Dokuments gegenüber der Markierung durch Auszeichnung?

A

Übereinstimmend wird in den Konzepten davon ausgegangen, dass die logische Strukturierung hierarchisch angelegt ist. Bei grafischen Konzepten wird die hierarchische Struktur grafisch dargestellt. Es gibt drei Varianten:

  • Bei der ersten Variante werden ineinander geschachtelte Rechtecke oder Boxen, die mit dem Namen des jeweiligen Elementes gekennzeichnet sind, genutzt.
  • Die zweite Variante verwendet zur Darstellung der Struktur Einrückungen und Icons.
  • Die dritte Variante besteht darin, die logische Struktur als einen Baum darzustellen.

Konzepte, die auf Markup basieren, bestehen darin, die hierarchische Struktur mittels einer sogenannten Markierung (engl. tag) im Text zu versehen: jeder Textbereich, der Inhalt eines logischen Elementes ist, wird an seinem Anfang und an seinem Ende mit einer öffnenden und einer schließenden Markierung versehen, die den Namen des entsprechenden Strukturelementes enthält.

Der Oberbegriff zu Markierungen und eventuellen weiteren Möglichkeiten, nicht zum Inhalt zählende Zeichen in einen Text einzustreuen, ist der Begriff Auszeichnung (engl. markup).

42
Q

Was ist glatter Text?

A

Dies ist eine Folge von elementaren Texteinheiten wie Buchstaben, Ziffern, Interpunktionszeichen und anderen Zeichen.
Diese Zeichen müssen letztendlich in Bits und Bytes kodiert werden. Eine Zeichen Codierung gibt dazu eine Vorschrift an.

43
Q

Was ist das Ziel von Unicode und ISO/IEC 10646

A

Das Ziel dieser beiden in einem Sinne, den wir noch genauer kennen lernen werden, äquivalenten Zeichen-Codierungen ist Universalität, also Texte aus sämtlichen Sprachen der Welt eindeutig zu codieren.

44
Q

Was sin die einzelnen Bestandteile des Codierungsmodells?

A
  • ein abstrakter Zeichensatz,
  • eine Codetabelle,
  • ein Codierungsformat,
  • ein Codierungsschema und
  • eine Übertragungssyntax, die über sogenannten „glatten Text“ hinausgeht.
45
Q

Was besteht zwischen einer abstrakten Repräsentationsebene und der nächstliegenden konkreteren Repräsentationsebene?

A

Eine Abbildungsvorschrift

46
Q

Was ist ein abstrakter Zeichensatz?

A

Dieser besteht aus einer Menge sogenannter abstrakter Zeichen. Ein abstrakter Zeichensatz beinhaltet jedoch noch keine Ordnung oder Nummerierung der im Zeichensatz enthaltenen Zeichen.

47
Q

Was ist ein abstraktes Zeichen?

A

Ein abstraktes Zeichen ist eine Informationseinheit, die zur Repräsentation, Organisation oder Kontrolle von Text dient. Es handelt sich hierbei also um Buchstaben, Ziffern, Interpunktionszeichen, Akzente, grafische Symbole, ideografische Zeichen, Leerzeichen, Tabulatoren, Zeilenweiterschaltung und -vorschub und Kontrollcodes für Auswahl-Markierungen.

48
Q

Wozu dienen abstrakte Zeichensätze?

A

Abstrakte Zeichensätze wurden in der Regel festgelegt, um alle Texte einer bestimmten Sprache oder Sprachfamilie angemessen zu codieren.

49
Q

Was nutzt man zur visuellen Repräsentation von Text?

A

Zur visuellen Präsentation von Text dienen abstrakte grafische Einheiten, die Glyphen genannt werden. Glyphen entsprechen auf der Präsentationsebene den Zeichen auf der Codierungsebene.

50
Q

Was bilden zusammenhängende Glyphenbilder?

A

Nach Design und anderen Charakteristika zusammengehörige Glyphenbilder bilden einen Font.

51
Q

Welches sind die Bestandteile des im Kurstext beschriebenen generischen Zeichensatzmodells?

A

Die einzelnen Bestandteile des Codierungsmodells sind:

· ein abstrakter Zeichensatz,
· eine Codetabelle,
· ein Codierungsformat,
· ein Codierungsschema und
· eine Übertragungssyntax

52
Q

Unicode beinhaltet für jedes in seiner Codetabelle kodierte Zeichen die folgenden Daten:

A
  • die Codeposition des Zeichens,
  • ein typisches Glyphenbild für das Zeichen,
  • einen Namen,
  • semantische Information.
53
Q

Beschreibe die Ebene des abstrakten Zeichensatzes:

A

Die obere Ebene des Codierungsmodells ist der abstrakte Zeichensatz. Dieser besteht aus einer Menge sogenannter abstrakter Zeichen. Es handelt sich hierbei um Buchstaben, Ziffern, Interpunktionszeichen, Akzente, grafische Symbole etc.

54
Q

Beschreibe die Ebene der Codetabelle:

A

An nächster Stelle des Codierungsmodells steht die Codetabelle, die den abstrakten Zeichen im Zeichensatz eine Codeposition zuweist. Eine Codeposition ist immer eine natürliche Zahl, also größer oder gleich 0. Der Code-Raum kann jedoch auch Zahlen enthalten, die keine zulässigen Codepositionen sind. Codepositionen werden üblicherweise in Hexadezimalnotation angegeben.

55
Q

Beschreibe die Ebene des Codierungsformats:

A

Mithilfe des Codierungsformats für eine Codetabelle werden die Bitrepräsentationen für die Codeposition festgelegt. Dazu gibt es eine Code-Einheit, die in der Regel aus acht oder sechzehn Bits besteht. Durch das Codierungsformat werden dann die Positionen eines Code-Raums in Sequenzen von Code-Einheiten und somit in Bitmuster abgebildet.

56
Q

Beschreibe die Ebene des Codierungsschemas:

A

Ein Codierungsschema wird nun dazu genutzt zu einem Codierungsformat zusätzlich festzulegen, wie die Codierungseinheiten in Bytefolgen zu serialisieren sind.

57
Q

Warum kann UTF8 sowohl als Codierungsformat als auch als Codierungsschema bezeichnet werden?

A

Ist die Codierungseinheit eines Codierungsformats selbst acht Bits lang, so ist nichts mehr festzulegen und das Codierungsschema ist mit dem Codierungsformat identisch. So kann also UTF8 sowohl als Codierungsformat als auch als Codierungsschema bezeichnet werden.

58
Q

Beschreibe die Ebene der Übertragungssyntax:

A

Zur Abgrenzung von Markup und Inhalt werden bestimmte Funktionszeichen eingesetzt, die dann außerhalb ihrer syntaktischen Rolle weder im Markup selbst noch im Inhalt des Klartextes vorkommen dürfen. In XML ist < ein solches Funktionszeichen, das den Anfang eines Tags charakterisiert. Das Zeichen < darf deswegen im Inhaltstext eines XML- Dokuments nicht vorkommen.

59
Q

Was ist die Funktion des sogenannten Byte-Reihenfolge-Kodierungszeichens (engl. Byte Order Mark, BOM)?

A

Mit dem BOM kann bei einem UTF16-repräsentierten Datenstrom signalisiert werden, welche der beiden Serialisierungen, höherwertiges Byte zuerst (engl. Big Endian) oder niederwertiges Byte zuerst (engl. Little Endian), vorliegt.

60
Q

Bei Big Endian wird das … in der …Adresse gespeichert.

A

signifikanteste Byte
kleinsten