Web Scraping Flashcards

ev

1
Q

Screen Scraping

A
  • URL-Liste, URL-Muster

- Crawling, Spidering

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Schritte beim Web Scraping

A
  1. Design passend wählen
  2. Qualität: Verständnis über Primärquelle
  3. Methode passend wählen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Grundsätzliche Hürden im Web Scraping

A
  • Ethik
  • Privatsphäre
  • Datenschutz
  • Wettbewerbsrecht
  • Copyright
  • Terms of use
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Schritte: Retrieval

A

Studie über Datenstrukturen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Schritte: Post-processing

A
Parsing
Cleaning
Structuring
Augmenting
Linking
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Schritte: Analysis

A
  • Handvercodung
  • Wortzählung
  • Netzwerkanalye
  • Sequenzzählung
  • Vergleich mit SImulation
  • Machine Learning
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Schritte: Storage + Publication

A
  • Benachrichtigungspflicht
  • Verknüpfung von Personen mit sensiblen Daten
  • Copyright beachten
  • Begrenzung der Weitergabe
How well did you know this?
1
Not at all
2
3
4
5
Perfectly