Web Scraping Flashcards
ev
1
Q
Screen Scraping
A
- URL-Liste, URL-Muster
- Crawling, Spidering
2
Q
Schritte beim Web Scraping
A
- Design passend wählen
- Qualität: Verständnis über Primärquelle
- Methode passend wählen
3
Q
Grundsätzliche Hürden im Web Scraping
A
- Ethik
- Privatsphäre
- Datenschutz
- Wettbewerbsrecht
- Copyright
- Terms of use
4
Q
Schritte: Retrieval
A
Studie über Datenstrukturen
5
Q
Schritte: Post-processing
A
Parsing Cleaning Structuring Augmenting Linking
6
Q
Schritte: Analysis
A
- Handvercodung
- Wortzählung
- Netzwerkanalye
- Sequenzzählung
- Vergleich mit SImulation
- Machine Learning
7
Q
Schritte: Storage + Publication
A
- Benachrichtigungspflicht
- Verknüpfung von Personen mit sensiblen Daten
- Copyright beachten
- Begrenzung der Weitergabe