Sem III (Data Science) - N1 Flashcards
Was versteht man unter Data Science?
Data Science befasst sich mit dem Analysieren von Daten und beinhaltet Schritte wie Beschaffung, Aufbereitung, Exploration, Modellierung und Interpretation.
Data Science занимается анализом данных и включает такие этапы, как сбор, подготовка, исследование, моделирование и интерпретация.
Warum ist Data Science eine Querschnittsdisziplin?
Sie kombiniert Programmierung, Statistik, Machine Learning und Fachwissen aus einem Anwendungsbereich.
Она объединяет программирование, статистику, машинное обучение и предметную экспертизу из конкретной области применения.
Was sind typische Datenquellen?
Daten kommen etwa aus Log‑Files, Texten (z. B. E‑Mails, Tweets), Sensoren, Bildern oder Videos.
Данные поступают, например, из лог‑файлов, текстов (например, электронных писем, твитов), датчиков, изображений или видео.
Welche Formen der Datenstruktur gibt es?
Man unterscheidet strukturierte, semi‑strukturierte, quasi‑strukturierte und unstrukturierte Daten.
Различают структурированные, полу‑структурированные, квази‑структурированные и неструктурированные данные.
Welche Einschränkungen können bei Datenanalysen auftreten?
Daten sind nicht objektiv; sie liefern nur Annäherungen. Methoden, Stichprobenauswahl, fehlende Werte oder Bias beeinflussen das Ergebnis.
Данные не являются объективными; они дают лишь приближения. Используемые методы, выборка, пропущенные значения или смещения влияют на результат.
Welche typischen Fehlerquellen in Daten gibt es?
Fehlende Werte, falsche Beschriftungen, Inkonsistenz und Tippfehler sind häufige Probleme.
Частыми проблемами являются пропущенные значения, неверные метки, несогласованность и опечатки.
Was bezeichnet der Begriff „Big Data“?
Er steht für Datenmengen, die zu groß oder komplex für klassische Datenbanksysteme sind, und umfasst zugleich ein kulturelles Phänomen im Umgang mit Daten.
Он обозначает объёмы данных, которые слишком велики или сложны для классических СУБД, и одновременно культурный феномен обращения с данными.
Was versteht man unter „Datafication“?
Damit ist gemeint, dass immer mehr Lebensbereiche in Form von Daten erfasst und quantifiziert werden.
Под этим понимается, что всё больше сфер жизни фиксируется и количественно описывается в виде данных.
Worin besteht „Maschinelles Lernen“?
ML optimiert Modellparameter mithilfe von Trainingsdaten, um Vorhersagen zu treffen oder Wissen aus Daten zu gewinnen.
Машинное обучение оптимизирует параметры моделей с помощью обучающих данных, чтобы делать прогнозы или извлекать знания из данных.
Welche Hauptaufgaben hat die Statistik in der Datenanalyse?
Deskription, Exploration sowie Induktion für wahrscheinlichkeitstheoretische Rückschlüsse.
Описательная статистика, исследовательский анализ и индукция для вероятностных выводов.
Was ist mit „Statistical Computing“ gemeint?
Die Verbindung von statistischen Methoden, Computertechnologie und Fachwissen, um Daten in verwertbare Informationen zu überführen.
Это сочетание статистических методов, компьютерных технологий и предметной экспертизы для превращения данных в полезную информацию.
Warum ist Domänenwissen in der Datenwissenschaft wichtig?
Es hilft, Fragestellungen und Ergebnisse korrekt zu interpretieren und sinnvolle Analysen durchzuführen.
Оно помогает правильно формулировать вопросы, интерпретировать результаты и проводить осмысленный анализ.
Nenne drei Beispiele für praktische Anwendungen von Data Science.
Wettervorhersage, Suchmaschinen, autonome Fahrzeuge.
Прогноз погоды, поисковые системы, автономные транспортные средства.
Was ist ein Datensatz im Kontext der Datenanalyse?
Eine strukturierte Sammlung von Daten (z.B. in Tabellenform) mit Zeilen und Spalten.
Это структурированный набор данных (например, таблица) с строками и столбцами.
Welche drei Datenkategorien werden häufig unterschieden?
Strukturierte, quasi‑strukturierte und unstrukturierte Daten.
Структурированные, квази‑структурированные и неструктурированные данные.
Wodurch zeichnen sich strukturierte Daten aus?
Sie liegen in einem festen Format (z.B. Tabellen, CSV) mit klar definierten Spalten und Datentypen.
Они представлены в фиксированном формате (например, таблицы, CSV) с чётко определёнными столбцами и типами данных.
Was versteht man unter quasi‑strukturierten Daten?
Daten mit uneinheitlichem, teils festgelegtem Format (z.B. Logfiles, Clickstreams).
Данные с неоднородным, частично фиксированным форматом (например, лог‑файлы, кликовые потоки).
Was sind unstrukturierte Daten?
Daten ohne ein einheitliches Schema (z.B. Bilder, Videos, PDFs).
Данные без единой схемы (например, изображения, видео, PDF‑файлы).
Warum ist die Graphentheorie in der Data Science wichtig?
Sie hilft, Beziehungen und Muster in vernetzten Daten (z.B. soziale Netzwerke) zu erkennen.
Она помогает выявлять связи и паттерны в сетевых данных (например, в социальных сетях).
Was ist „supervised learning“?
Ein maschinelles Lernverfahren, bei dem Modelle anhand bekannter Eingabe‑Ausgabe‑Beispiele trainiert werden.
Машинное обучение с учителем, при котором модели обучаются на известных парах «вход–выход».
Welche Rolle spielt Datenanalyse im wissenschaftlichen Arbeitsprozess?
Sie liefert objektive Informationen, unterstützt Hypothesenbildung und ermöglicht fundierte Entscheidungen.
Она предоставляет объективную информацию, поддерживает формирование гипотез и позволяет принимать обоснованные решения.
Was ist das übergeordnete Lernziel der Vorlesung?
Die Studierenden sollen die Phasen eines Datenanalyse‑Prozesses sowie deren ZieleundMeilensteine sicher beherrschen.
Студенты должны уверенно владеть этапами процесса анализа данных, а также их целями и контрольными точками.
Welche Fach‑ und Soft‑Skills sind für Data Science laut Skript nötig?
Informatik, Mathematik, Statistik, MachineLearning, Domänenwissen, Kommunikation&Präsentation, Datenvisualisierung.
Информатика, математика, статистика, машинное обучение, предметная область, коммуникация и презентация, визуализация данных.
Nennen Sie die sechs Schritte des CRISP‑DM‑Modells.
Geschäftsverständnis →Datenverständnis →Datenpräparation →Modellierung →Evaluation →Bereitstellung.
Понимание бизнеса →понимание данных →подготовка данных →моделирование →оценка →внедрение.