Modulo 1 y 2 del curso Data Analyst Google Flashcards

(35 cards)

1
Q

¿Qué es un dato?/
What is a data point?

A

Un dato es una unidad básica de información que por sí sola no tiene significado hasta ser interpretada.

A basic unit of information that has no meaning on its own until interpreted.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

¿Qué es el análisis de datos? /
What is data analysis?

A

Es el proceso de examinar, limpiar y transformar datos para extraer información útil y tomar decisiones informadas.

The process of examining, cleaning, and transforming data to extract useful insights and support decision-making.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

¿Qué es la ciencia de datos?/
What is data science?

A

Es una disciplina que combina estadística, programación y conocimiento del dominio para modelar fenómenos, predecir resultados y descubrir patrones complejos en los datos.

A discipline that combines statistics, programming, and domain expertise to model phenomena, predict outcomes, and uncover complex patterns in data.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

¿Qué es el ecosistema de datos?/
What is a data ecosystem?

A

Es el conjunto de sistemas, herramientas, personas y procesos que interactúan para recopilar, procesar, analizar y usar datos.

A network of tools, systems, people, and processes that interact to collect, process, analyze, and use data.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

¿Qué es la mentalidad técnica?/
What is a technical mindset?

A

Es la habilidad para descomponer problemas complejos en partes pequeñas y manejables usando lógica y precisión.

The ability to break down complex problems into manageable parts using logic and accuracy.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

¿Qué es la toma de decisiones basada en datos?/
What is data-driven decision making?

A

Es el proceso de tomar decisiones guiadas por evidencia obtenida a través del análisis de datos.

Making decisions guided by evidence derived from data analysis.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

¿Cuál es el objetivo de la etapa “Preguntar”?/
What is the purpose of the “Ask” stage?

A

Comprender el problema y los objetivos del negocio para definir preguntas clave.

To understand the business problem and goals in order to define key questions.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

¿Qué se hace en la etapa “Preparar”?/
What happens during the “Prepare” stage?

A

Se recopilan datos relevantes desde múltiples fuentes para analizarlos posteriormente.

Relevant data is gathered from multiple sources for future analysis.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

¿Qué ocurre en la etapa “Procesar”?/
What happens during the “Process” stage?

A

Se limpian, validan y organizan los datos para garantizar su calidad y utilidad.

Data is cleaned, validated, and organized to ensure quality and usefulness.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

¿Qué se realiza en la etapa “Analizar”?

A

En esta etapa del análisis de datos, se exploran y examinan los datos a fondo para identificar patrones, tendencias, correlaciones y obtener insights significativos que ayuden a responder preguntas clave del negocio. Aquí se aplican técnicas estadísticas, visualizaciones y herramientas analíticas para comprender mejor la información.

In this stage of data analysis, the data is deeply explored and examined to identify patterns, trends, correlations, and gain meaningful insights that help answer key business questions. Statistical techniques, visualizations, and analytical tools are applied to better understand the information.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

¿Qué se busca en la etapa “Compartir”?

A

Comunicar hallazgos mediante visualizaciones e informes comprensibles.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

¿Qué implica la etapa “Actuar”?

A

Esta etapa implica tomar decisiones informadas o implementar acciones concretas basadas en los hallazgos obtenidos durante el análisis de datos. El objetivo es generar valor, mejorar procesos, resolver problemas o aprovechar oportunidades detectadas. Aquí es donde el análisis se traduce en impacto real.
Act
This stage involves making informed decisions or implementing concrete actions based on the findings from the data analysis. The goal is to create value, improve processes, solve problems, or capitalize on identified opportunities. This is where analysis translates into real-world impact.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

¿Qué es el pensamiento analítico?

A

Es la capacidad de descomponer problemas complejos y resolverlos con el apoyo de datos y tomar deciciones informadas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

¿Qué implica tener habilidades de visualización?

A

Poder representar gráficamente los datos para que sean comprensibles y útiles.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

¿Qué es la comunicación de datos?

A

Contar la historia detrás de los datos de manera clara y relevante para los stakeholders.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

¿Qué es el diseño de datos?

A

Organizar y estructurar datos para facilitar su análisis y reutilización.

17
Q

¿Qué es el análisis de brechas o Gap Analysis?

A

Tipo: Herramienta de diagnóstico estratégico

Técnica que compara el estado actual de un proceso, sistema o habilidad con el estado deseado, para identificar las diferencias (brechas) y diseñar un plan de acción que permita cerrar esas diferencias.

Ejemplo:
Una empresa desea que su equipo financiero use Python para modelos predictivos:

Estado actual: Solo dominan Excel y visualización básica.

Estado deseado: Aplicación de Python y técnicas de ML.

Brecha: Falta de conocimientos técnicos.

Acción: Cursos de Python, mentorías y práctica aplicada.

18
Q

¿Qué es la comprensión del contexto?

A

Tipo: Habilidad analítica / cognitiva

Definición:
Es la capacidad de identificar, interpretar y evaluar correctamente las circunstancias, variables y relaciones que rodean una situación, problema o información, para entender su significado real y tomar decisiones informadas.

Ejemplo:
Un analista de datos nota una baja en las ventas de un producto. En lugar de asumir que el producto es malo, investiga el contexto: descubre que hubo un cambio en la legislación que afectó su distribución. Comprender el contexto le permite explicar correctamente la causa y proponer soluciones más efectivas.

19
Q

¿Cuáles son las características del pensamiento analítico?

What are the characteristics of analytical thinking?

A

Visualización mental, enfoque estratégico, análisis de correlaciones, y atención tanto al panorama general como al detalle.
Mental visualization, strategic focus, correlation analysis, and attention to both the big picture and the details.

20
Q

¿Qué es la técnica de los 5 porqués?

A

Es una herramienta que consiste en preguntar “¿Por qué?” repetidamente para encontrar la causa raíz de un problema.
The 5 Whys technique is a tool used to identify the root cause of a problem. It consists of repeatedly asking “Why?” (typically five times) until the fundamental issue is uncovered.

21
Q

¿Cuál es el propósito de identificar la causa raíz?

A

Prevenir que el problema se repita en el futuro.

22
Q

¿Qué es un Plan de Gestión de Datos (DMP)?

A

Es un documento que describe cómo se organizarán, describirán, almacenarán y protegerán los datos.

23
Q

¿Qué ventajas ofrece un DMP?

A

Valida el trabajo, evita duplicación, facilita acceso y recuperación, y promueve el uso de metadata.

24
Q

¿Qué es el ciclo de vida de los datos?

A
  1. Planificar:
    Decidir qué datos se necesitan, por qué y cómo se usarán.
    Plan:
    Decide what data is needed, why, and how it will be used.
  2. Capturar:
    Recolectar los datos desde diversas fuentes, como encuestas, sensores o registros digitales.
    Capture:
    Gather data from various sources such as surveys, sensors, or digital records.
  3. Gestionar:
    Organizar, proteger y almacenar los datos adecuadamente para asegurar su calidad y accesibilidad.
    Manage:
    Organize, protect, and store the data properly to ensure its quality and accessibility.
  4. Analizar:
    Examinar los datos para extraer información útil y tomar decisiones informadas.
    Analyze:
    Use the data to uncover insights and support decision-making.
  5. Archivar:
    Guardar los datos que siguen siendo valiosos, pero que ya no se usan con frecuencia.
    Archive:
    Keep data that is still valuable but no longer used regularly.
  6. Destruir:
    Eliminar de forma segura los datos que ya no son útiles ni necesarios.
    Destroy:
    Securely remove data that is no longer needed or useful.
25
¿Cuáles son los métodos de adquisición de datos?
Recopilación, transformación, intercambio y compra de datos. Aquí tienes la traducción al inglés: Collection, transformation, exchange, and purchase of data.
26
¿Qué es un acuerdo de compartición de datos?
Contrato que define cómo y qué datos serán compartidos entre partes.
27
¿Qué hace un data steward?
Es responsable del manejo adecuado del ciclo de vida de los datos. It is responsible for the proper management of the data lifecycle.
28
¿Qué son los SOPs en gestión de datos?
SOP en análisis de datos: Procedimientos operativos estándar que definen cómo deben realizarse tareas específicas relacionadas con el manejo, procesamiento y análisis de datos, para asegurar consistencia, calidad y cumplimiento. SOP in data analysis: Standard operating procedures that define how specific tasks related to data handling, processing, and analysis should be performed, ensuring consistency, quality, and compliance.
29
Ejemplo de SOP en análisis de datos
Recolección de datos Instrucciones sobre cómo y desde dónde se deben recolectar los datos (fuentes, formatos, frecuencia). Guidelines for how and from where data should be collected (sources, formats, frequency). Limpieza de datos (Data Cleaning) Pasos estandarizados para identificar y corregir errores, duplicados o valores faltantes. Standard steps to identify and fix errors, duplicates, or missing values. Validación de calidad de datos Procedimientos para verificar que los datos cumplen con criterios de integridad, precisión y coherencia. Procedures to check that data meets integrity, accuracy, and consistency criteria. Almacenamiento y organización de datos Cómo deben guardarse los datos (nombres de archivos, estructura de carpetas, formatos). How data should be stored (file naming, folder structure, formats). Acceso y control de versiones Quién puede acceder a qué datos y cómo se gestionan las versiones actualizadas. Who can access which data and how updated versions are managed. Análisis y generación de reportes Metodología a seguir para realizar análisis y documentar hallazgos en reportes estándar. Methodology to follow for performing analysis and documenting findings in standard reports. Protección de datos sensibles Procedimientos para anonimizar, cifrar o proteger datos personales o confidenciales. Procedures for anonymizing, encrypting, or protecting personal or sensitive data.
30
¿Qué medidas de seguridad se usan en la gestión de datos?
Encriptación de los datos en tránsito y en reposo. Encryption of data in transit and at rest. Copias de seguridad automáticas para prevenir pérdidas. Automatic backups to prevent data loss. Validaciones periódicas para asegurar la integridad de los datos. Regular validations to ensure data integrity. Definición clara de roles y permisos para evitar accesos no autorizados. Clear definition of roles and permissions to prevent unauthorized access.
31
¿Qué diferencia hay entre una hoja de cálculo y una base de datos?
Hojas de calculo: Son para datos pequeños, es accesible por softwares, los datos se ordenan en filas y columna, se limita por cantidad de datos. Spreadsheets: Used for small data sets, accessible through software, data is organized in rows and columns, limited by data capacity. Base de datos: Se necesita un lenguaje de manejo, datos en reglas y relaciones, maneja enorme cantidad de datos, tiene muchos usuarios. Databases: Require a management language, data follows rules and relationships, handle large amounts of data, support many users.
32
¿Qué es una función en una hoja de cálculo?
Una operación predefinida como =SUM().
33
¿Qué es una fórmula?
Una combinación de funciones, operadores y referencias (por ejemplo, =A1+B1).
34
¿Qué es una consulta o query?
Una solicitud para obtener información específica desde una base de datos.
35
¿Qué es SQL?
Es el lenguaje estructurado para consultar, insertar, actualizar o eliminar datos en bases de datos relacionales.