Preguntas básicas como data analyst Flashcards
(17 cards)
¿Qué es lo primero que haces al iniciar un análisis de datos?
Definir claramente el problema o pregunta de negocio y comprender los objetivos del stakeholder.
¿Qué tipos de datos conoces?
Datos estructurados, no estructurados y semi-estructurados.
¿Qué herramientas has usado para análisis de datos?
Excel, SQL, Power BI/Tableau, Python (pandas, matplotlib), R, entre otros.
¿Qué entiendes por calidad de los datos?
Datos que son precisos, completos, consistentes, actualizados y relevantes.
¿Cómo manejas los valores nulos en un conjunto de datos?
Depende del contexto: los elimino, los imputo (media, mediana, modo) o los dejo si no afectan el análisis.
¿Qué es una tabla pivote?
Es una herramienta en hojas de cálculo para resumir, analizar y reorganizar datos.
¿Qué es una JOIN en SQL?
Es una operación que permite combinar filas de dos o más tablas en función de una columna relacionada.
¿Cuál es la diferencia entre INNER JOIN y LEFT JOIN?
INNER devuelve coincidencias exactas en ambas tablas. LEFT devuelve todas las filas de la izquierda, aunque no haya coincidencia en la derecha.
¿Qué herramientas usas para visualización de datos?
Power BI, Tableau, matplotlib, seaborn, Excel charts, etc.
¿Cómo decides qué tipo de gráfico usar?
Depende del tipo de variable y objetivo: líneas para tendencias, barras para categorías, scatter para correlación, etc.
¿Qué es contar una historia con datos?
Es estructurar los hallazgos de manera lógica, clara y visualmente efectiva para que otros comprendan y actúen.
¿Cómo te aseguras de que lo que estás analizando sea útil para el negocio?
Alineando mis análisis con los objetivos del negocio y validándolo constantemente con los stakeholders.
¿Qué harías si los datos contradicen la hipótesis del stakeholder?
Mostrar la evidencia de forma clara, abrir diálogo y proponer alternativas basadas en los datos.
¿Cómo priorizas tus tareas cuando tienes muchos proyectos?
Evalúo el impacto, la urgencia y los recursos requeridos, y mantengo comunicación constante con el equipo.
¿Cómo resuelves un problema cuando no conoces la herramienta o lenguaje requerido?
Investigo documentación, practico con ejemplos y busco apoyo en comunidades técnicas mientras aprendo en el proceso.
¿Has tenido que limpiar un dataset complicado? ¿Cómo lo hiciste?
Sí. Identifiqué duplicados, valores nulos, inconsistencias y apliqué transformaciones con herramientas como pandas y Excel.
¿Qué harías si los datos que tienes no son suficientes para responder una pregunta?
Identifico qué falta, busco fuentes alternas o propongo una aproximación basada en proxies de datos relevantes.