FLASH SALE ⚡

Aprovecha hasta 70% OFF y hasta 3 cuotas sin interés en CURSOS y CARRERAS

|

Hasta el 22/03 ⏰

FLASH SALE ⚡

Aprovecha hasta 70% OFF y hasta 3 cuotas sin interés en CURSOS y CARRERAS

|

Hasta el 22/03 ⏰

Hasta el 22/03 ⏰

FLASH SALE ⚡

Aprovecha hasta 70% OFF y hasta 3 cuotas sin interés en CURSOS y CARRERAS

Prompt engineering para data analysts: la skill que nadie enseña en bootcamps

Dan Patiño

AI Strategy & Innovation en Coderhouse

Data

Prompt engineering para data analysts: la skill que nadie enseña en bootcamps

Publicado el

El prompt engineering para data analysts ya no es un tema opcional ni futurista: es una habilidad que separa a los analistas que entregan valor rápido de los que siguen atascados en tareas repetitivas. Si sabés formular buenas preguntas a una IA generativa, podés acelerar tu análisis exploratorio, generar SQL funcional en segundos y comunicar insights con mucha más claridad. Este artículo te muestra exactamente cómo hacerlo, con prompts reales que podés usar hoy.

¿Por qué prompt engineering se convirtió en una skill crítica para data analysts?

La respuesta corta: porque el mercado laboral ya lo está pidiendo. Según el Stack Overflow Developer Survey 2024, más del 62% de los profesionales de datos reportaron usar herramientas de IA generativa en su trabajo diario. Y un análisis de más de 500.000 job postings de LinkedIn y Indeed realizado por Lightcast en 2024 posicionó al prompt engineering como la sexta skill más demandada en roles de data analytics, superando a herramientas consolidadas como Tableau o Power BI en términos de crecimiento interanual.

Pero hay una paradoja: casi ningún bootcamp ni programa de formación tradicional enseña esta habilidad de forma sistemática. Se asume que "usar ChatGPT" es intuitivo, cuando en realidad existe una diferencia enorme entre un prompt genérico y uno que produce resultados accionables para el trabajo de datos.

McKinsey estima en su reporte The State of AI 2024 que las organizaciones que integran IA generativa en flujos de trabajo analíticos reducen hasta un 40% el tiempo dedicado a tareas de preparación y exploración de datos. Eso no sucede solo por tener acceso a las herramientas: sucede cuando los analistas saben cómo comunicarse con ellas.

Los tres usos más poderosos de GenAI para analistas de datos

Hay tres áreas donde el prompt engineering genera el mayor impacto inmediato para un data analyst: el análisis exploratorio de datos (EDA), la generación y depuración de SQL, y la presentación de insights para audiencias no técnicas. Vamos una por una, con prompts reales.

1. Análisis exploratorio de datos (EDA) asistido por IA

El EDA suele consumir entre el 60% y el 70% del tiempo de un proyecto de datos, según Gartner. Gran parte de ese tiempo se va en tareas mecánicas: revisar valores nulos, identificar outliers, entender distribuciones. Aquí es donde un buen prompt puede ahorrarte horas.

El error más común es pedirle a la IA que "analice el dataset". Ese prompt es demasiado vago. La clave está en darle contexto, estructura y un rol específico.

Prompt para EDA inicial (listo para usar):

Actuá como un data analyst senior con experiencia en [industria, ej: e-commerce].
Tengo un dataset con las siguientes columnas: [lista las columnas y sus tipos de datos].
El objetivo del análisis es [ej: entender patrones de abandono de carrito].

Por favor:
1. Identificá las 5 preguntas analíticas más relevantes para este objetivo.
2. Sugerí qué variables deberían explorarse primero y por qué.
3. Indicá qué tipos de visualizaciones serían más útiles para cada variable clave.
4. Mencioná posibles problemas de calidad de datos que debería revisar

Actuá como un data analyst senior con experiencia en [industria, ej: e-commerce].
Tengo un dataset con las siguientes columnas: [lista las columnas y sus tipos de datos].
El objetivo del análisis es [ej: entender patrones de abandono de carrito].

Por favor:
1. Identificá las 5 preguntas analíticas más relevantes para este objetivo.
2. Sugerí qué variables deberían explorarse primero y por qué.
3. Indicá qué tipos de visualizaciones serían más útiles para cada variable clave.
4. Mencioná posibles problemas de calidad de datos que debería revisar

Actuá como un data analyst senior con experiencia en [industria, ej: e-commerce].
Tengo un dataset con las siguientes columnas: [lista las columnas y sus tipos de datos].
El objetivo del análisis es [ej: entender patrones de abandono de carrito].

Por favor:
1. Identificá las 5 preguntas analíticas más relevantes para este objetivo.
2. Sugerí qué variables deberían explorarse primero y por qué.
3. Indicá qué tipos de visualizaciones serían más útiles para cada variable clave.
4. Mencioná posibles problemas de calidad de datos que debería revisar

Actuá como un data analyst senior con experiencia en [industria, ej: e-commerce].
Tengo un dataset con las siguientes columnas: [lista las columnas y sus tipos de datos].
El objetivo del análisis es [ej: entender patrones de abandono de carrito].

Por favor:
1. Identificá las 5 preguntas analíticas más relevantes para este objetivo.
2. Sugerí qué variables deberían explorarse primero y por qué.
3. Indicá qué tipos de visualizaciones serían más útiles para cada variable clave.
4. Mencioná posibles problemas de calidad de datos que debería revisar

Este prompt funciona porque le asigna un rol a la IA, le da contexto de negocio, especifica el objetivo y pide una respuesta estructurada. La diferencia con un prompt genérico es notable.

Prompt para interpretar resultados estadísticos:

Tengo estos resultados de un análisis descriptivo de mi dataset:
- Media: 245, Mediana: 189, Desviación estándar: 312
- El 15% de los valores son nulos en la columna "ticket_promedio"
- Hay 3 valores que superan 10 veces el promedio

Actuá como un analista de datos. Explicá qué implican estos resultados,
si la distribución parece normal o sesgada, y qué pasos de limpieza recomendarías
antes de continuar el análisis. Usá un lenguaje claro, sin fórmulas

Tengo estos resultados de un análisis descriptivo de mi dataset:
- Media: 245, Mediana: 189, Desviación estándar: 312
- El 15% de los valores son nulos en la columna "ticket_promedio"
- Hay 3 valores que superan 10 veces el promedio

Actuá como un analista de datos. Explicá qué implican estos resultados,
si la distribución parece normal o sesgada, y qué pasos de limpieza recomendarías
antes de continuar el análisis. Usá un lenguaje claro, sin fórmulas

Tengo estos resultados de un análisis descriptivo de mi dataset:
- Media: 245, Mediana: 189, Desviación estándar: 312
- El 15% de los valores son nulos en la columna "ticket_promedio"
- Hay 3 valores que superan 10 veces el promedio

Actuá como un analista de datos. Explicá qué implican estos resultados,
si la distribución parece normal o sesgada, y qué pasos de limpieza recomendarías
antes de continuar el análisis. Usá un lenguaje claro, sin fórmulas

Tengo estos resultados de un análisis descriptivo de mi dataset:
- Media: 245, Mediana: 189, Desviación estándar: 312
- El 15% de los valores son nulos en la columna "ticket_promedio"
- Hay 3 valores que superan 10 veces el promedio

Actuá como un analista de datos. Explicá qué implican estos resultados,
si la distribución parece normal o sesgada, y qué pasos de limpieza recomendarías
antes de continuar el análisis. Usá un lenguaje claro, sin fórmulas

2. Generación y depuración de SQL con prompts precisos

SQL sigue siendo el lenguaje más utilizado en data analytics, y la IA generativa lo transforma radicalmente. No se trata de reemplazar el conocimiento de SQL, sino de acelerar la escritura de queries complejas y depurar errores en segundos.

El truco está en darle a la IA el esquema de tus tablas y ser muy específico sobre lo que necesitás.

Prompt para generar SQL desde cero:

Tengo las siguientes tablas en una base de datos PostgreSQL:

- orders (order_id, user_id, created_at, total_amount, status)
- users (user_id, country, registration_date, plan_type)
- products (product_id, order_id, category, price, quantity)

Necesito una query que:
1. Calcule el revenue total por país en los últimos 90 días.
2. Solo incluya órdenes con status = 'completed'.
3. Muestre también el ticket promedio y la cantidad de órdenes por país.
4. Ordene los resultados de mayor a menor revenue.

Incluí comentarios en el código explicando cada parte del query

Tengo las siguientes tablas en una base de datos PostgreSQL:

- orders (order_id, user_id, created_at, total_amount, status)
- users (user_id, country, registration_date, plan_type)
- products (product_id, order_id, category, price, quantity)

Necesito una query que:
1. Calcule el revenue total por país en los últimos 90 días.
2. Solo incluya órdenes con status = 'completed'.
3. Muestre también el ticket promedio y la cantidad de órdenes por país.
4. Ordene los resultados de mayor a menor revenue.

Incluí comentarios en el código explicando cada parte del query

Tengo las siguientes tablas en una base de datos PostgreSQL:

- orders (order_id, user_id, created_at, total_amount, status)
- users (user_id, country, registration_date, plan_type)
- products (product_id, order_id, category, price, quantity)

Necesito una query que:
1. Calcule el revenue total por país en los últimos 90 días.
2. Solo incluya órdenes con status = 'completed'.
3. Muestre también el ticket promedio y la cantidad de órdenes por país.
4. Ordene los resultados de mayor a menor revenue.

Incluí comentarios en el código explicando cada parte del query

Tengo las siguientes tablas en una base de datos PostgreSQL:

- orders (order_id, user_id, created_at, total_amount, status)
- users (user_id, country, registration_date, plan_type)
- products (product_id, order_id, category, price, quantity)

Necesito una query que:
1. Calcule el revenue total por país en los últimos 90 días.
2. Solo incluya órdenes con status = 'completed'.
3. Muestre también el ticket promedio y la cantidad de órdenes por país.
4. Ordene los resultados de mayor a menor revenue.

Incluí comentarios en el código explicando cada parte del query

Prompt para depurar un error en SQL:

Tengo este query en SQL que está dando error:
[pegá el query completo]

El error que recibo es: [pegá el mensaje de error exacto]
Mi base de datos es: [ej: MySQL 8.0 / BigQuery / Snowflake]

Por favor:
1. Identificá la causa del error.
2. Corregí el query.
3. Explicá brevemente qué estaba mal para que pueda evitarlo en el futuro

Tengo este query en SQL que está dando error:
[pegá el query completo]

El error que recibo es: [pegá el mensaje de error exacto]
Mi base de datos es: [ej: MySQL 8.0 / BigQuery / Snowflake]

Por favor:
1. Identificá la causa del error.
2. Corregí el query.
3. Explicá brevemente qué estaba mal para que pueda evitarlo en el futuro

Tengo este query en SQL que está dando error:
[pegá el query completo]

El error que recibo es: [pegá el mensaje de error exacto]
Mi base de datos es: [ej: MySQL 8.0 / BigQuery / Snowflake]

Por favor:
1. Identificá la causa del error.
2. Corregí el query.
3. Explicá brevemente qué estaba mal para que pueda evitarlo en el futuro

Tengo este query en SQL que está dando error:
[pegá el query completo]

El error que recibo es: [pegá el mensaje de error exacto]
Mi base de datos es: [ej: MySQL 8.0 / BigQuery / Snowflake]

Por favor:
1. Identificá la causa del error.
2. Corregí el query.
3. Explicá brevemente qué estaba mal para que pueda evitarlo en el futuro

Este último punto es fundamental: pedirle una explicación a la IA es lo que convierte la interacción en aprendizaje real, no en dependencia.

Prompt para optimizar performance de una query lenta:

Este query en BigQuery tarda más de 3 minutos en ejecutarse sobre una tabla
de 50 millones de filas:
[pegá el query]

Analizá el query e identificá posibles cuellos de botella de performance.
Sugerí optimizaciones concretas (índices, particionado, reescritura de subconsultas,
uso de WITH/CTEs) con una breve explicación de por qué cada cambio mejoraría la velocidad

Este query en BigQuery tarda más de 3 minutos en ejecutarse sobre una tabla
de 50 millones de filas:
[pegá el query]

Analizá el query e identificá posibles cuellos de botella de performance.
Sugerí optimizaciones concretas (índices, particionado, reescritura de subconsultas,
uso de WITH/CTEs) con una breve explicación de por qué cada cambio mejoraría la velocidad

Este query en BigQuery tarda más de 3 minutos en ejecutarse sobre una tabla
de 50 millones de filas:
[pegá el query]

Analizá el query e identificá posibles cuellos de botella de performance.
Sugerí optimizaciones concretas (índices, particionado, reescritura de subconsultas,
uso de WITH/CTEs) con una breve explicación de por qué cada cambio mejoraría la velocidad

Este query en BigQuery tarda más de 3 minutos en ejecutarse sobre una tabla
de 50 millones de filas:
[pegá el query]

Analizá el query e identificá posibles cuellos de botella de performance.
Sugerí optimizaciones concretas (índices, particionado, reescritura de subconsultas,
uso de WITH/CTEs) con una breve explicación de por qué cada cambio mejoraría la velocidad

3. Traducir insights técnicos en historias para stakeholders

Uno de los mayores problemas de los data analysts es comunicar sus hallazgos a audiencias no técnicas. Un número sin contexto no mueve decisiones. Aquí la IA generativa es increíblemente útil para transformar conclusiones técnicas en narrativas accionables.

Prompt para convertir resultados en un executive summary:

Soy data analyst y tengo los siguientes hallazgos de mi análisis:
[describí tus findings en lenguaje técnico]

El público que va a leer este reporte es: [ej: gerentes de marketing sin
background técnico].
El objetivo del negocio es: [ej: reducir el churn en 15% en Q3].

Escribí un resumen ejecutivo de máximo 200 palabras que:
- Empiece con el hallazgo más importante
- Use métricas concretas sin jerga técnica
- Termine con una recomendación accionable clara
- Use un tono profesional pero directo
Soy data analyst y tengo los siguientes hallazgos de mi análisis:
[describí tus findings en lenguaje técnico]

El público que va a leer este reporte es: [ej: gerentes de marketing sin
background técnico].
El objetivo del negocio es: [ej: reducir el churn en 15% en Q3].

Escribí un resumen ejecutivo de máximo 200 palabras que:
- Empiece con el hallazgo más importante
- Use métricas concretas sin jerga técnica
- Termine con una recomendación accionable clara
- Use un tono profesional pero directo
Soy data analyst y tengo los siguientes hallazgos de mi análisis:
[describí tus findings en lenguaje técnico]

El público que va a leer este reporte es: [ej: gerentes de marketing sin
background técnico].
El objetivo del negocio es: [ej: reducir el churn en 15% en Q3].

Escribí un resumen ejecutivo de máximo 200 palabras que:
- Empiece con el hallazgo más importante
- Use métricas concretas sin jerga técnica
- Termine con una recomendación accionable clara
- Use un tono profesional pero directo
Soy data analyst y tengo los siguientes hallazgos de mi análisis:
[describí tus findings en lenguaje técnico]

El público que va a leer este reporte es: [ej: gerentes de marketing sin
background técnico].
El objetivo del negocio es: [ej: reducir el churn en 15% en Q3].

Escribí un resumen ejecutivo de máximo 200 palabras que:
- Empiece con el hallazgo más importante
- Use métricas concretas sin jerga técnica
- Termine con una recomendación accionable clara
- Use un tono profesional pero directo

Prompt para preparar una presentación de datos:

Tengo que presentar estos resultados en una reunión de 15 minutos
con el equipo directivo:
[describí tus datos y conclusiones]

Creá una estructura de presentación con:
1. El título de cada slide y su propósito
2. El mensaje principal de cada slide en una oración
3. Qué visualización recomendarías para cada slide
4. Las 3 preguntas difíciles que probablemente me hagan y cómo responderlas
Tengo que presentar estos resultados en una reunión de 15 minutos
con el equipo directivo:
[describí tus datos y conclusiones]

Creá una estructura de presentación con:
1. El título de cada slide y su propósito
2. El mensaje principal de cada slide en una oración
3. Qué visualización recomendarías para cada slide
4. Las 3 preguntas difíciles que probablemente me hagan y cómo responderlas
Tengo que presentar estos resultados en una reunión de 15 minutos
con el equipo directivo:
[describí tus datos y conclusiones]

Creá una estructura de presentación con:
1. El título de cada slide y su propósito
2. El mensaje principal de cada slide en una oración
3. Qué visualización recomendarías para cada slide
4. Las 3 preguntas difíciles que probablemente me hagan y cómo responderlas
Tengo que presentar estos resultados en una reunión de 15 minutos
con el equipo directivo:
[describí tus datos y conclusiones]

Creá una estructura de presentación con:
1. El título de cada slide y su propósito
2. El mensaje principal de cada slide en una oración
3. Qué visualización recomendarías para cada slide
4. Las 3 preguntas difíciles que probablemente me hagan y cómo responderlas

Técnicas avanzadas de prompt engineering para datos

Más allá de los prompts individuales, hay técnicas que elevan significativamente la calidad de las respuestas.

Chain-of-thought prompting para análisis complejos

Pedirle a la IA que "piense paso a paso" antes de responder mejora notablemente la calidad del output en problemas analíticos complejos. Por ejemplo: "Antes de responder, analizá el problema paso a paso y luego dame tu conclusión final". Esta técnica, documentada en investigaciones de Google DeepMind, reduce los errores de razonamiento en tareas matemáticas y lógicas.

Few-shot prompting con ejemplos de tu contexto

Incluir ejemplos del tipo de output que esperás transforma radicalmente los resultados. Si querés que la IA genere naming consistente para tus columnas SQL, mostrale dos o tres ejemplos de tu convención antes de pedirle que genere más. La IA aprende el patrón y lo replica.

Iterar y refinar: el prompt no es un comando único

El mayor error es tratar a la IA como una máquina de respuesta única. Los mejores resultados vienen de conversaciones iterativas: empezás con un prompt base, evaluás el output, y refinás con instrucciones específicas como "El análisis está bien, pero quiero que sea más conciso y que priorices los insights de negocio sobre los técnicos".

Cómo construir tu propio "prompt library" como analista

Los analistas más productivos que trabajan con IA mantienen una biblioteca personal de prompts probados. La idea es simple: cada vez que des con un prompt que produce excelentes resultados, lo guardás en una nota, Notion o Google Doc con etiquetas por caso de uso (EDA, SQL, visualización, comunicación).

Con el tiempo, esta biblioteca se convierte en un activo profesional. Podés compartirla con tu equipo, adaptarla para nuevos proyectos y usarla como base para onboarding de nuevos analistas. GitHub ya tiene repositorios públicos con miles de prompts especializados para data, y mantener el tuyo propio te diferencia como profesional.

Un framework sencillo para estructurar cada prompt en tu biblioteca:

  • Rol: Qué perfil debe asumir la IA

  • Contexto: Información relevante del proyecto o industria

  • Tarea: Qué necesitás que haga, en pasos numerados

  • Formato: Cómo querés que entregue el resultado

  • Restricciones: Qué debe evitar (jerga, longitud excesiva, etc.)

El futuro: prompt engineering como ventaja competitiva en data

Según el GitHub Octoverse 2024, los desarrolladores y analistas que usan IA asistida terminan tareas de código hasta un 55% más rápido. Pero el dato más revelador es cualitativo: quienes saben formular buenos prompts no solo trabajan más rápido, sino que abordan problemas más complejos porque pueden explorar hipótesis en minutos que antes llevaban días.

El prompt engineering no reemplaza el criterio analítico, el conocimiento del negocio ni la capacidad de hacer las preguntas correctas. Lo que hace es amplificar esas capacidades. Un analista con sólidas bases en estadística, SQL y storytelling con datos que además domina prompt engineering tiene una ventaja competitiva difícil de replicar.

Las empresas más avanzadas ya están codificando esta habilidad en sus job descriptions. Según datos de Burning Glass Technologies compilados en 2024, las ofertas laborales para data analysts que mencionan explícitamente "prompt engineering" o "GenAI" ofrecen salarios entre un 18% y un 25% más altos que las que no lo incluyen.

Llevá estas habilidades al siguiente nivel con Coderhouse

Si este artículo te mostró que hay mucho más por aprender en la intersección entre data analytics e inteligencia artificial generativa, el camino más estructurado para hacerlo es con guía experta y práctica real. En Coderhouse encontrás cursos de Data Analytics, SQL, Python para datos e Inteligencia Artificial diseñados para que puedas aplicar lo aprendido desde el primer día. Los programas combinan fundamentos sólidos con las herramientas más demandadas del mercado actual, incluyendo el trabajo con IA generativa en flujos de análisis reales. Explorá la oferta de cursos y empezá a construir la carrera en datos que el mercado está buscando.

Preguntas frecuentes sobre prompt engineering para data analysts

¿Qué es exactamente el prompt engineering en el contexto de data analytics?

El prompt engineering en data analytics es la habilidad de formular instrucciones precisas y estructuradas para herramientas de IA generativa (como ChatGPT, Claude o Gemini) de modo que produzcan outputs útiles para el trabajo de datos: queries SQL, análisis exploratorios, interpretaciones estadísticas o reportes para stakeholders. No se trata de programar, sino de comunicarse efectivamente con la IA usando contexto, roles y estructuras claras.

¿Necesito saber programar para usar prompt engineering en datos?

No es un requisito, pero tener conocimientos de SQL, Python o estadística mejora significativamente la calidad de tus prompts y tu capacidad de evaluar si el output de la IA es correcto. El prompt engineering complementa el conocimiento técnico, no lo reemplaza. Un analista sin bases técnicas que usa IA puede obtener respuestas incorrectas sin darse cuenta.

¿Cuáles son las herramientas de IA más útiles para data analysts hoy?

Las más adoptadas en 2025 son ChatGPT (especialmente GPT-4o), Claude de Anthropic, GitHub Copilot para generación de código y SQL, y Gemini de Google integrado con BigQuery. Para análisis exploratorio con interfaz visual, herramientas como Julius AI o ChatCSV permiten subir datasets directamente y dialogar con los datos sin necesidad de código.

¿Es seguro pegar datos reales en los prompts que envío a una IA?

Es una pregunta crítica. En general, no deberías pegar datos reales de clientes o información sensible en herramientas de IA públicas, ya que pueden ser usados para entrenar modelos. La práctica recomendada es anonimizar los datos, usar datos de muestra sintéticos o trabajar con versiones enterprise de estas herramientas (como ChatGPT Enterprise o Azure OpenAI) que ofrecen garantías de privacidad de datos corporativos.

¿Cuánto tiempo lleva aprender prompt engineering para datos?

Con práctica consistente, podés dominar los prompts fundamentales para EDA, SQL y presentación de insights en dos a cuatro semanas. El nivel avanzado —que incluye técnicas como chain-of-thought, few-shot prompting y construcción de sistemas de prompts encadenados— toma algunos meses de práctica aplicada en proyectos reales. Lo importante es practicar con casos concretos de tu trabajo, no solo con ejercicios teóricos.

¿El prompt engineering seguirá siendo relevante cuando los modelos de IA mejoren?

Sí, aunque evolucionará. Los modelos más avanzados requieren prompts menos detallados para tareas simples, pero el gap de calidad entre prompts bien formulados y genéricos persiste en tareas complejas. Además, habilidades como saber qué preguntarle a la IA, cómo evaluar sus respuestas y cómo integrarla en flujos de trabajo profesionales seguirán siendo competencias humanas irreemplazables independientemente de cuán potente sea la tecnología.

Sobre el autor

Dan Patiño

Soy Dan Patiño, responsable de AI Strategy & Innovation en Coderhouse. Mi día a día consiste en fusionar la gestión táctica del e-commerce (CRO, Email Marketing y SEO) con el desarrollo de soluciones disruptivas. Me especializo en crear apps internas con IA para automatizar tareas y potenciar la innovación dentro del equipo. Creo fielmente que la tecnología es el mejor aliado de la estrategia. Conecta conmigo en LinkedIn.

Estados Unidos

© 2026 Coderhouse. Todos los derechos reservados.

Estados Unidos

© 2026 Coderhouse. Todos los derechos reservados.

Estados Unidos

© 2026 Coderhouse. Todos los derechos reservados.

Estados Unidos

© 2026 Coderhouse. Todos los derechos reservados.