Forem: Keylin González

Las herramientas de AWS para construir con IA Generativa (y cuál usar según tu nivel)

Keylin González — Tue, 07 Apr 2026 15:46:46 +0000

TL;DR

AWS no solo te da acceso a modelos de IA. También te da herramientas para construir con ellos más rápido, sin importar si eres principiante o ya tienes experiencia.

En este post te explico las tres principales y cuándo usar cada una.

Contexto

En posts anteriores hablé sobre cuánto cuestan los modelos en Bedrock y cómo se comparan en la práctica.

Pero antes de escribir una sola línea de código, vale la pena conocer las herramientas que AWS pone a tu disposición para acelerar todo el proceso.

El ecosistema en tres niveles

Piénsalo así: AWS tiene herramientas para tres momentos distintos de tu camino con IA Generativa.

¿Quieres explorar una idea?     →  PartyRock
¿Quieres escribir código?       →  Amazon Q Developer / Kiro
¿Quieres construir la IA?       →  Amazon Bedrock

Vamos por partes.

1. PartyRock — Para explorar sin código

¿Qué es?

Un playground de IA sin código, construido sobre Amazon Bedrock. Puedes crear aplicaciones de IA arrastrando y conectando bloques, sin escribir una sola línea de código.

¿Cómo funciona?

Describes lo que quieres en lenguaje natural y PartyRock genera la app. Cada "bloque" es una funcionalidad: un chat, un generador de texto, un generador de imágenes, un campo de entrada. Los conectas entre sí y tienes una app funcional en minutos.

Ejemplo real:

Quieres una herramienta que tome el título de un blog y genere tres opciones de intro. En PartyRock: un bloque de input para el título, un bloque de texto conectado a un modelo, un prompt que diga "genera 3 intros para este título". Listo, sin código.

Precio:

Gratis con créditos diarios. No necesitas cuenta de AWS ni tarjeta de crédito. Entras en https://partyrock.aws y empiezas.

Cuándo usarlo:

Quieres probar una idea rápido antes de invertir tiempo en código.
Estás aprendiendo prompt engineering.
Quieres mostrarle algo a alguien sin montar infraestructura.

Cuándo NO usarlo:

Necesitas lógica personalizada o integraciones con otros sistemas.
Quieres algo en producción real.

2. Amazon Q Developer — Para escribir código más rápido

¿Qué es?

Un asistente de desarrollo con IA que vive dentro de tu IDE. Es el sucesor de Amazon CodeWhisperer, con capacidades ampliadas.

¿Qué puede hacer?

Sugerencias de código inline mientras escribes.
Chat dentro del IDE para hacer preguntas sobre tu código.
Generación de tests unitarios automáticamente.
Escaneo de seguridad en tu código.
Tareas más avanzadas donde puede analizar tu código y proponer implementaciones o cambios.

Lo que lo diferencia de otros asistentes:

Tiene conocimiento profundo de AWS. Si le preguntas cómo conectar una Lambda con DynamoDB, puede darte ejemplos alineados con buenas prácticas y configuraciones típicas de AWS.

Precio:

Free tier con uso mensual limitado (chat y acciones).
Pro: aproximadamente $19 USD/usuario/mes con mayor capacidad y funcionalidades para equipos.

Dónde funciona:

VS Code, JetBrains, Visual Studio, Eclipse y también en la terminal con AWS CLI.

Cuándo usarlo:

Ya sabes programar y quieres ir más rápido.
Trabajas con servicios de AWS.
Quieres asistencia para escribir, entender o revisar código.

3. Kiro — Para construir con estructura

¿Qué es?

Un IDE completo basado en Code OSS (la base open source de VS Code), lanzado por AWS en julio de 2025.

¿En qué se diferencia de Q Developer?

Q Developer es un asistente que vive dentro de tu IDE. Kiro es el IDE.

La diferencia más importante es el concepto de spec-driven development: en lugar de pedirle a la IA que escriba código directamente, primero convierte tu idea en una especificación estructurada (requisitos, diseño técnico, tareas de implementación) y luego trabaja sobre esa base.

Esto busca resolver un problema real del "vibe coding": cuando le pides a una IA que construya algo complejo de un solo prompt, el resultado suele ser código que funciona pero que es difícil de mantener. Kiro introduce un flujo donde primero se estructura el problema antes de implementar, aunque también permite distintos niveles de automatización según el caso.

Otras capacidades:

Automatización basada en eventos dentro del entorno de desarrollo.
Contexto persistente a nivel de proyecto para guiar al agente.
Agentes capaces de planificar y ejecutar tareas con distintos niveles de supervisión.
Integración con herramientas externas y fuentes de contexto (APIs, documentación, etc.).

Precio:

Free tier con uso limitado.
Planes pagos desde aproximadamente $20 USD/mes, con modelo basado en créditos y niveles de uso.

(Nota: inicialmente fue lanzado en preview gratuito en 2025 y su modelo de pricing ha evolucionado desde entonces.)

Cuándo usarlo:

Quieres construir algo más complejo que un script.
Te importa que el código sea mantenible, no solo que funcione.
Quieres trabajar con IA de forma más estructurada.
Estás desarrollando proyectos donde diseño y arquitectura son importantes.

4. Amazon Bedrock — Para construir la IA en sí

Ya lo cubrí en detalle en posts anteriores, pero para completar el mapa:

Amazon Bedrock es el servicio que te da acceso a modelos fundacionales a través de API.

Cuando tu aplicación necesita generar texto, analizar información, trabajar con imágenes o implementar funcionalidades de IA generativa, ahí es donde utilizas Bedrock.

PartyRock, Q Developer y Kiro son herramientas para construir. Bedrock es la capa de modelos que utilizas dentro de esas soluciones.

El mapa completo

Herramienta	Para quién	Requiere código	Precio base
PartyRock	Cualquiera	No	Gratis (créditos diarios)
Amazon Q Developer	Developers	Sí	Gratis (limitado) / ~$19 mes
Kiro	Developers	Sí	Gratis (limitado) / ~$20 mes
Amazon Bedrock	Developers	Sí	Pago por uso

¿Por dónde empezar?

Si estás comenzando con IA Generativa en AWS, esta es la ruta que recomiendo:

PartyRock para entender qué pueden hacer los modelos sin presión técnica
Amazon Q Developer o Kiro para empezar a escribir código con ayuda
Amazon Bedrock cuando quieras integrar IA en una aplicación real

No tienes que dominar todo antes de empezar. Cada herramienta tiene su momento.

En el próximo post vamos a hacer exactamente eso: tu primera llamada a Bedrock con Python, desde cero, en menos de 20 minutos.

💬 ¿Ya usaste alguna de estas herramientas? ¿Cuál fue tu experiencia?

📝 Posts anteriores:

Comparé Claude Haiku, Sonnet y Opus en AWS Bedrock: Haiku es 84% más barato

Keylin González — Wed, 11 Mar 2026 19:32:45 +0000

TL;DR

Lambda serverless que compara Claude Haiku 4.5 vs Sonnet 4.6 vs Opus 4.6 en AWS Bedrock.
Mide latencia, tokens y costo real en USD.

Resultado: Haiku es 84.5% más barato que Opus para tareas estándar.

📦 GitHub Repo | 💰 Costo por comparación: $0.044

Contexto

La semana pasada escribí sobre Precios de Bedrock: Lo que realmente vas a pagar.
Hoy los pongo a prueba con código real.

Arquitectura:

Test Event → Lambda (Python 3.14) → Bedrock Runtime
                                    ├─ Haiku 4.5
                                    ├─ Sonnet 4.6
                                    └─ Opus 4.6
                                         ↓
                              CloudWatch Logs (reporte)

Setup: 100% desde AWS Console (sin IaC).
Tiempo: ~15 min.

Recordatorio rápido: Lambda es el servicio serverless de AWS que ejecuta código sin gestionar servidores. CloudWatch Logs es donde Lambda registra toda su actividad (errores, prints, métricas).

Los resultados

Prompt: "¿Qué es AWS Lambda y cuándo usarlo?"

CloudWatch Logs:

════════════════════════════════════════════════════════════
🔬 BEDROCK MODEL COMPARISON — RESULTADOS
════════════════════════════════════════════════════════════
📝 Prompt: ¿Qué es AWS Lambda y cuándo usarlo?
────────────────────────────────────────────────────────────

🤖 Claude Haiku 4.5 (fast)
   ⏱️  Latencia:  6,967.7 ms
   🔢 Tokens:    23 in / 791 out / 814 total
   💰 Costo:     $0.003978

🤖 Claude Sonnet 4.6 (balanced)
   ⏱️  Latencia:  22,057.6 ms
   🔢 Tokens:    23 in / 950 out / 973 total
   💰 Costo:     $0.014319

🤖 Claude Opus 4.6 (powerful)
   ⏱️  Latencia:  21,979.2 ms
   🔢 Tokens:    23 in / 1024 out / 1047 total
   💰 Costo:     $0.025715

────────────────────────────────────────────────────────────
📊 RESUMEN
────────────────────────────────────────────────────────────
   🏆 Más rápido:  Claude Haiku 4.5 (6,967.7 ms)
   💸 Más barato:  Claude Haiku 4.5 ($0.003978)
   📝 Más extenso: Claude Opus 4.6
   💰 Costo total: $0.044012
   📉 Ahorro Haiku vs Opus: 84.5%
════════════════════════════════════════════════════════════

Tabla comparativa:

Modelo	Latencia	Tokens	Costo	vs Haiku
Haiku 4.5	7.0s	814	$0.003978	baseline
Sonnet 4.6	22.1s	973	$0.014319	3.6x más caro
Opus 4.6	22.0s	1047	$0.025715	6.5x más caro

Lo sorprendente

✅ Haiku generó una respuesta completa:

Guía estructurada con Markdown
Tabla de ventajas/desventajas
Ejemplos de código Python
Casos de uso y anti-patrones

❌ Opus NO justificó 6.5x el precio para este contenido.

🤔 Sonnet: Similar latencia a Opus, pero 3.6x más caro que Haiku. ¿Vale la pena?

Comparación de calidad

Extracto de Haiku:

# AWS Lambda: Guía Completa

## ¿Qué es AWS Lambda?

AWS Lambda es un servicio de **computación sin servidor (serverless)** que te permite ejecutar código sin provisionar ni administrar servidores. Solo pagas por el tiempo de ejecución real de tu código.

### Características principales:

- ⚡ Ejecución automática y escalable
- 💰 Pago por uso (duración + memoria)
- 🔄 Se ejecuta en respuesta a eventos
- 📦 Soporta múltiples lenguajes (Python, Node.js, Java, Go, C#, etc.)
- 🚀 Sin mantenimiento de infraestructura

Extracto de Sonnet:

# AWS Lambda

## ¿Qué es?

AWS Lambda es un servicio de **computación sin servidor** (*serverless*) que ejecuta código en respuesta a eventos, sin necesidad de aprovisionar ni administrar servidores.

Tu código → Evento lo dispara → Lambda ejecuta → Pagas solo por lo que usas

Extracto de Opus:

# AWS Lambda

## ¿Qué es?

**AWS Lambda** es un servicio de computación **serverless** (sin servidor) de Amazon Web Services que permite ejecutar código **sin aprovisionar ni administrar servidores**. Solo pagas por el tiempo de cómputo que consumes.

---

## ¿Cómo funciona?

Evento (trigger) → Lambda ejecuta tu función → Devuelve resultado

1. **Subes tu código** (Python, Node.js, Java, Go, C#, Ruby, etc.)
2. **Defines un trigger** (evento que dispara la función)
3. **Lambda se encarga del resto**: escalado, infraestructura, disponibilidad

Conclusión: Los tres modelos explican el concepto correctamente con estructura similar. Las diferencias en formato y énfasis no justifican 6.5x el costo para este tipo de tarea.

¿Cuándo usar cada modelo?

Haiku 4.5 → 80% de casos de uso

Chatbots
Clasificación de texto
Resúmenes
Traducciones
Generación de contenido educativo

Sonnet 4.6 → Equilibrio

Tareas que requieren mejor razonamiento
Cuando Haiku no es suficiente pero Opus es overkill

Opus 4.6 → Solo cuando sea crítico

Análisis legal o médico
Razonamiento complejo
Código de producción crítico
Prompts muy ambiguos

Cómo replicarlo

Repo: GitHub

Clona el repo
Abre guia_setup_aws.py
Sigue los 5 pasos (~15 min)
Prueba con tus propios prompts

Archivos:

bedrock-comparison/
├── lambda_handler.py       # Código de la Lambda
├── guia_setup_aws.py       # Setup paso a paso
└── README.md

Configuración Lambda:

Runtime: Python 3.14
Timeout: 1 min 30 seg
Memory: 128 MB

Costos:

Lambda: $0.00 (free tier)
Bedrock: ~$0.04 por comparación
Para gastar $1: necesitas ~33 invocaciones

Conclusión

Para la mayoría de aplicaciones, Haiku 4.5 es imbatible en calidad/precio.

Solo escala a Sonnet/Opus si tests A/B demuestran que la calidad extra justifica el costo.

💬 ¿Qué modelo usas tú? ¿Has notado diferencias de calidad que justifiquen el costo?

📦 GitHub Repo | 📝 Artículo anterior: Precios de Bedrock

Precios de Bedrock: Lo que realmente vas a pagar

Keylin González — Sat, 07 Mar 2026 04:06:18 +0000

Una pregunta que nos hacemos cuando estamos iniciando con los servicios de Inteligencia Artificial como Bedrock es: ¿Cuánto me va a costar esto?

Esto puede llegar a preocuparnos, especialmente si no tenemos mucha experiencia con AWS y asumimos que será costoso.

La verdad: probablemente gastes menos que en tu suscripción de Spotify.

Aquí te explico todo con los modelos Claude 4.5 disponibles en Bedrock y lo más importante: casos reales con números concretos 👇

1. Modelos de pricing en Bedrock

AWS Bedrock maneja dos modelos de cobro principales:

On-Demand (pago por uso)

Pagas únicamente por lo que consumes. Sin compromisos ni mínimos.

Hiciste 100 requests → pagas 100
Hiciste 10,000 requests → pagas 10,000

Batch Inference (50% de descuento)

Para procesos que no necesitan respuesta inmediata. Mismo resultado, mitad del precio.

Recomendación: Si estás comenzando, On-Demand es tu mejor opción.

2. Entendiendo los tokens

Bedrock cobra por "tokens", que son unidades de texto.

¿Cuánto es un token en español?

1 token ≈ 4 caracteres
1 token ≈ 0.75 palabras

Ejemplos prácticos:

"Hola, ¿cómo estás?" → ~6 tokens
Email de 200 palabras → ~270 tokens

Punto importante:

Se cobran tanto los tokens de input (lo que envías) como los de output (lo que recibes).

Ejemplo: Si envías una pregunta de 50 tokens y recibes una respuesta de 200 tokens, pagas por los 250 tokens en total.

3. Precios oficiales de Claude 4.5 en AWS Bedrock

Precios actuales en región us-east-1 (por 1,000 tokens):

Claude Sonnet 4.5

Input: $0.003 → $3 por millón de tokens
Output: $0.015 → $15 por millón de tokens
El mejor balance calidad-precio, recomendado.

Claude Haiku 4.5

Input: $0.001 → $1 por millón de tokens
Output: $0.005 → $5 por millón de tokens
80% más barato que Sonnet, excelente para alto volumen

Claude Opus 4.5

Input: $0.005 → $5 por millón de tokens
Output: $0.025 → $25 por millón de tokens
Máxima capacidad para tareas muy complejas

Funciones especiales para ahorrar

Batch Inference (todos los modelos)

50% de descuento en input y output
Ideal para procesos nocturnos o no urgentes

Prompt Caching

Cache write: Precio estándar de input
Cache read: Hasta 90% de descuento
Perfecto para chatbots con contexto repetido

4. Casos de uso con costos REALES

Caso 1: Chatbot de atención al cliente

Escenario:

1,000 conversaciones mensuales
10 mensajes por conversación (promedio)
~50 palabras por mensaje (67 tokens aprox)

Cálculo:

Input total: 670,000 tokens
Output total: 670,000 tokens

Modelo	Input	Output	Total/mes
Claude Sonnet 4.5	$2.01	$10.05	~$12
Claude Haiku 4.5	$0.67	$3.35	~$4
Haiku + Batch	-	-	~$2

💡 Menos que un café de Starbucks.

Caso 2: Generador de contenido para redes

Escenario:

100 posts al mes
Prompt: 100 palabras (~135 tokens)
Output: 150 palabras (~200 tokens)

Modelo	Costo mensual
Claude Sonnet 4.5	~$0.34
Claude Haiku 4.5	~$0.11

💡 Prácticamente gratis para el valor que aporta.

Caso 3: Análisis de documentos PDF

Escenario:

50 PDFs al mes
2,000 palabras por PDF (~2,700 tokens)
Resumen: 200 palabras (~270 tokens)

Modelo	Costo mensual
Claude Sonnet 4.5	~$0.61
Claude Haiku 4.5	~$0.20
Haiku + Batch	~$0.10

💡 Muchísimo más económico que hacerlo manualmente.

Caso 4: Análisis de codebase completo

Escenario:

1 análisis al mes
Codebase: 50,000 líneas (~200,000 tokens)
Documentación: 5,000 palabras (~6,700 tokens)

Con Claude Sonnet 4.5:

Primera vez: $0.70
Con Prompt Caching (siguientes veces): ~$0.15
Ahorro: 78%

5. ¿Qué modelo elegir?

Claude Haiku 4.5 ($1/$5 por millón)

Ideal para:

Prototipado rápido
Tareas simples
Alto volumen

Ventajas:

80% más barato que Sonnet
Extremadamente rápido
Rendimiento sorprendentemente bueno

Casos de uso:

Clasificación de texto
Respuestas cortas
Chatbots básicos
Análisis de sentimiento
Extracción de datos estructurados

Claude Sonnet 4.5 ($3/$15 por millón)

Ideal para:

90% de los casos de uso en producción

Ventajas:

Excelente balance calidad-precio
Casi al nivel de Opus en muchas tareas

Casos de uso:

Chatbots avanzados
Generación de contenido
Análisis de código
Automatización general
RAG (Retrieval Augmented Generation)

Claude Opus 4.5 ($5/$25 por millón)

Ideal para:

Análisis extremadamente complejos

Ventajas:

Máxima capacidad y razonamiento

Limitación:

5x más caro que Haiku

Casos de uso:

Análisis legal complejo
Investigación científica
Arquitectura de sistemas
Razonamiento profundo

Mi estrategia personal:

Prototipo con Haiku 4.5 (rápido y barato)
Si no cumple expectativas → paso a Sonnet 4.5
Solo uso Opus 4.5 cuando la calidad es absolutamente crítica
Para producción → combino modelos según la tarea

6. Funcionalidades que reducen costos

Batch Inference (50% de descuento)

¿Cuándo usarlo?
Cuando tu trabajo no necesita respuestas inmediatas.

Ejemplo práctico:

Procesar 1,000 documentos durante la noche
Precio normal (Sonnet 4.5): $12
Con Batch Inference: $6
Ahorro: $6/mes (50%)

Casos ideales:

Análisis de documentos nocturnos
Generación de reportes diarios
Procesamiento de datos históricos
Moderación de contenido en lotes

Prompt Caching (hasta 90% de ahorro)

¿Cuándo usarlo?
Cuando repites el mismo contexto frecuentemente.

Ejemplo práctico:

Chatbot con instrucciones de 5,000 tokens
Primera llamada: $0.015
Llamadas siguientes (con cache): $0.0015
Ahorro: 90% en el contexto

Casos ideales:

Chatbots con system prompts largos
Análisis de documentos con plantillas fijas
Aplicaciones con contexto constante
RAG con documentos base que no cambian

Context Caching Extended (ventanas de hasta 200K tokens)

Claude Sonnet 4.5 soporta ventanas de contexto enormes:

Hasta 200K tokens: Precio estándar
Perfecto para: Analizar codebases completos, libros, documentación extensa

💡 Esto elimina la necesidad de partir documentos grandes.

7. Costos de servicios complementarios

Recuerda: Bedrock es una pieza del sistema. También usarás:

API Gateway

$3.50 por millón de requests
1 millón gratis el primer año

Lambda

$0.20 por millón de requests
1 millón gratis permanentemente

S3

$0.023 por GB/mes
5GB gratis el primer año

DynamoDB

$1.25 por millón de escrituras
$0.25 por millón de lecturas
25GB gratis permanentemente

Ejemplo de arquitectura completa

Chatbot con 10,000 consultas/mes usando Sonnet 4.5:

Servicio	Costo
Bedrock	$12.00
API Gateway	$0.00 (free tier)
Lambda	$0.00 (free tier)
DynamoDB	$0.15
S3	$0.05
TOTAL	~$12.20/mes

8. Mejores prácticas para optimizar costos

1. Configura alertas de facturación

AWS Console → Billing → Budgets

Ejemplo: "Avísame si supero $10/mes"

2. Establece límites de tokens

import boto3
import json

bedrock = boto3.client('bedrock-runtime')

response = bedrock.invoke_model(
    modelId='anthropic.claude-sonnet-4-5-20250514',
    body=json.dumps({
        "anthropic_version": "bedrock-2023-05-31",
        "max_tokens": 500,  # ← Límite de output
        "messages": [{
            "role": "user",
            "content": "Tu pregunta aquí"
        }]
    })
)

3. Usa Batch cuando sea posible

Para procesos no urgentes:

Análisis nocturnos
Reportes diarios
Procesamiento histórico

→ Ahorro automático del 50%

4. Implementa Prompt Caching

response = bedrock.invoke_model(
    modelId='anthropic.claude-sonnet-4-5-20250514',
    body=json.dumps({
        "anthropic_version": "bedrock-2023-05-31",
        "max_tokens": 500,
        "system": [
            {
                "type": "text",
                "text": "Tu contexto largo que se repite...",
                "cache_control": {"type": "ephemeral"}  # ← Cachea esto
            }
        ],
        "messages": [...]
    })
)

5. Estrategia de modelos escalonada

Ejemplo en un chatbot:

Haiku clasifica la intención → $0.001
Si es simple → Haiku responde → $0.005
Si es complejo → Sonnet responde → $0.015

6. Monitorea con CloudWatch

Configura métricas para:

Número de invocaciones
Tokens consumidos
Costos por modelo
Errores y throttling

7. Cachea respuestas comunes

Usa DynamoDB para guardar FAQs:

Ejemplo:

"¿Cuál es el horario?" → respuesta cacheada
No llames a Bedrock 100 veces para lo mismo

9. Conclusión

Los precios de Bedrock con Claude 4.5 son accesibles y predecibles.

Puntos clave:

Claude Sonnet 4.5: mejor balance calidad-precio ($3/$15 por millón)
Claude Haiku 4.5: 80% más barato, rendimiento sorprendente
Batch Inference: 50% de descuento automático
Prompt Caching: hasta 90% de ahorro en contextos repetidos
Para la mayoría de proyectos: $5-20/mes

Si te resultó útil, guarda este post para referencia futura 📌