Tipos de nodos de Amazon Redshift

Amazon Redshift ofrece diferentes tipos de nodos para adaptarse a sus cargas de trabajo por lo que recomendamos elegir RA3 o DC2 en función del rendimiento requerido, tamaño de los datos y crecimiento. Amazon Redshift Serverless aprovisiona automáticamente los recursos adecuados requeridos para dar servicio a la carga de trabajo, por lo que no es necesario que elija un tipo de nodo.

Los nodos RA3 con almacenamiento administrado le permiten optimizar su almacenamiento de datos mediante el escalado y pago de las capacidades de computación y almacenamiento administrado de forma independiente. Con RA3, elige la cantidad de nodos que necesita en función de requisitos de rendimiento y solo paga por el almacenamiento administrado que utilice. Debe dimensionar su clúster de RA3 en función de la cantidad de datos que procesa diariamente.

El almacenamiento administrado de Redshift (RMS) utiliza grandes unidades de estado sólido (SSD) de alto rendimiento en cada nodo de RA3 para el almacenamiento local rápido y Amazon Simple Storage Service (Amazon S3) para el almacenamiento duradero a largo plazo. Si el volumen de los datos de un nodo aumenta y excede el tamaño de las amplias SSD locales, el RMS deriva dichos datos a Amazon S3. Paga la misma tarifa reducida para el RMS, independientemente de si los datos residen en SSD de alto rendimiento o en Amazon S3. Para las cargas de trabajo que requieren un almacenamiento cada vez mayor, el almacenamiento administrado permite escalar automáticamente la capacidad de almacenamiento de datos sin agregar ni pagar nodos adicionales.

Los nodos DC2 le permiten realizar almacenamiento de datos con un uso informático intensivo con almacenamiento SSD local incluido. Elija la cantidad de nodos que necesita en función del tamaño de los datos y los requisitos de rendimiento. Los nodos DC2 almacenan sus datos localmente para obtener un alto rendimiento y, a medida que el tamaño de los datos aumenta, puede agregar más nodos informáticos a fin de incrementar la capacidad de almacenamiento del clúster. Para conjuntos de datos de menos de 1 TB sin comprimir, recomendamos los tipos de nodos DC2 para lograr el mejor rendimiento al menor precio. Si espera que sus datos crezcan, recomendamos usar nodos RA3 para que pueda dimensionar la computación y el almacenamiento de forma independiente para lograr el mejor precio y rendimiento.

Capacidades de Redshift con precios de pago por uso

  • Tipos de nodos de Amazon Redshift: elija la configuración de clúster y el tipo de nodo que mejor se adapte a sus necesidades y puede pagar la capacidad por horas con los precios bajo demanda de Amazon Redshift. Si elige los precios bajo demanda, puede utilizar la característica de pausa y reanudación para suspender esta modalidad de facturación cuando no se utilice un clúster. También puede elegir instancias reservadas en lugar de instancias bajo demanda para cargas de trabajo de estado estable y obtener descuentos significativos sobre los precios bajo demanda.
  • Precios de Amazon Redshift Spectrum: ejecute consultas SQL directamente en los datos de su lago de datos de Amazon S3, hasta exabytes; simplemente pague por el número de bytes escaneados.
  • Precios del escalado de simultaneidad: cada clúster obtiene hasta una hora de créditos gratuitos para el escalado de simultaneidad por día, lo cual es suficiente para el 97 % de los clientes. Le permite ofrecer un rendimiento constante y rápido, incluso con miles de consultas y usuarios simultáneos. Simplemente paga una tarifa bajo demanda por segundo de uso cuando supera los créditos gratuitos.
  • Precios de RMS: pague solo por los datos que almacene en los clústeres RA3, independientemente del número de nodos de computación aprovisionados. Tan solo paga cada hora por la cantidad total de datos en el almacenamiento administrado. RMS también se utiliza con Amazon Redshift Serverless.
  • Redshift ML: utilice SQL para crear, entrenar e implementar modelos de machine learning (ML). Después de agotar el nivel gratuito de Amazon SageMaker, incurrirá en costos por la creación de su modelo y el almacenamiento. ML de Redshift también está disponible para su uso con Amazon Redshift sin servidor.

Prueba gratuita de Amazon Redshift

Si nunca ha utilizado Amazon Redshift sin servidor anteriormente, puede optar a un crédito de 300 USD con una caducidad de 90 días para su uso de computación y almacenamiento. La tasa de consumo de este crédito depende del uso real y de la capacidad de computación de su punto de conexión sin servidor.

En las regiones en las que Amazon Redshift sin servidor aún no está disponible, los clientes pueden iniciar una prueba gratuita para los clústeres aprovisionados. Tiene derecho a una prueba gratuita de dos meses de nuestro nodo grande DC2. La prueba incluye 750 horas gratis al mes, la cantidad suficiente para ejecutar un nodo grande DC2 ininterrumpidamente con 160 GB de almacenamiento SSD comprimido. Una vez que concluya la prueba gratuita al cabo de dos meses o si su uso supera las 750 horas al mes, puede cerrar el clúster para evitar cargos o seguir ejecutándolo, en cuyo caso se aplicaría nuestra tarifa bajo demanda estándar. Visite la página de la prueba gratuita de Amazon Redshift para obtener más información.

Precios bajo demanda

Los precios bajo demanda de Amazon Redshift le permiten pagar la capacidad aprovisionada por hora sin compromisos y sin costos por adelantado para el tipo de nodo específico en el que elija ejecutar su almacenamiento de datos. Simplemente pague una tarifa por hora basada en el tipo elegido y la cantidad de nodos de su clúster y se le facturará mientras el clúster esté en ejecución. Las horas parciales se facturan en incrementos de un segundo después de un cambio de estado que se pueda facturar, como la creación, eliminación, interrupción o reactivación de un clúster. La característica de interrupción y reactivación le permite suspender la facturación bajo demanda mientras el funcionamiento del clúster esté interrumpido. Pausa y reanudación es una operación manual o programada en los tipos de nodos de Redshift. Durante la interrupción del clúster, solo pagará por el almacenamiento de respaldo. De este modo, puede olvidarse de planificar y adquirir capacidad para el almacenamiento de datos antes de necesitarla, lo que le permite administrar de manera rentable entornos de desarrollo o pruebas. En una implementación Multi-AZ, pagará las mismas tarifas pero con el doble de capacidad de computación de lo que pagaría para una implementación Single-AZ.

Generación actual

* Capacidad de almacenamiento total a disposición en el almacenamiento administrado en cada nodo RA3.

Generación anterior

Cálculo de su precio real bajo demanda por TB al año

En el caso de los precios en diferido, el precio real por TB al año es el precio por hora de la instancia, multiplicado por el número de horas al año, dividido por el número de TB por instancia. Para RA3, los datos almacenados en almacenamiento administrado se facturan de forma independiente en función de los datos reales almacenados en los tipos de nodos RA3; el precio real por TB al año se calcula únicamente para los costos de nodos de computación.

Amazon Redshift sin servidor

Puede empezar a utilizar Amazon Redshift sin servidor por tan solo 3 USD por hora y pagar solo por la capacidad de computación que consume su almacenamiento de datos cuando está activo. La capacidad del almacenamiento de datos escala vertical u horizontalmente de forma automática para satisfacer las demandas de carga de trabajo de análisis y se apaga durante los periodos de inactividad para ahorrar costos y tiempo de administración. Amazon Redshift mide la capacidad del almacenamiento de datos en unidades de procesamiento de Redshift (RPU). Paga por las cargas de trabajo que ejecuta en horas de RPU por segundo (con un cargo mínimo de 60 segundos), incluidas las consultas que acceden a los datos en formatos de archivo abiertos en Amazon S3. No hay ningún cargo por el tiempo de inicio del almacenamiento de datos. Se incluyen capacidades de seguridad integrales y escalado automático. No es necesario pagar por el escalado de simultaneidad y Redshift Spectrum por separado porque ambos se incluyen con Amazon Redshift sin servidor.

Si lo desea, puede usar las configuraciones Base, Máximo de horas de RPU y MaxRPU (capacidad máxima) para controlar el rendimiento y los costos del almacén de datos.

  • Base: esta configuración le permite especificar la capacidad del almacén de datos base que utiliza Amazon Redshift para atender las consultas. La capacidad base se especifica en RPU. Establecer una capacidad de computación base más alta puede mejorar el rendimiento de la consulta, especialmente para el procesamiento de datos y los trabajos de ETL (extracción, transformación, carga) que procesan grandes cantidades de datos y realizan transformaciones y enriquecimiento. Puede ajustar la configuración base de 8 RPU a 512 RPU en unidades de 8 (8, 16, 24, 32, 40, 48, etc., hasta 512) desde la consola de administración de Amazon Redshift o al invocar una API de Amazon Redshift.
  • Máxima: esta configuración le permite especificar límites de uso y definir las acciones para que Amazon Redshift detecte de forma automática si se alcanzan los límites a fin de mantener el presupuesto con previsibilidad. La configuración máxima se especifica en RPU por hora y se asocia con una duración diaria, semanal o mensual. Establecer una capacidad de computación máxima más alta puede mejorar el rendimiento general del sistema, lo que es especialmente beneficioso para las cargas de trabajo que necesitan manejar una alta concurrencia mientras se mantiene un alto rendimiento de manera constante. Puede ajustar la configuración máxima desde la consola de administración de Amazon Redshift o al invocar una API de Amazon Redshift.
  • MaxRPU (capacidad máxima): esta configuración establece el recuento más alto de RPU que Amazon Redshift sin servidor puede admitir para fines de escalado. Cuando se requiere un escalado de computación automático, tener un valor más alto para MaxRPU puede mejorar el rendimiento de las consultas. Cuando se alcanza el límite de MaxRPU, el procesamiento del grupo de trabajo ya no escala verticalmente los recursos.

La capacidad de almacenamiento principal se factura como Redshift Managed Storage (RMS) y el almacenamiento utilizado para las instantáneas de los usuarios se factura con base en las tarifas estándar de copias de seguridad que se describen en esta página. El almacenamiento se factura con base en las mismas tarifas que con los clústeres aprovisionados de Amazon Redshift. Con Amazon Redshift Serverless, puede restaurar su almacenamiento de datos en puntos específicos en las últimas 24 horas con una granularidad de 30 minutos sin cargo. Los costos de transferencia de datos y los costos de ML se aplican por separado, al igual que los clústeres aprovisionados. La replicación de instantáneas y el uso compartido de datos en las regiones de AWS se facturan con base en las tarifas de transferencia que se describen en esta página.

Precios del almacenamiento administrado de Amazon Redshift

Se utiliza la tarifa mensual por GB fija de su región para cobrar los datos almacenados en almacenamiento administrado. El almacenamiento administrado viene incluido exclusivamente en los tipos de nodos RA3 y paga la misma tarifa baja para el almacenamiento administrado de Redshift independientemente del tamaño de los datos. El uso del almacenamiento administrado se calcula por hora en función de los datos totales presentes en el almacenamiento administrado (ver ejemplo a continuación acerca de la conversión del uso en GB-hora a cargos en GB-mes). Puede monitorear el volumen de datos en el clúster de RA3 mediante Amazon CloudWatch o la consola de administración de AWS. No deberá pagar cargos por transferencia de datos entre nodos RA3 y el almacenamiento administrado. Los cargos de almacenamiento administrado no incluyen cargos de almacenamiento de copias de seguridad debido a la generación de instantáneas manuales o automatizadas (consulte Almacenamiento de copias de seguridad). Se continúa cobrando la retención de copias de seguridad manuales aunque se apague el clúster.

Ejemplo de precios para almacenamiento administrado

Supongamos que almacena 100 GB de datos en almacenamiento administrado, con tipos de nodos RA3, durante los primeros 15 días del mes de abril y 100 TB de datos durante los últimos 15 días de dicho mes.
 
Primero, calculemos el uso en GB por hora. Durante los primeros 15 días, tendrá el siguiente uso: 100 GB x 15 días x (24 horas/día) = 36 000 GB-hora. Durante los últimos 15 días, tendrá el siguiente uso: 100 TB x 1024 GB/TB X 15 días X (24 horas/día) = 36 864 000 GB-hora.
 
A finales de abril, el uso en GB por hora total es: 36 000 GB-hora + 36 864 000 GB-hora = 36 900 000 GB-hora.
Convirtamos esto a GB por mes: 36 900 000 GB-hora/720 horas al mes en abril = 51 250 GB-mes.
 
Si los datos se almacenaron en la región Este de EE. UU. (Norte de Virginia), el almacenamiento administrado se cobrará 0,024 USD/GB-mes. Los cargos de almacenamiento mensual por 51 250 GB-mes serán: 51 250 GB-mes x 0,024 USD por GB-mes = 1230 USD.
 
Tarifa total de RMS para el mes de abril = 1230 USD

Precios de Amazon Redshift Spectrum

Amazon Redshift Spectrum le permite ejecutar directamente consultas SQL de Amazon Redshift en exabytes de datos en Amazon S3. Se factura por la cantidad de bytes analizados por Redshift Spectrum, redondeados al megabyte siguiente más cercano, con un mínimo de 10 MB por consulta. No se aplican cargos por las declaraciones del lenguaje de definición de datos (DDL), como CREATE/ALTER/DROP TABLE, para administrar las particiones y las consultas fallidas.

Las consultas de Amazon Redshift Serverless de datos externos en Amazon S3 no se facturan por separado y se incluyen en el monto facturado de Amazon Redshift Serverless en montos de RPU-hora.

Puede mejorar el rendimiento de las consultas y reducir los costos si almacena los datos en un formato de datos comprimido, dividido y en columnas. Si comprime datos con uno de los formatos admitidos por Redshift Spectrum, los costos se reducirán porque se analizan menos datos. De forma similar, si almacena los datos en un formato de columnas, como Apache Parquet u Optimized Row Columnar (ORC), se reducirán los costos porque Redshift Spectrum solo analiza las columnas requeridas para la consulta.

Costos adicionales

Se le cobrará el clúster de Amazon Redshift que se utilice para realizar consultas en datos con Redshift Spectrum. Redshift Spectrum realiza consultas en los datos directamente en Amazon S3. Se le cobrarán tarifas de S3 estándar por almacenar objetos en sus buckets de S3 y por las solicitudes realizadas en buckets de S3. Para obtener más información, consulte las tarifas de Amazon S3

Si usa el catálogo de datos de AWS Glue con Amazon Redshift Spectrum, se le cobrarán las tarifas estándar del catálogo de datos de AWS. Para obtener más información, consulte los precios de AWS Glue.

Al utilizar Amazon Redshift Spectrum para consultar datos cifrados de AWS Key Management Service (KMS) en Amazon S3, se le cobrarán las tarifas estándar de AWS KMS. Para obtener más información, consulte los precios de AWS KMS.

Los ejemplos de precios de Redshift Spectrum se basan en el precio de la región Este de EE. UU. (Norte de Virginia).

Considere una tabla con 100 columnas de igual tamaño, almacenadas en Amazon S3 como un archivo de texto sin comprimir con un tamaño total de 4 TB. Para realizar una consulta en los datos de una sola columna de la tabla, Redshift Spectrum tendrá que analizar todo el archivo, ya que los formatos de texto no se pueden dividir. Esta consulta analizaría 4 TB y costaría 20 USD (5 USD/TB x 4 TB = 20 USD).

Si comprime el archivo con GZIP, podría obtener una ganancia de 4:1 en la relación de compresión. En ese caso, tendría un tamaño de archivo comprimido de 1 TB. Redshift Spectrum tiene que analizar el archivo entero, pero como tiene un cuarto del tamaño, paga un cuarto del costo, o 5 USD (5 USD/TB x 1 TB = 5 USD).

Si comprime el archivo y lo convierte a un formato de columnas como Apache Parquet, podría obtener una ganancia de 4:1 en la relación de compresión y obtendría un tamaño de archivo comprimido de 1 TB. Si consideramos la consulta anterior, Redshift Spectrum necesita analizar únicamente una columna del archivo Parquet. El costo de esta consulta sería de 0,05 USD (5 USD/TB x 1 TB de tamaño de archivo x 1/100 columnas, o un total de 10 GB analizados = 0,05 USD).

Nota: Los ejemplos de precios anteriores se suministran con fines ilustrativos. La relación de compresión de los diferentes archivos y columnas puede variar.

Precios del escalado de simultaneidad

Amazon Redshift añade automáticamente capacidad transitoria para ofrecer un rendimiento constante y rápido, incluso con miles de usuarios y consultas en simultáneo. No tiene que administrar recursos, no hay costos iniciales y no se cobra el tiempo de arranque o apagado de los clústeres transitorios. Puede acumular una hora de créditos para clústeres destinados al escalado de simultaneidad cada 24 horas mientras el clúster principal se encuentre en ejecución. Se le cobrará la tarifa bajo demanda por segundo de un clúster de escalado de simultaneidad utilizado cuando se superan los créditos gratuitos (solo cuando atiendan sus consultas) con un cargo mínimo de un minuto cada vez que se active un clúster de escalado de simultaneidad. La tarifa bajo demanda por segundo se basa en el tipo y la cantidad de nodos en su clúster de Amazon Redshift.

Amazon Redshift sin servidor escala automáticamente los recursos vertical u horizontalmente según sea necesario para satisfacer las necesidades de carga de trabajo de forma predeterminada y no hay cargos separados para el escalado de simultaneidad.

Créditos del escalado de simultaneidad

Los clústeres de Redshift obtienen hasta una hora de créditos gratuitos de escalado de simultaneidad por día. Los créditos se obtienen por hora para cada clúster activo de su cuenta AWS, y los pueden consumir el mismo clúster únicamente después de obtener los créditos. Puede acumular hasta 30 horas de créditos gratuitos de escalado de simultaneidad para cada clúster activo. Los créditos no caducan, siempre y cuando su clúster siga activo.

Ejemplo de precios del escalado de simultaneidad

Un clúster de Redshift de 10 nodos DC2.8XL en la región EE.UU. Este cuesta 48 USD por hora. Pensemos en una situación en la que dos clústeres transitorios se utilizan durante cinco minutos después de consumir los créditos gratuitos del escalado de simultaneidad. La tarifa bajo demanda por segundo para el escalado de simultaneidad es de 48 USD x 1/3600 = 0,013 USD por segundo. En este caso, el costo adicional del escalado de simultaneidad es de 0,013 USD por segundo x 300 segundos x 2 clústeres transitorios = 8 USD. Por lo tanto, el costo total del clúster de Amazon Redshift y los dos clústeres transitorios en este caso es de 56 USD.

Precios de ML de Redshift

Cuando comienza a utilizar ML de Redshift se vuelve apto para el nivel gratuito de Amazon SageMaker si anteriormente no ha utilizado Amazon SageMaker. Esto incluye dos solicitudes de CREAR MODELO gratis por mes durante 2 meses con hasta 100 000 celdas por solicitud. El nivel gratuito comienza el primer mes, cuando crea su primer modelo de ML en Redshift.

Costos de Amazon S3
La solicitud CREATE MODEL (CREAR MODELO) también incurre en costos menores de Amazon S3. Los costos de S3 deberían ser inferiores a 1 USD por mes, ya que la cantidad de datos de S3 generados por CREATE MODEL (CREAR MODELO) se encuentran en el orden de unos pocos gigabytes. Cuando la recolección de basura está activada, se eliminan rápidamente. Amazon S3 se utiliza primero para almacenar los datos de formación producidos por la consulta SELECCIONAR de CREAR MODELO. Luego, se utiliza para almacenar varios artefactos relacionados con el modelo necesarios para la predicción. El modo de recolección de basura por defecto eliminará tanto los datos de formación como los artefactos relacionados con el modelo al final de CREATE MODEL (CREAR MODELO).

Opciones de control de costos
Puede controlar el costo de la formación fijando las MAX_CELLS. De no hacerlo, el valor predeterminado de MAX_CELLS es un millón, lo que en la gran mayoría de los casos mantendrá el costo de formación por debajo de los 20 USD. Cuando el conjunto de datos de formación supera el millón, el precio aumenta de la siguiente manera:

Número de celdas Precio

Primeras 10 millones de celdas

20 USD por cada millón de celdas

90 millones de celdas siguientes

15 USD por cada millón de celdas

Más de 100 millones de celdas

7 USD por cada millón de celdas

 

Nota: El precio real a menudo será menor que los límites superiores compartidos arriba. 

Ejemplos de costo por CREATE MODEL (CREAR MODELO):

  • 100 000 celdas equivalen a 20 USD (= 1 x 20)
  • 2 000 000 celdas equivalen a 40 USD (= 2 x 20)
  • 23 000 000 celdas equivalen a 395 USD (= 10 x 20 + 13 x 15)
  • 99 000 000 celdas equivalen a 1535 USD (= 10 x 20 + 89 x 15) y 
  • 211 000 000 celdas equivalen a 2327 USD (= 10 x 20 + 90 x 15 + 111 x 7)

Si los datos de formación producidos por la consulta SELECT (SELECCIONAR) de la solicitud CREATE MODEL (CREAR MODELO) exceden el límite de MAX_CELLS proporcionado (o el millón predeterminado, en caso de que no lo haya proporcionado), CREATE MODEL (CREAR MODELO) elegirá, de manera aleatoria, aproximadamente MAX_CELLS o “número de columnas” registros del conjunto de datos de formación y formará mediante las siguientes tuplas elegidas al azar. La elección aleatoria está diseñada para que el conjunto de datos de formación reducido no tenga ningún sesgo. Por lo tanto, si establece el valor de MAX_CELLS, puede mantener el costo dentro de los límites.

Precios de las instancias reservadas

Las instancias reservadas son adecuadas para cargas de trabajo de producción de estado estable y aportan descuentos significativos en comparación con los precios bajo demanda de los tipos de nodo de Amazon Redshift. Los clientes suelen adquirir instancias reservadas después de llevar a cabo experimentos y pruebas de concepto para validar las configuraciones de producción.

Puede conseguir ahorros importantes en comparación con las tarifas de la modalidad en diferido si se compromete a utilizar Amazon Redshift durante un periodo de un año o tres años. Los precios de las instancias reservadas son específicos para el tipo de nodo que se compró y permanecen vigentes hasta que finaliza la reserva. Los precios incluyen dos copias adicionales de datos, una en los nodos del clúster y una en Amazon S3. Nosotros nos ocupamos de las copias de seguridad, la durabilidad, la disponibilidad, la seguridad, el monitoreo y el mantenimiento por usted.

Existen tres opciones en relación con el pago de instancias reservadas:

Sin pago inicial: no es necesario pagar nada por adelantado. Se compromete a pagar por mes durante un año.

Pago inicial parcial: debe pagar parte de la instancia reservada por adelantado y el resto a lo largo de un año o tres años.

Pago total por adelantado: abona todo el término de la instancia reservada (un año o tres años) mediante un único pago inicial.

Las instancias reservadas son un concepto de facturación y no se utilizan para crear clústeres de almacenamiento de datos. Cuando realiza una compra, se le cobran las tarifas iniciales y por mes correspondientes, aunque no disponga de un clúster en ejecución o en pausa. Para adquirir instancias reservadas, diríjase a la pestaña Reserved Nodes (Nodos reservados) en la consola de Redshift.

Podemos finalizar el programa de precios para instancias reservadas en cualquier momento. Las instancias reservadas, además de estar sujetas a los precios para instancias reservadas, también están sujetas a todas las tarifas de transferencia de datos y otras tarifas conforme al Acuerdo del cliente de AWS u otro acuerdo que haya hecho con nosotros que rija el uso de sus servicios.

*Pago mensual promedio durante el plazo de vigencia de la instancia reservada. Para cada mes, el pago mensual real se equiparará con el número real de horas de dicho mes multiplicado por la tarifa de uso por hora o el número de segundos de dicho mes multiplicado por la tarifa de uso por hora dividido por 3600, en función del tipo de instancia Redshift que ejecute. La tarifa de uso por hora equivale al promedio total de pagos mensuales durante la vigencia de la instancia reservada dividido entre el número total de horas (en función de un año de 365 días) durante la vigencia de la instancia reservada.

** El precio por hora real facilita calcular la cantidad de dinero que ahorrará con una instancia reservada en comparación con el precio de una instancia bajo demanda. Cuando compre una instancia reservada, se le facturará cada hora durante el periodo de vigencia de la instancia reservada que seleccione, independientemente de si se encuentra en ejecución. El precio por hora real muestra el costo por hora amortizado de la instancia. Esto toma el costo total de la instancia reservada durante todo el periodo de vigencia, incluidos los pagos iniciales y se extiende por cada hora del plazo de vigencia de la instancia reservada.

*** En el caso de las instancias reservadas, se agrega el pago inicial a la tarifa por hora y esta cifra se multiplica por la cantidad de horas en el periodo, dividido por el número de años del periodo y el número de TB por nodo. Para RA3, los datos almacenados en almacenamiento administrado se facturan de forma independiente en función de los datos reales almacenados en los tipos de nodos RA3; el precio real por TB al año se calcula solo para los costos de nodos de computación.

Costos de integración sin ETL

Amazon Redshift tiene integraciones sin ETL con bases de datos de procesamiento de transacciones en línea (OLTP) y aplicaciones empresariales, lo que elimina la necesidad de crear y administrar canalizaciones de extracción, transformación y carga (ETL). Las bases de datos compatibles incluyen Amazon Aurora, Amazon DynamoDB y Amazon Relational Database Service (Amazon RDS) para MySQL. Las aplicaciones empresariales compatibles incluyen Salesforce, ServiceNow, Zendesk y más.

Estas integraciones le proporcionan flexibilidad, por lo que puede elegir tablas de datos específicas en una base de datos o en una aplicación empresarial para replicarlas automáticamente en Amazon Redshift. Esta flexibilidad le permite ejecutar análisis unificados en varias aplicaciones y orígenes de datos. AWS no cobra ninguna tarifa adicional por la integración sin ETL. Debe pagar por los recursos existentes que se utilizan para crear y procesar los datos de cambios creados como parte de una integración sin ETL. Esto incluye el almacenamiento adicional de Amazon Redshift para almacenar datos replicados, recursos informáticos para procesar la replicación de datos (o las RPU en Amazon Redshift sin servidor) y los costos de transferencia de datos entre zonas de disponibilidad para trasladar los datos del origen al destino. El procesamiento continuo de los cambios de datos mediante la integración sin ETL se ofrece sin costo adicional. Para obtener más información, visite las páginas de precios de Aurora, Amazon RDS para MySQL, DynamoDB y AWS Glue.

Almacenamiento de copias de seguridad

El almacenamiento de copias de seguridad es el tipo de almacenamiento asociado con las instantáneas sacadas de su almacén de datos. La extensión del periodo de retención de copia de seguridad o realización de instantáneas adicionales, aumenta el almacenamiento de copias de seguridad que el almacenamiento de datos consume. Amazon Redshift cobra por las instantáneas manuales que se realizan mediante la consola, la interfaz de programación de aplicaciones (API) o la interfaz de línea de comandos (CLI). Las instantáneas automatizadas de Redshift, que son predeterminadas y se crean a partir de la característica de programación de instantáneas de Amazon Redshift, se ofrecen sin costo alguno y se pueden retener por un máximo de 35 días. No se le cobrará por los puntos de recuperación de Amazon Redshift sin servidor que tengan menos de 24 horas. Si elige mantener los puntos de recuperación pasadas las 24 horas, incurrirán en cargos como parte de RMS. Los datos almacenados en clústeres RA3 son parte del RMS y se facturan con base en las tarifas de RMS, pero las instantáneas manuales tomadas para clústeres RA3 se facturan como almacenamiento de copias de seguridad según las tarifas estándar de Amazon S3 descritas en esta página.

Por ejemplo, si su clúster RA3 tiene 10 TB de datos y 30 TB de instantáneas manuales, se le facturarán 10 TB de RMS y 30 TB de almacenamiento de respaldo. Con los clústeres de computación de alta densidad (DC) y de almacenamiento de alta densidad (DS), el almacenamiento se incluye en el clúster y no se factura por separado, pero las copias de seguridad se almacenan externamente en Amazon S3. El almacenamiento de copias de seguridad que excede al almacenamiento aprovisionado en clústeres de DC y DS se factura como almacenamiento de copias de seguridad a las tarifas estándar de S3. Las instantáneas se facturan hasta que caducan o se eliminan y también cuando el clúster se pausa o elimina.

Transferencia de datos

La transferencia de datos entre Amazon Redshift y Amazon S3 dentro de la misma región de AWS para operaciones de copias de seguridad, restauración, carga y descarga no conlleva cargos. Las demás transferencias de datos de entrada y salida de Amazon Redshift se facturarán de acuerdo con las tarifas de transferencia de datos de AWS estándar. En concreto, si ejecuta su clúster de Amazon Redshift en Amazon Virtual Private Cloud (VPC), se aplicarán cargos por transferencia de datos de AWS estándar para transferencias por JDBC/ODBC a su punto de enlace del clúster de Amazon Redshift. Además, cuando utilice el direccionamiento de VPC mejorado y descargue datos de Amazon S3 en una región distinta, incurrirá en los cargos por transferencia de datos de AWS estándar. Para obtener más información acerca de las tarifas de transferencia de datos de AWS, consulte la página de precios de Amazon Elastic Cloud Compute (Amazon EC2).

Amazon Redshift cobra por el uso compartido de datos entre regiones, así como por la copia de instantáneas entre regiones. Los cargos por compartir datos se facturan en la región del consumidor donde se accede a los datos. La copia de instantáneas entre regiones se factura en la región de origen donde existe el clúster que creó la instantánea. Se aplican cargos por transferencia de datos a todas las instantáneas (tanto automatizadas como manuales) y puntos de recuperación. Todos los cargos por transferencia de datos para la copia de instantáneas se aplican únicamente a los datos incrementales.

Transferencia de datos de intercambio de datos ENTRANTES o transferencia de datos de copia de instantáneas SALIENTES de

Ejemplos de precios

Ejemplo de RMS

Utiliza cuatro nodos ra3.xlarge y 40 TB de RMS durante un mes. Durante el mes, también analiza 20 TB de datos mediante Redshift Spectrum y analiza 20 TB de datos. Utiliza los precios en diferido.

Los cargos se calcularían de la siguiente manera:

  • Costo de instancia de Redshift RA3 = 4 instancias x 3,26 USD por hora x 730 horas en un mes= 9519,20 USD
  • Costo de RMS = 40 TB x 1024 GB por TB x 0,024 USD = 983,04 USD
  • Costo de Redshift Spectrum = 20 TB x 5,00 USD = 100,00 USD

Costo mensual total: 10 602,24 USD

Ejemplo de Multi-AZ

Utiliza un clúster Multi-AZ que está implementado en dos AZ simultáneamente. Su clúster tiene cuatro nodos ra3.4xlarge por AZ y utiliza 40 TB de RMS durante un mes. Utiliza precios bajo demanda.

Los cargos se calcularían de la siguiente manera:

  • Costo de instancia de Redshift RA3 para AZ1 = 4 instancias x 3,26 USD por hora x 730 horas en un mes = 9519,20 USD
  • Costo de instancia de Redshift RA3 para AZ2 = 4 instancias x 3,26 USD por hora x 730 horas en un mes = 9519,20 USD
  • Costo de RMS = 40 TB x 1024 GB por TB x 0,024 USD = 983,04 USD

Costo mensual total: 20 021,44 USD

Ejemplo de Amazon Redshift Serverless
Este ejemplo muestra cómo Amazon Redshift cobra según el modo de capacidad bajo demanda para la opción sin servidor.
Ejemplo básico

Supongamos que tiene un trabajo de procesamiento de datos que debe ejecutarse cada hora de 7.00 h a 19.00 h en su almacenamiento de datos de Amazon Redshift en la región Este de EE. UU. (Norte de Virginia). Para simplificar, vamos a asumir que cada vez que se ejecuta el trabajo toma la misma cantidad de tiempo: 10 minutos y 30 segundos. Supongamos que Amazon Redshift utiliza una capacidad de 128 RPU para ejecutar el trabajo.

La siguiente tabla resume el uso total durante el día.

Periodo de consulta

El trabajo se ejecutó 13 veces entre las 7.00 h. y las 19.00 h; en cada oportunidad tomó 10 minutos y 30 segundos = 136 minutos y 30 segundos = 8190 segundos

Capacidad utilizada

128 RPU

Cargos diarios

109,20 USD ([8190 x 128 RPU x 0,375 USD por RPU-hora]/3600) 

Ejemplo con configuración básica y escalado automático

Supongamos que tiene una aplicación de creación de paneles en su almacenamiento de datos de Amazon Redshift en la región de Este de EE. UU. (Norte de Virginia). La aplicación es utilizada por una variedad de usuarios en la organización (como analistas de datos, desarrolladores y científicos de datos) y tiene periodos pico y de baja en el día. Específicamente, la aplicación tiene un pico en la actividad de los usuarios en la mañana de 9.00 h a 11.00 h y de 14.00 h a 16.00 h cuando la mayoría de los usuarios están realizando análisis y acceden a datos desde el almacenamiento de datos. Supongamos que la aplicación tiene cuatro intervalos de 15 minutos de 11.00 h a 14.00 h cuando no hay actividad de los usuarios. Tampoco hay actividad de los usuarios entre las 22.00 h y las 5.00 h.

Ahora veamos el uso de recursos en el almacenamiento de datos de Amazon Redshift. Vamos a asumir que para tener un mejor control sobre el rendimiento del precio, ha establecido explícitamente la configuración base de Amazon Redshift Serverless en 64 RPU. Y que durante los periodos pico de la mañana y la tarde, Amazon Redshift escala automáticamente y utiliza un total de 192 RPU y 128 RPU de capacidad, respectivamente.

La siguiente tabla resume el uso total durante el día.

Calendario

Periodo total de ejecución de consultas

De 5.00 h a 9.00 h

64 RPU por 4 horas = 64 x 4= 256 RPU-hora

De 9.00 h a 11.00 h

192 RPU por 2 horas = 384 RPU-hora

De 11.00 h a 14.00 h

A excepción los cuatro intervalos de inactividad de 15 minutos, el tiempo de actividad es de 2 horas.

64 RPU por 2 horas = 64 x 2= 128 RPU-hora

De 14.00 h a 15.00 h

128 RPU por 1 hora = 128 RPU-hora

De 15.00 h a 22.00 h

64 RPU por 7 horas = 64 x 7= 448 RPU-hora

De 22.00 h a 5.00 h

Inactividad

Cargos diarios

504 USD ([256 + 384 + 128 + 128 + 448] x 0,375 USD por RPU-hora) 

Ejemplo de escalado de simultaneidad de Amazon Redshift

Un clúster de Redshift de 10 nodos DC2.8XL en la región Este de EE. UU. cuesta 48 USD por hora. Pensemos en una situación en la que dos clústeres transitorios se utilizan durante cinco minutos después de consumir los créditos gratuitos del escalado de simultaneidad. La tarifa bajo demanda por segundo para el escalado de simultaneidad es de 48 USD x 1/3600 = 0,013 USD por segundo. En este caso, el costo adicional del escalado de simultaneidad es de 0,013 USD por segundo x 300 segundos x 2 clústeres transitorios = 8 USD. Por lo tanto, el costo total del clúster de Redshift y los dos clústeres transitorios es de 56 USD.

Ejemplo para Amazon Redshift Spectrum

Considere una tabla con 100 columnas de igual tamaño, almacenadas en Amazon S3 como un archivo de texto sin comprimir con un tamaño total de 4 TB. Para realizar una consulta en los datos de una sola columna de la tabla, Redshift Spectrum tendrá que analizar todo el archivo, ya que los formatos de texto no se pueden dividir. Con base en los precios de Redshift Spectrum para Este de EE. UU. (Norte de Virginia), esta consulta analizaría 4 TB y costaría 20 USD (5,00 USD/TB x 4 TB = 20 USD).

Si comprime el archivo con GZIP, podría obtener una ganancia de 4:1 en la relación de compresión. En ese caso, tendría un tamaño de archivo comprimido de 1 TB. Redshift Spectrum tiene que analizar el archivo entero, pero como tiene un cuarto del tamaño, paga un cuarto del costo, o 5 USD (5 USD/TB x 1 TB = 5 USD).

Si comprime el archivo y lo convierte a un formato de columnas como Apache Parquet, podría obtener una ganancia de 4:1 en la relación de compresión y obtendría un tamaño de archivo comprimido de 1 TB. Si consideramos la consulta anterior, Redshift Spectrum necesita analizar únicamente una columna del archivo Parquet. El costo de esta consulta sería de 0,05 USD (5 USD/TB x 1 TB de tamaño de archivo x 1/100 columnas, o un total de 10 GB analizados = 0,05 USD).

Nota: Los ejemplos de precios anteriores se suministran con fines ilustrativos. La relación de compresión de los diferentes archivos y columnas puede variar.

Recursos de precios adicionales

Calculadora de precios de AWS

Calcule fácilmente los costos mensuales en AWS

Obtenga asistencia de precios

Contacte con los especialistas de AWS para obtener un presupuesto personalizado

Conozca más recursos de Amazon Redshift

Visite la página de recursos
¿Listo para crear?
Introducción a Amazon Redshift
¿Tiene más preguntas?
Contacte con nosotros