기본 콘텐츠로 건너뛰기

RDS에서 Django 앱 성능을 높이는 데이터베이스 설정 팁

RDS에서 Django 앱 성능을 높이는 데이터베이스 설정 팁

안녕하세요! 오늘은 AWS RDS를 사용하는 Django 애플리케이션의 성능을 최적화하는 방법에 대해 알아보겠습니다.

1. RDS 인스턴스 최적화

1.1 인스턴스 타입 선택

# RDS 인스턴스 크기 조정
import boto3

def resize_rds_instance():
    rds = boto3.client('rds')
    response = rds.modify_db_instance(
        DBInstanceIdentifier='your-db',
        DBInstanceClass='db.t3.large',  # 워크로드에 맞는 인스턴스 타입 선택
        ApplyImmediately=True
    )
    return response['DBInstance']

1.2 파라미터 그룹 설정

def create_parameter_group():
    rds = boto3.client('rds')

    # PostgreSQL 파라미터 그룹 생성
    response = rds.create_db_parameter_group(
        DBParameterGroupName='django-optimized',
        DBParameterGroupFamily='postgres13',
        Description='Optimized parameters for Django applications'
    )

    # 성능 관련 파라미터 설정
    parameters = [
        {
            'ParameterName': 'shared_buffers',
            'ParameterValue': '2GB',  # 시스템 메모리의 25%
            'ApplyMethod': 'pending-reboot'
        },
        {
            'ParameterName': 'effective_cache_size',
            'ParameterValue': '6GB',  # 시스템 메모리의 75%
            'ApplyMethod': 'pending-reboot'
        },
        {
            'ParameterName': 'work_mem',
            'ParameterValue': '16MB',  # 복잡한 쿼리에 대한 메모리 할당
            'ApplyMethod': 'pending-reboot'
        },
        {
            'ParameterName': 'maintenance_work_mem',
            'ParameterValue': '512MB',  # 유지보수 작업에 대한 메모리 할당
            'ApplyMethod': 'pending-reboot'
        },
        {
            'ParameterName': 'random_page_cost',
            'ParameterValue': '1.1',  # SSD 사용 시 설정
            'ApplyMethod': 'pending-reboot'
        },
        {
            'ParameterName': 'effective_io_concurrency',
            'ParameterValue': '200',  # SSD 사용 시 설정
            'ApplyMethod': 'pending-reboot'
        }
    ]

    for param in parameters:
        rds.modify_db_parameter_group(
            DBParameterGroupName='django-optimized',
            Parameters=[param]
        )

    return response['DBParameterGroup']['DBParameterGroupName']

2. 데이터베이스 연결 최적화

2.1 연결 풀 설정

# settings.py
DATABASES = {
    'default': {
        'ENGINE': 'django.db.backends.postgresql',
        'NAME': 'your_db',
        'USER': 'your_user',
        'PASSWORD': 'your_password',
        'HOST': 'your-rds-endpoint',
        'PORT': '5432',
        'OPTIONS': {
            'connect_timeout': 10,
            'application_name': 'django_app',
        },
        'CONN_MAX_AGE': 60,  # 연결 유지 시간 (초)
        'CONN_HEALTH_CHECKS': True,
    }
}

2.2 연결 풀 모니터링

def monitor_connections():
    rds = boto3.client('rds')
    cloudwatch = boto3.client('cloudwatch')

    # 현재 연결 수 확인
    response = rds.describe_db_instances(
        DBInstanceIdentifier='your-db'
    )

    connections = response['DBInstances'][0]['DBConnections']

    # CloudWatch에 메트릭 발행
    cloudwatch.put_metric_data(
        Namespace='RDS',
        MetricData=[
            {
                'MetricName': 'DBConnections',
                'Value': connections,
                'Unit': 'Count',
                'Dimensions': [
                    {
                        'Name': 'DBInstanceIdentifier',
                        'Value': 'your-db'
                    }
                ]
            }
        ]
    )

3. 인덱스 최적화

3.1 인덱스 생성

from django.db import models

class Product(models.Model):
    name = models.CharField(max_length=100)
    category = models.ForeignKey('Category', on_delete=models.CASCADE)
    price = models.DecimalField(max_digits=10, decimal_places=2)
    created_at = models.DateTimeField(auto_now_add=True)

    class Meta:
        indexes = [
            models.Index(fields=['name']),
            models.Index(fields=['category', 'price']),
            models.Index(fields=['created_at']),
        ]

3.2 인덱스 사용 분석

def analyze_index_usage():
    from django.db import connection

    with connection.cursor() as cursor:
        cursor.execute("""
            SELECT schemaname, tablename, indexname, idx_scan, idx_tup_read, idx_tup_fetch
            FROM pg_stat_user_indexes
            ORDER BY idx_scan DESC;
        """)
        return cursor.fetchall()

4. 쿼리 최적화

4.1 쿼리 캐싱

from django.core.cache import cache
from django.db.models import Prefetch

def get_optimized_products():
    cache_key = 'products_list'
    products = cache.get(cache_key)

    if products is None:
        products = Product.objects.select_related(
            'category'
        ).prefetch_related(
            Prefetch('images', queryset=ProductImage.objects.filter(is_primary=True))
        ).filter(
            is_active=True
        )
        cache.set(cache_key, products, timeout=3600)

    return products

4.2 쿼리 실행 계획 분석

def analyze_query_plan():
    from django.db import connection

    with connection.cursor() as cursor:
        cursor.execute("""
            EXPLAIN ANALYZE
            SELECT * FROM products_product
            WHERE category_id = 1
            AND price > 1000;
        """)
        return cursor.fetchall()

5. 백업 및 복구 전략

5.1 자동 백업 설정

def configure_backups():
    rds = boto3.client('rds')

    response = rds.modify_db_instance(
        DBInstanceIdentifier='your-db',
        BackupRetentionPeriod=7,  # 7일간 백업 유지
        PreferredBackupWindow='03:00-04:00',  # 백업 시간대
        PreferredMaintenanceWindow='sun:04:00-sun:05:00',  # 유지보수 시간대
        ApplyImmediately=True
    )

    return response['DBInstance']

5.2 스냅샷 생성

def create_snapshot():
    rds = boto3.client('rds')

    response = rds.create_db_snapshot(
        DBSnapshotIdentifier=f'manual-snapshot-{datetime.now().strftime("%Y%m%d")}',
        DBInstanceIdentifier='your-db'
    )

    return response['DBSnapshot']['DBSnapshotIdentifier']

6. 모니터링 및 알림

6.1 성능 메트릭 모니터링

def monitor_performance():
    cloudwatch = boto3.client('cloudwatch')

    metrics = [
        'CPUUtilization',
        'FreeableMemory',
        'ReadIOPS',
        'WriteIOPS',
        'ReadLatency',
        'WriteLatency',
        'DatabaseConnections'
    ]

    for metric in metrics:
        cloudwatch.put_metric_alarm(
            AlarmName=f'RDS-{metric}-High',
            MetricName=metric,
            Namespace='AWS/RDS',
            Statistic='Average',
            Period=300,
            EvaluationPeriods=2,
            Threshold=80.0,
            ComparisonOperator='GreaterThanThreshold',
            AlarmActions=['arn:aws:sns:region:account-id:your-topic']
        )

6.2 슬로우 쿼리 로깅

def enable_slow_query_log():
    rds = boto3.client('rds')

    response = rds.modify_db_parameter_group(
        DBParameterGroupName='django-optimized',
        Parameters=[
            {
                'ParameterName': 'log_min_duration_statement',
                'ParameterValue': '1000',  # 1초 이상 걸리는 쿼리 로깅
                'ApplyMethod': 'pending-reboot'
            }
        ]
    )

    return response

7. 읽기 전용 복제본 설정

7.1 복제본 생성

def create_read_replica():
    rds = boto3.client('rds')

    response = rds.create_db_instance_read_replica(
        DBInstanceIdentifier='your-db-replica',
        SourceDBInstanceIdentifier='your-db',
        DBInstanceClass='db.t3.medium',
        AvailabilityZone='ap-northeast-2a'
    )

    return response['DBInstance']

7.2 Django에서 복제본 사용

# settings.py
DATABASES = {
    'default': {
        'ENGINE': 'django.db.backends.postgresql',
        'NAME': 'your_db',
        'USER': 'your_user',
        'PASSWORD': 'your_password',
        'HOST': 'your-rds-endpoint',
        'PORT': '5432',
    },
    'replica': {
        'ENGINE': 'django.db.backends.postgresql',
        'NAME': 'your_db',
        'USER': 'your_user',
        'PASSWORD': 'your_password',
        'HOST': 'your-replica-endpoint',
        'PORT': '5432',
    }
}

DATABASE_ROUTERS = ['path.to.router.ReadReplicaRouter']

결론

RDS에서 Django 애플리케이션의 성능을 최적화하는 다양한 방법을 알아보았습니다. 이러한 설정을 통해 데이터베이스 성능을 크게 향상시킬 수 있습니다. 추가적인 질문이나 궁금한 점이 있으시면 댓글로 남겨주세요!

댓글

이 블로그의 인기 게시물

Django에서 트랜잭션 관리하기

Django에서 트랜잭션 관리하기 안녕하세요! 오늘은 Django에서 데이터베이스 트랜잭션을 효과적으로 관리하는 방법에 대해 알아보겠습니다. 1. 트랜잭션의 중요성 트랜잭션은 데이터베이스의 일관성과 무결성을 보장하는 중요한 개념입니다. Django에서는 여러 가지 방법으로 트랜잭션을 관리할 수 있습니다. 1.1 기본 개념 원자성(Atomicity) : 트랜잭션은 모두 실행되거나 모두 실행되지 않아야 합니다. 일관성(Consistency) : 트랜잭션 전후로 데이터베이스의 일관성이 유지되어야 합니다. 격리성(Isolation) : 동시에 실행되는 트랜잭션들이 서로 영향을 주지 않아야 합니다. 지속성(Durability) : 완료된 트랜잭션의 결과는 영구적으로 저장되어야 합니다. 2. Django의 트랜잭션 관리 2.1 기본 설정 # settings.py DATABASES = { 'default': { 'ENGINE': 'django.db.backends.postgresql', 'NAME': 'mydatabase', 'USER': 'myuser', 'PASSWORD': 'mypassword', 'HOST': 'localhost', 'PORT': '5432', 'ATOMIC_REQUESTS': True, # 모든 뷰를 트랜잭션으로 래핑 } } 2.2 데코레이터 사용 from django.db import transaction @transaction.atomic def create_order(user, items): order = Order.objects.create(user=...

AWS S3 + CloudFront로 정적 파일 서빙 완전 가이드

AWS S3 + CloudFront로 정적 파일 서빙 완전 가이드 안녕하세요! 오늘은 AWS S3와 CloudFront를 사용하여 정적 파일을 효율적으로 서빙하는 방법에 대해 알아보겠습니다. 왜 S3와 CloudFront를 사용할까요? 높은 가용성 : AWS의 글로벌 인프라를 활용 빠른 전송 속도 : CloudFront의 CDN 기능으로 전 세계 사용자에게 빠른 전송 비용 효율성 : 사용한 만큼만 지불 보안 : AWS의 보안 기능 활용 확장성 : 트래픽 증가에 자동 대응 1. S3 버킷 설정 1.1 버킷 생성 및 설정 import boto3 def create_s3_bucket(): s3 = boto3.client('s3') # 버킷 생성 bucket_name = 'your-static-files-bucket' s3.create_bucket( Bucket=bucket_name, CreateBucketConfiguration={ 'LocationConstraint': 'ap-northeast-2' } ) # 버킷 정책 설정 bucket_policy = { "Version": "2012-10-17", "Statement": [ { "Sid": "PublicReadGetObject", "Effect": "Allow", "Principal": "*", "Action": "s3:GetObje...

Python에서 asyncio 완전 정복 (await, async, gather 등)

어휴, 요즘 파이썬으로 비동기 프로그래밍 하는 재미에 푹 빠졌어요! 특히 asyncio 는 정말 마법 같더라고요. 처음엔 좀 낯설었는데, 익숙해지니까 속도 향상이 눈에 띄게 느껴져서 완전 반해버렸습니다. 이 글에선 제가 asyncio 를 배우면서 깨달은 점들을 풀어놓을게요. 혹시 비동기 프로그래밍이 뭔지 잘 모르시겠다면, 간단히 말해 여러 작업을 동시에 처리해서 프로그램 속도를 엄청나게 높이는 기술이라고 생각하시면 돼요. 마치 여러 요리사가 동시에 음식을 만들어서 손님에게 빨리 제공하는 것과 비슷하죠! 일단 async 와 await 라는 녀석들이 핵심인데요, async 는 함수 앞에 붙여서 "얘는 비동기 함수야!"라고 선언하는 거예요. 그리고 await 는 다른 비동기 함수가 끝날 때까지 기다리라고 지시하는 역할을 하죠. 예를 들어, 네트워크에서 데이터를 가져오는 함수가 있다면, await 를 사용해서 데이터가 다 가져올 때까지 기다렸다가 다음 작업을 진행할 수 있어요. 그 동안 다른 작업을 처리할 수 있으니, 마치 멀티태스킹을 하는 것처럼 느껴져요. 신기하지 않나요? 그리고 asyncio.gather 는 여러 비동기 함수를 동시에 실행하고 결과를 모아주는 아주 유용한 친구입니다. 제가 웹사이트 여러 개에서 데이터를 동시에 가져와야 할 때 정말 요긴하게 썼어요. 하나씩 순서대로 가져오는 것보다 훨씬 빠르더라고요! 마치 여러 개의 탭을 동시에 열어놓고 작업하는 것과 같다고 생각하시면 될 것 같아요. 실제로 제가 썼던 코드를 보여드릴게요. 세 개의 웹사이트에서 데이터를 가져오는 예제인데요. (아래 코드 삽입) 이 코드를 보시면, fetch_data 함수가 각 웹사이트에서 데이터를 가져오는 역할을 하고, asyncio.gather 가 이 함수들을 동시에 실행하도록 도와주는 것을 볼 수 있을 거예요. asyncio.sleep(2) 는 네트워크 지연을 시뮬레이션하기 위해 넣...