Question 1

실제 코드베이스에서 “AI-생성 코드”는 무엇을 의미하나요?

Accepted Answer

AI가 생성한 코드는 프롬프트로 모델이 구조나 로직을 실질적으로 만들어낸 모든 변경을 의미합니다—자동완성 몇 줄, 전체 함수, 또는 서비스 스캐폴딩 전부가 포함됩니다.

실용적인 규칙: 도구 없이는 그렇게 쓰지 않았을 코드라면 AI-생성으로 간주하고 동일한 리뷰/테스트 기준을 적용하세요.

Question 2

AI-생성 코드를 기본적으로 프로덕션 준비된 것으로 취급해야 할까요?

Accepted Answer

AI의 출력물은 초안 으로 취급하세요. 읽기 쉽더라도 잘못될 수 있습니다. 빠른 주니어 동료가 작성한 코드로 활용하듯 다음을 요구하세요: - 명확한 기준에 따른 인간 리뷰 - 특히 부정적(negative) 테스트 포함한 테스트 추가 - 병합 전 보안/성능/신뢰성 가정 검증

Question 3

AI-생성 변경에 대해 명시적인 수용 기준이 왜 필요한가요?

Accepted Answer

명시적 수용 기준이 필요한 이유는, 생성된 코드에서 보안·성능·신뢰성이 ‘우연히’ 나타나지 않기 때문입니다.

목표(위협 모델, 지연 예산, 실패 동작 등)를 지정하지 않으면 모델은 그저 그럴듯한 패턴을 생성할 뿐이며, 여러분의 트래픽·규정·실패 모드에는 맞지 않을 수 있습니다.

Question 4

검토자가 주의해야 할 가장 흔한 위험 패턴은 무엇인가요?

Accepted Answer

검토자가 확인해야 할 반복적 위험 패턴: - 입력 검증 누락 또는 SQL/JSON/HTML 같은 문자열 조립의 위험 - 로그인 여부만 확인하고 권한(authz)을 누락하는 경우 - 내부 정보를 유출하거나 예외를 삼켜버리는 오류 처리 - 경쟁 상태, 스레드 안전하지 않은 캐시 같은 동시성 실수 또한 분기나 열린 실패(fail-open) 기본값 같은 부분 구현이 없는지도 스캔하세요.

Question 5

병합 전 적용할 수 있는 간단한 위협 모델은 무엇인가요?

Accepted Answer

간단하고 적용 가능한 위협 모델 예시: - 자산: 노출되면 피해가 큰 것들(PII, 토큰, 결제, 관리자 조작, 가용성) - 행위자: 일반 사용자, 관리자, 내부 서비스, 공격자/봇 - 신뢰 경계: 브라우저↔백엔드, 백엔드↔DB, 백엔드↔서드파티 그다음: “이 기능으로 악의적 사용자가 할 수 있는 최악의 일이 무엇인가?”를 물어보세요.

Question 6

생성된 코드를 검토할 때 실용적인 보안 체크리스트는 무엇인가요?

Accepted Answer

실용적인 보안 리뷰 체크리스트(핵심 항목): - 기본값은 거부(deny-by-default)·최소 권한 - 경계에서 입력을 검증하고, 컨텍스트에 맞게 출력 인코딩 - 모든 민감 동작에 대해 서버 측 authz 강제 - 코드·설정·로그·테스트에 비밀값이 포함되지 않음 - 클라이언트에 내부 스택트레이스나 민감 데이터가 반환되지 않음 위험 경로(권한 없음, 잘못된 입력, 만료 토큰)에 대한 적어도 하나의 부정적 테스트를 요구하세요.

Question 7

AI 제안으로 도입되는 의존성·공급망 위험을 어떻게 줄이나요?

Accepted Answer

모델은 문제를 패키지를 추가함으로써 ‘해결’하려 할 수 있고, 이는 공격 표면과 유지보수 부담을 늘립니다.

대응 가드레일:

버전 고정(락파일 커밋)으로 빌드 재현성 확보
레지스트리 제한(가능하면 내부 미러)
새 의존성마다 PR에 간단한 근거 작성 요구
CI에서 SCA와 시크릿 스캐닝을 추가하고, 심각도별 처리 규칙을 문서화

PR에서 락파일(diff)을 검토해 전이적 의존성 추가를 주시하세요.

Question 8

AI-생성 코드에 대한 성능 기대치는 어떻게 설정하나요?

Accepted Answer

성능 기대치는 숫자로 명확히 정의되어야 합니다: - 핵심 엔드포인트의 p95/p99 응답 시간 - 예상 피크에서의 처리량(RPS 등) - 부하에서의 CPU·메모리·디스크·네트워크 사용량 - 1,000건당 비용 등 비용 지표 변경 전 프로파일링을 하여 최상위 병목을 확인하고, 한 번에 하나씩 바꾸며 재측정하세요.

Question 9

실무적 성능 가드레일은 무엇인가요?

Accepted Answer

‘작동하지만 느림’이 배포되지 않도록 하는 실무적 가드레일: - 외부 호출에는 타임아웃, 제한된 재시도, 지터가 있는 지수 백오프 적용 - 비동기 경로에서 블로킹 호출 금지(무거운 연산은 워커/백그라운드로 오프로드) - 컬렉션을 반환하는 엔드포인트는 페이징/리밋 필수 - 캐시는 명확한 무효화 전략(TTL, 이벤트, 버전 키)이 있을 때만 사용 - 핵심 경로에 대해 작은 CI 성능 검사(지연/쿼리 수 임계값) 추가

Question 10

AI가 생성한 핸들러와 잡에서 검증해야 할 신뢰성 동작은 무엇인가요?

Accepted Answer

신뢰성은 단순히 ‘크래시가 없다’가 아니라, 엉망인 입력·부분 장애·재시도 상황에서도 올바르게 동작하거나 통제된 방식으로 실패하는 것입니다.

검증할 주요 항목:

멱등성(idempotency): 결제·웹훅·잡 등 재시도 가능한 작업에 안정적인 키와 이미 처리된 기록
일관성: 여러 쓰기가 함께 성공해야 하면 트랜잭션 사용, 쓰기→퍼블리시 순서 명시(아웃박스 패턴 고려)
부분 실패 처리: “DB는 성공, 퍼블리시 실패” 또는 “원격 호출이 실제로는 성공했음에도 타임아웃” 같은 시나리오 처리

무한 재시도보다 제한된 재시도와 명확한 실패 모드를 선호하세요.

Question 11

AI 실수를 잡아내기 위한 테스트 전략은 무엇인가요?

Accepted Answer

AI가 만든 코드는 보완되지 않은 상태로는 겉보기엔 완성되어 보이나 실제로는 엣지 케이스를 놓치기 쉽습니다. 테스트 전략은 ‘모두를 테스트’가 아니라 ‘뜻밖에 깨질 수 있는 것들을 테스트’하는 데 집중해야 합니다.

권장 접근:

로직에 대한 단위 테스트 + DB/큐/외부 API를 포함한 통합 테스트
부정적(negative) 경로를 의도적으로 테스트(잘못된 입력, 인증 실패, 타임아웃, 빈 상태 등)
입력 처리 컴포넌트에 대해 프로퍼티 기반/퍼즈 테스트 적용(경계 케이스, 인코딩 문제 등 발견에 효과적)
커버리지 목표는 최소선으로 두되, 고위험 경로 우선으로 테스트

AI가 생성한 연결 코드가 실패하는 경우는 통합 테스트 영역에서 자주 발생합니다.

Question 12

관측성과 사고 준비에 대해 무엇을 준비해야 하나요?

Accepted Answer

운영 관점에서 가장 빠르게 팀을 곤란하게 하는 것은 가시성 부족입니다. 관측성은 놀라운 사고를 평범한 고장 처리로 바꿉니다.

기본 요구사항:

구조화된 로그(요청 ID 전파 포함), 중요 컨텍스트(user/account ID 등), 일관된 심각도
지연(p50/p95/p99), 오류율(5xx, 재시도, 타임아웃), 포화도(CPU/메모리/스레드), 큐 깊이 같은 메트릭
사용자 영향과 연결된 SLO식 알림(예: p95 지연 X 이상 10분)
플레이북/런북과 소유자 정보가 있는 실용적 알림(누가 호출되는지, 첫 점검 항목 링크)

런북은 코드나 리포지토리 근처에 두어 시스템 변경 시 함께 업데이트되도록 하세요.

Question 13

안전하고 반복 가능한 릴리스를 위해 CI/CD에서 무엇을 통제해야 하나요?

Accepted Answer

CI/CD는 변동성을 관리 가능한 상태로 만드는 최소한의 관문입니다. 특히 생성→배포 워크플로우가 빠를수록 파이프라인의 안전 장치가 더 엄격해야 합니다.

권장 관행:

포맷팅·린트, 단위·통합 테스트, SAST·시크릿 스캔·취약점 검사 같은 ‘품질 게이트’를 모든 변경에 차단으로 적용
피처 플래그, 카나리, 블루/그린 등 단계적 배포 사용
롤백 절차를 간단하게 유지하고 정기적으로 연습
PR 템플릿에 의도·위험·테스트 노트 기록, 승인 규칙 명시

빠른 생성·배포가 안전을 침해하지 않도록 롤백 트리거와 게이트를 자동화하세요.

Question 14

AI-생성 코드의 실무적 ‘프로덕션-준비’ 정의는 무엇인가요?

Accepted Answer

AI-생성 코드의 ‘프로덕션 준비’ 정의는 “내 컴퓨터에서 실행된다”가 아니라, 팀이 실사용 트래픽·실패·기한 아래에서 안전하게 운영·수정·신뢰할 수 있어야 한다는 것입니다. 비타협 항목(최소 기준): - 보안 리뷰 완료: 위협 모델, 위험 입력, 인증·데이터 접근·비밀 처리에 대한 인간 검토 - 의미 있는 테스트 통과: 단위·통합과 가장 가능성 높은 오용에 대한 부정적 테스트 - 관측성 확보: 핵심 메트릭·로그·알림이 사용자 영향(오류·지연)에 대해 존재 - 빠른 롤백 가능: 피처 플래그 또는 알려진 정상 빌드로의 복구 가능 소유권: 생성은 가능하지만 소유는 사람에게 있습니다. 각 생성 컴포넌트에 담당 팀/소유자를 배정하세요. 소유가 불분명하면 프로덕션 준비가 아닙니다. 간단 체크리스트(리뷰에 바로 쓸 수 있게): 1. 입력 검증·명시적 authz; 코드/로그에 비밀 없음 2. 실패 모드 문서화(타임아웃·재시도·한계) 및 안전한 기본값 3. 핵심 경로에 대한 테스트와 CI 녹색 4. 오류율·지연·포화도에 대한 대시보드/알림 존재 5. 의존성 핀 고정 및 검토, 업그레이드 경로 기록 처음 30일 플랜: 기준 → 측정 → 강화 - 1–7일: 보안 스캔 결과, 성능 예산, 신뢰성 SLO 베이스라인 수립 - 8–21일: 누락된 테스트·핵심 알림·의존성 고정 추가 - 22–30일: CI/CD 게이트 강화(테스트 실패·고위험 취약점·관측성 누락 차단), 재측정 및 반복

AI-생성 코드에서 기대할 것들

명시적 기준이 필요한 이유

세 기둥(그리고 그 교집합)

생성된 코드에서 자주 보이는 위험 패턴

주로 검토해야 할 위험 영역

놓치기 쉬운 “모르는 모름(unknown unknowns)”

문맥 없는 패턴 복제

소유권은 이전되지 않는다

간단한 위협 모델부터 시작하세요

자산, 행위자, 신뢰 경계 정의

코딩 전에 실행할 수 있는 가벼운 체크리스트

리뷰어가 볼 수 있는 곳에 결정 문서화

코드 리뷰를 위한 보안 체크리스트

대부분의 문제를 잡는 빠른 점검

Diff에서 리뷰어가 봐야 할 것들

리뷰어의 작은 습관

의존성 및 공급망 안전

배포물을 고정하세요

CI 스캐닝 추가—그리고 다음 단계 정의

전이적 위험과 의존성 비대화 감시

업데이트 과정 문서화

성능: “좋음”의 정의

명확한 성능 목표 설정

병목이 숨어있는 위치 파악

최적화 전에 프로파일링하세요

실용적 성능 가드레일

무효화 계획이 있는 경우에만 캐시 사용

대기는 의도적으로 만들기

비동기 경계를 존중하세요

큰 데이터에 대비해 설계하세요

배포 전에 회귀를 잡으세요

신뢰성: 실제 조건에서의 정합성

신뢰성 결과를 사전에 정의하세요

재시도 가능한 작업에 대한 멱등성

트랜잭션과 일관성을 명시하세요

서비스 간 부분 실패 처리

AI 실수를 잡아내는 테스트 전략

계층화된 테스트 세트 구성

부정적 경로를 의도적으로 테스트

입력이 많은 코드에는 생성적 테스트 적용

커버리지: 바닥선 설정 후 위험에 집중

관측성 및 사고 대응 준비

실제로 쓸 수 있는 로그

실제 실패와 연결되는 메트릭

조치로 이어지는 알림

런북: 미래의 자신에게 주는 선물

안전하고 반복 가능한 릴리스를 위한 CI/CD 제어

모든 변경에 품질 게이트 적용

점진적 배포를 선호하세요

롤백을 평범하게 만들고 연습하세요

변경 사항과 승인자 추적

“프로덕션-준비”의 실용적 정의

비타협 항목(최소 바)

소유권: 누가 핸들링하나?

당장 도입 가능한 경량 체크리스트

첫 30일: 기준 → 측정 → 강화

자주 묻는 질문