2025년 4월 03일·8분

AI 앱에서 프런트엔드와 백엔드 간 상태 관리

UI, 세션, 데이터 상태가 AI 앱에서 프런트엔드와 백엔드 사이에서 어떻게 이동하는지, 동기화·영속성·캐싱·보안을 위한 실용적 패턴과 함께 배웁니다.

AI 기반 애플리케이션에서 “상태”가 의미하는 것

“상태”는 애플리케이션이 다음 동작을 올바르게 수행하기 위해 기억해야 하는 모든 것을 말합니다.

사용자가 채팅 UI에서 전송을 클릭하면, 앱은 사용자가 입력한 내용, 어시스턴트가 이미 응답한 내용, 요청이 아직 실행 중인지 여부, 설정(톤, 모델, 도구 등)이 무엇으로 되어 있는지를 잊어서는 안 됩니다. 이 모든 것이 상태입니다.

상태를 쉽게 말하면

유용한 관점은: 앱의 현재 진실값—사용자가 보는 화면과 시스템이 다음에 할 일을 결정하는 값들입니다. 여기에는 폼 입력 같은 명백한 항목뿐 아니라 다음과 같은 “보이지 않는” 사실들도 포함됩니다:

사용자가 어떤 대화에 있는지
마지막 응답이 스트리밍 중인지 완료되었는지
메시지 목록과 그 순서
도구 호출과 도구 결과(검색 결과, 데이터베이스 조회, 파일 추출 등)
오류, 재시도, 레이트리밋 백오프

왜 AI 앱은 더 많은 요소가 움직이는가

전통적인 앱은 데이터를 읽고 보여주고 업데이트를 저장하는 일이 주를 이룹니다. AI 앱은 추가 단계와 중간 출력이 들어옵니다:

단일 사용자 동작이 여러 백엔드 작업(LLM 호출, 도구 호출, 추가 LLM 호출)을 트리거할 수 있습니다.
응답은 점진적으로 도착할 수 있습니다(토큰 스트리밍). 따라서 UI는 부분 상태를 관리해야 합니다.
컨텍스트가 중요합니다: 시스템은 대화 메모리, 도구 출력, 모델 설정을 요청 간 일관되게 유지해야 할 수 있습니다.

이런 추가 동작 때문에 상태 관리는 종종 AI 애플리케이션에서 숨겨진 복잡성이 됩니다.

이 안내서에서 다룰 것들

앞 섹션들에서는 상태를 실용적인 범주(UI 상태, 세션 상태, 지속 데이터, 모델/런타임 상태)로 나누고, 각 항목이 어디에 있어야 하는지(프런트엔드 대 백엔드)를 보여줍니다. 또한 동기화, 캐싱, 장기 작업, 스트리밍 업데이트, 보안도 다룹니다—상태는 정확하고 안전할 때만 유용합니다.

빠른 예시 시나리오

사용자가 “지난달 청구서를 요약하고 이상한 항목을 표시해줘”라고 요청하는 채팅 앱을 상상해보세요. 백엔드는 (1) 청구서 가져오기, (2) 분석 도구 실행, (3) 요약을 UI로 스트리밍, (4) 최종 보고서 저장을 할 수 있습니다.

이 과정이 원활하게 느껴지려면 앱은 메시지, 도구 결과, 진행 상태, 저장된 출력 등을 추적해야 하며—대화를 혼동하거나 사용자 간에 데이터를 유출하지 않아야 합니다.

네 가지 상태 레이어: UI, 세션, 데이터, 모델

사람들이 AI 앱에서 “상태”라고 말할 때 서로 다른 것들을 섞어 말하는 경우가 많습니다. 상태를 UI, 세션, 데이터, 모델/런타임의 네 레이어로 나누면 어디에 두어야 할지, 누가 변경할 수 있는지, 어떻게 저장해야 할지를 결정하기가 쉬워집니다.

1) UI 상태(사용자가 지금 하고 있는 것)

UI 상태는 브라우저나 모바일 앱의 실시간 상태입니다: 텍스트 입력, 토글, 선택 항목, 어떤 탭이 열려 있는지, 버튼이 비활성화되었는지 등입니다.

AI 앱은 몇 가지 UI 특유의 요소를 더합니다:

로딩 인디케이터와 “생각 중” 상태
스트리밍 토큰(생성되며 부분적으로 표시되는 텍스트)
로컬 임시 메시지(전송 이전)

UI 상태는 재설정하기 쉽고 잃어도 안전해야 합니다. 사용자가 페이지를 새로고침하면 잃을 수 있으며, 보통은 괜찮습니다.

2) 세션 / 대화 상태(사용자의 흐름에 대한 공유 컨텍스트)

세션 상태는 사용자를 진행 중인 상호작용에 묶는 것입니다: 사용자 식별, 대화 ID, 메시지 기록의 일관된 뷰 등.

AI 앱에서는 보통 다음을 포함합니다:

메시지 기록(또는 그에 대한 참조)
도구 트레이스(어떤 함수/도구가 호출되었고 어떤 결과가 있었는지)
현재 프로젝트/문서, 선택된 모델, 워크스페이스 같은 “작업 집합” 선택

이 레이어는 프런트엔드와 백엔드에 걸쳐 있는 경우가 많습니다: 프런트엔드는 가벼운 식별자를 보유하고, 백엔드는 세션 연속성과 접근 제어의 권위자입니다.

3) 데이터 상태(영속 저장되는 레코드)

데이터 상태는 데이터베이스에 의도적으로 저장하는 것입니다: 프로젝트, 문서, 임베딩, 환경설정, 감사 로그, 청구 이벤트, 저장된 대화 기록 등.

UI 및 세션 상태와 달리 데이터 상태는 다음과 같아야 합니다:

영속적(재시작을 견딤)
쿼리 가능(검색/필터링 가능)
감사 가능(나중에 무슨 일이 있었는지 이해할 수 있음)

4) 모델 / 런타임 상태(현재 AI가 구성된 방식)

모델/런타임 상태는 답변을 생성하는 데 사용되는 운영 설정입니다: 시스템 프롬프트, 활성화된 도구, temperature/max tokens, 안전 설정, 레이트 리밋, 임시 캐시 등.

일부는 구성(안정적 기본값)이고, 일부는 일시적입니다(단기간 캐시나 요청별 토큰 예산). 대부분은 백엔드에 있어야 일관되게 제어되고 불필요하게 노출되지 않습니다.

분리가 버그를 줄이는 이유

이 레이어들이 흐려지면 전형적인 실패가 발생합니다: UI가 저장되지 않은 텍스트를 보여주거나, 백엔드가 프런트엔드가 기대하는 다른 프롬프트 설정을 사용하거나, 대화 메모리가 사용자 간에 “유출”되는 경우 등. 명확한 경계는 진실의 원천을 분명히 하고 무엇을 지속해야 하는지, 무엇을 재계산할 수 있는지, 무엇을 보호해야 하는지를 명확히 합니다.

프런트엔드 vs 백엔드: 무엇이 어디에 있어야 하는가 (그리고 그 이유)

AI 앱에서 상태의 각 항목을 브라우저(프런트엔드), 서버(백엔드), 또는 둘 다에 둘지 결정하는 습관은 버그를 줄이는 데 매우 효과적입니다. 이 선택은 신뢰성, 보안, 사용자가 새 탭을 열거나 네트워크를 잃었을 때의 예상 가능성에 영향을 미칩니다.

프런트엔드 상태: 빠르고 임시적이며 사용자 주도적

프런트엔드 상태는 빠르게 변하고 새로고침을 견딜 필요가 없는 항목에 적합합니다. 로컬에 두면 UI가 반응성이 좋아지고 불필요한 API 호출을 피할 수 있습니다.

일반적인 프런트엔드 전용 예시:

사용자가 입력 중인 초안 메시지 텍스트
테이블의 로컬 필터 및 정렬 순서
모달 열림/닫힘 상태, 선택된 탭, hover 상태

이 상태가 새로고침으로 사라져도 보통 괜찮습니다.

백엔드 상태: 권위 있고 민감하며 공유되는 것

백엔드는 신뢰해야 하고 감사되어야 하거나 일관되게 적용되어야 하는 모든 것을 보유해야 합니다. 여기에는 다른 기기/탭에서 볼 필요가 있거나 클라이언트를 변경해도 유지되어야 하는 상태가 포함됩니다.

일반적인 백엔드 전용 예시:

권한 및 역할(사용자가 무엇을 할 수 있는지)
청구/구독 상태 및 사용 한도
장기 작업(문서 인덱싱, 대형 내보내기, 파인튜닝 실행) 및 그 상태

좋은 사고방식: 잘못된 상태가 비용을 초래하거나 데이터를 유출하거나 접근 제어를 깨뜨릴 수 있다면, 그것은 백엔드에 속합니다.

공유 상태: 조정은 필요하지만 한 곳에 진실이 있어야 함

공유 상태의 예:

대화 제목
채팅에 선택된 지식 소스
여러 기기에서 사용되는 사용자 프로필 필드

공유 상태일지라도 “진실의 원천”을 선택하세요. 일반적으로 백엔드가 권위자이며 프런트엔드는 속도를 위해 복사본을 캐시합니다.

경험 규칙(그리고 흔한 안티패턴)

상태는 사용되는 장소에 최대한 가깝게 유지하되, 새로고침이나 기기 변경, 중단을 견뎌야 하는 것은 영속화하세요.

민감하거나 권위 있는 상태를 브라우저에만 저장하는 안티패턴을 피하세요(예: 클라이언트 측 isAdmin 플래그, 요금제 등급, 작업 완료 상태를 진실로 간주하는 것). UI는 이러한 값을 표시할 수 있지만 백엔드는 반드시 검증해야 합니다.

전형적인 AI 요청 라이프사이클: 클릭에서 완료까지

AI 기능은 “하나의 동작”처럼 느껴지지만, 실제로는 브라우저와 서버 간에 공유되는 일련의 상태 전환 체인입니다. 이 라이프사이클을 이해하면 UI 불일치, 누락된 컨텍스트, 중복 청구를 피하기가 쉽습니다.

1) 사용자 동작 → 프런트엔드가 의도 준비

사용자가 전송을 클릭합니다. UI는 즉시 로컬 상태를 업데이트합니다: “보류 중” 메시지 버블을 추가하고, 전송 버튼을 비활성화하며, 현재 입력(텍스트, 첨부 파일, 선택된 도구)을 캡처할 수 있습니다.

이 시점에서 프런트엔드는 상관관계 식별자를 생성하거나 첨부해야 합니다:

conversation_id: 이 항목이 속한 스레드
message_id: 새 사용자 메시지에 대한 클라이언트의 ID
request_id: 시도당 고유 ID(재시도에 유용)

이 ID들은 응답이 늦게 오거나 두 번 도착해도 양측이 같은 이벤트에 대해 이야기할 수 있게 합니다.

2) API 호출 → 서버가 검증하고 저장

프런트엔드는 사용자 메시지와 ID들을 포함한 API 요청을 보냅니다. 서버는 권한, 레이트리밋, 페이로드 형식을 검증한 뒤 conversation_id와 message_id로 키된 사용자 메시지(또는 최소한 불변 로그 레코드)를 영속화합니다.

이 저장 단계는 사용자가 요청 중에 새로고침해도 “유령 기록”이 생기는 것을 방지합니다.

3) 서버가 컨텍스트 재구성

모델을 호출하기 위해 서버는 자신의 진실의 원천에서 컨텍스트를 재구성합니다:

해당 conversation_id의 최근 메시지 가져오기
관련 레코드(문서, 환경설정, 도구 출력) 불러오기
대화 정책 적용(시스템 프롬프트, 메모리 규칙, 잘라내기)

핵심 아이디어: 전체 히스토리를 클라이언트가 제공한다고 의존하지 마세요. 클라이언트는 오래되었을 수 있습니다.

4) 모델/도구 실행 → 중간 상태

서버는 모델 호출 전후 또는 도중에 도구(검색, DB 조회 등)를 호출할 수 있습니다. 각 도구 호출은 request_id에 연관되어 추적되어야 하며, 감사 및 안전한 재시도를 위해 기록되어야 합니다.

5) 응답(스트리밍 또는 비스트리밍) → UI 완료

스트리밍의 경우 서버는 부분 토큰/이벤트를 보냅니다. UI는 보류 중인 어시스턴트 메시지를 점진적으로 업데이트하지만, 최종 이벤트가 완료를 표시할 때까지는 ‘진행 중’으로 취급합니다.

6) 대비해야 할 실패 지점

재시도, 중복 제출, 순서가 다른 응답이 발생합니다. 서버에서 중복 제거를 위해 request_id를 사용하고, UI에서 조정하기 위해 message_id를 사용하세요(활성 요청과 일치하지 않는 늦은 청크는 무시). 항상 명확한 “실패” 상태를 보여주고, 중복 메시지를 생성하지 않는 안전한 재시도 경로를 제공하세요.

세션과 대화 메모리: 혼란 없이 컨텍스트 유지하기

재시도 중 중복 방지

Koder.ai가 요청 ID와 멱등 키를 엔드포인트에 스캐폴딩합니다.

빌드 시작

세션은 사용자의 행동을 묶는 “스레드”입니다: 어떤 워크스페이스에 있는지, 마지막으로 무엇을 검색했는지, 어떤 초안을 편집 중인지, 어떤 대화에 AI 응답이 이어져야 하는지 등. 좋은 세션 상태는 페이지 간에, 이상적으로는 기기 간에도 앱이 연속적으로 느껴지게 합니다—단 백엔드를 모든 사용자가 말한 모든 것을 쌓아두는 쓰레기장으로 만들지는 않도록 합니다.

세션 상태 목표

목표는: (1) 연속성(사용자가 떠났다가 돌아와도 이어질 수 있음), (2) 정확성(AI가 올바른 대화에 대해 올바른 컨텍스트를 사용), (3) 격리(한 세션이 다른 세션으로 유출되지 않음). 여러 기기를 지원하면 세션을 사용자 범위 + 기기 범위로 취급하세요: “같은 계정”이 항상 “같은 열린 작업”을 의미하지는 않습니다.

쿠키 vs 토큰 vs 서버 세션

보통 다음 중 하나를 선택해 세션을 식별합니다:

쿠키: 웹 앱에 가장 간단합니다. 브라우저가 자동으로 전송합니다. 전통적인 세션에 좋지만 HttpOnly, Secure, SameSite 같은 보안 플래그를 설정하고 CSRF를 적절히 처리해야 합니다.
토큰(예: JWT): API와 모바일 앱에 적합합니다. 클라이언트가 명시적으로 첨부할 수 있습니다. 확장성이 좋지만 폐기와 회전 설계가 추가로 필요하며(그리고 토큰에 민감한 상태를 담아서는 안 됩니다) 권한 철회가 까다롭습니다.
서버 세션: 서버가 세션 데이터를 저장(종종 Redis)하고 클라이언트는 불투명한 세션 ID만 보유합니다. 철회 및 업데이트가 쉽지만 세션 스토어를 운영하고 확장해야 합니다.

대화 메모리 전략

“메모리”는 모델에 다시 보내기로 선택한 상태를 말합니다.

전체 히스토리: 가장 정확하지만 비용이 많이 들고 오래된 민감한 내용을 드러낼 수 있습니다.
요약된 히스토리: 실행 요약을 유지하고 최근 몇 턴만 보관; 비용 효율적이고 보통 충분합니다.
윈도우 컨텍스트: 마지막 N개의 메시지만 사용; 가장 단순하지만 초기의 중요한 결정을 잃을 수 있습니다.

실용적인 패턴은 요약 + 윈도우입니다: 예측 가능하고 모델의 놀라운 행동을 피하는 데 도움이 됩니다.

도구 호출: 반복 가능하고 감사 가능한 방식으로

AI가 도구(검색, DB 쿼리, 파일 읽기 등)를 사용하면 각 도구 호출을 입력, 타임스탬프, 도구 버전, 반환된 출력(또는 그에 대한 참조)과 함께 저장하세요. 이렇게 하면 “AI가 왜 그렇게 말했는가”를 설명하고 디버깅을 위해 실행을 재생하며, 도구나 데이터셋이 변경되어 결과가 달라졌는지 감지할 수 있습니다.

프라이버시 가드레일

기본적으로 장기 메모리를 저장하지 마세요. 연속성에 필요한 것(대화 ID, 요약, 도구 로그)만 유지하고 보존 기간을 설정하며, 명확한 제품 이유와 사용자 동의가 없는 한 원시 사용자 텍스트를 영속화하지 마세요.

안전하게 상태 동기화하기: 진실의 원천과 충돌 처리

같은 “항목”을 UI, 다른 브라우저 탭, 또는 백그라운드 작업에서 편집할 수 있으면 상태가 위험해집니다. 해결책은 영리한 코드보다 명확한 소유권에 가깝습니다.

진실의 원천 정의

각 상태 항목에 대해 어떤 시스템이 권위자인지 결정하세요. 대부분의 AI 애플리케이션에서 대화 설정, 도구 권한, 메시지 기록, 청구 한도, 작업 상태 등 올바라야 하는 것은 백엔드가 정규 기록을 소유해야 합니다. 프런트엔드는 속도를 위해 캐시하고 파생 상태를 보유할 수 있지만(선택된 탭, 초안 프롬프트 텍스트, “입력 중” 표시 등) 불일치가 있을 때는 백엔드가 옳다고 가정해야 합니다.

실용 규칙: 새로고침했을 때 잃어버리면 화가 날 항목은 아마 백엔드에 있어야 합니다.

낙관적 UI 업데이트(주의해서 사용)

낙관적 업데이트는 앱을 즉각적으로 느끼게 합니다: 설정을 토글하면 UI를 즉시 업데이트하고 서버로 확인을 요청합니다. 이 방법은 저위험, 되돌릴 수 있는 동작(예: 대화 즐겨찾기)에 적합합니다.

서버가 변경을 거부하거나 변형할 수 있는 경우(권한 검사, 쿼터 한도, 검증, 서버측 기본값)에는 혼란을 초래합니다. 그런 경우에는 “저장 중…” 상태를 표시하고 서버 확인 후 UI를 업데이트하세요.

충돌 처리(두 탭, 한 대화)

충돌은 두 클라이언트가 서로 다른 시작 버전을 기반으로 동일한 레코드를 업데이트할 때 발생합니다. 흔한 예: 탭 A와 탭 B가 모델의 temperature를 모두 변경.

가벼운 버전 관리를 사용해 백엔드가 오래된 쓰기를 감지할 수 있게 하세요:

updated_at 타임스탬프(간단, 사람이 디버깅하기 좋음)
ETag / If-Match 헤더(HTTP 네이티브)
증가하는 리비전 번호(명시적 충돌 감지)

버전이 일치하지 않으면 충돌 응답(대개 HTTP 409)을 반환하고 최신 서버 객체를 함께 전송하세요.

API 설계를 불일치를 줄이도록 만들기

쓰기 작업 후 API가 저장된 객체(서버 생성 기본값, 정규화된 필드, 새 버전 포함)를 반환하게 하세요. 이렇게 하면 프런트엔드가 캐시된 복사본을 즉시 교체할 수 있습니다—무엇이 변경되었는지 추측하는 대신 한 번의 진실 업데이트가 됩니다.

캐싱과 성능: 빠르게 만들되 오래된 상태는 피하기

캐싱은 AI 앱을 즉각적으로 느끼게 하는 가장 빠른 방법 중 하나지만, 동시에 상태의 두 번째 복사본을 만듭니다. 잘못된 항목을 또는 잘못된 위치에 캐시하면 빠르지만 혼란스러운 UI를 배포하게 됩니다.

클라이언트에 캐시할 내용

클라이언트 측 캐시는 권위가 아닌 경험에 초점을 맞춰야 합니다. 좋은 후보는 최근 대화 미리보기(제목, 마지막 메시지 스니펫), UI 환경설정(테마, 선택된 모델, 사이드바 상태), 낙관적 UI 상태(“전송 중” 메시지) 등입니다.

클라이언트 캐시는 작고 폐기 가능하게 유지하세요: 캐시가 지워져도 서버에서 재요청하면 앱이 계속 동작해야 합니다.

서버에 캐시할 내용

서버 캐시는 비용이 많이 들거나 자주 반복되는 작업에 초점을 맞춰야 합니다:

재사용해도 안전한 도구 결과(예: 동일 도시의 날씨 조회를 5분 내에 재사용)
반복 쿼리에 대한 임베딩 조회 및 벡터 검색 결과(짧은 TTL로 자주 사용)
레이트리밋 상태 및 스로틀 카운터(API와 비용 보호용)

토큰 수, 검열 결정, 문서 파싱 출력 같은 파생 상태도 서버에서 캐시할 수 있습니다—결정론적이고 비용이 큰 것들.

캐시 무효화 기본(복잡해지지 않게)

세 가지 실용 규칙:

입력(user_id, 모델, 도구 파라미터, 문서 버전 등)을 인코딩하는 명확한 캐시 키를 사용하세요.
기본 데이터가 얼마나 빨리 변경되는지에 따라 TTL을 설정하세요. 짧은 TTL이 영리한 로직보다 낫습니다.
정확성이 속도보다 중요한 경우 캐시를 우회하세요: 사용자가 문서를 업데이트하거나 권한을 변경하거나 새로고침을 요청할 때.

캐시 항목이 언제 잘못되는지 설명할 수 없다면 캐시하지 마세요.

비밀 또는 개인 데이터를 공유 캐시에 저장하지 않기

API 키, 인증 토큰, 민감한 텍스트를 포함한 원시 프롬프트, 사용자별 콘텐츠를 CDN 같은 공유 레이어에 넣지 마세요. 사용자 데이터를 캐시해야 한다면 사용자별로 분리하고 저장 시 암호화하거나 기본 데이터베이스에 보관하세요.

영향 측정: 속도 vs 오래된 UI

캐싱은 가정이 아니라 증명되어야 합니다. 캐싱 전후의 p95 지연, 캐시 적중률, “렌더링 후 메시지 업데이트” 같은 사용자 가시 오류를 추적하세요. 나중에 UI와 모순되는 빠른 응답은 약간 느리지만 일관된 응답보다 종종 더 나쁩니다.

영속성 및 장기 작업: 작업, 큐, 상태 관리

백그라운드 작업을 깔끔하게 추가

큐→실행→성공 흐름을 모델링해 UI에 안정적인 진행 상태를 보여줍니다.

작업 생성

어떤 AI 기능은 1초 내에 끝납니다. 다른 것은 몇 분이 걸립니다: PDF 업로드 및 파싱, 임베딩 및 지식베이스 인덱싱, 다단계 도구 워크플로 실행 등. 이런 경우 상태는 화면상의 것만이 아니라 재시작, 재시도, 시간 경과를 견뎌야 하는 것입니다.

무엇을 영속화할지(그리고 그 이유)

제품 가치를 제공하는 것만 영속화하세요.

대화 기록: 메시지, 타임스탬프, 사용자 식별, 사용된 모델/도구 정보 등. 이는 “나중에 다시 이어가기”, 감사 추적, 더 나은 지원을 가능하게 합니다.

사용자 및 워크스페이스 설정: 선호 모델, temperature 기본값, 기능 토글, 시스템 프롬프트, 기기 간에 따라다녀야 하는 UI 환경설정 등은 DB에 있어야 합니다.

파일 및 아티팩트: 업로드, 추출된 텍스트, 생성된 보고서 등은 보통 객체 스토리지에 저장하고 DB 레코드가 이를 가리킵니다. DB는 메타데이터(소유자, 크기, 콘텐츠 타입, 처리 상태)를, 블롭 스토어는 실제 바이트를 보관합니다.

긴 작업을 위한 백그라운드 잡

요청이 정상적인 HTTP 타임아웃 내에 안정적으로 완료되지 않으면 작업을 큐로 이동하세요.

전형적인 패턴:

프런트엔드는 POST /jobs와 같은 API를 호출하며 입력(파일 id, conversation id, 파라미터)을 보냅니다.
백엔드는 작업을 큐에 넣고(추출, 인덱싱, 배치 도구 실행) 즉시 job_id를 반환합니다.
워커가 비동기적으로 작업을 처리하고 결과를 영속 저장소에 씁니다.

이렇게 하면 UI가 응답성을 유지하고 재시도가 더 안전해집니다.

UI가 신뢰할 수 있는 상태 표시

작업 상태를 queued → running → succeeded/failed(선택적으로 canceled)처럼 명시적이고 쿼리 가능하게 만드세요. 이러한 전환을 서버측에 타임스탬프와 오류 상세와 함께 저장하세요.

프런트엔드에서는 상태를 명확히 반영하세요:

Queued/running: 스피너를 표시하고 중복 작업을 비활성화
Failed: 간결한 오류와 Retry 버튼 제공
Succeeded: 결과 아티팩트를 로드하거나 대화를 업데이트

GET /jobs/{id}(폴링) 또는 SSE/WebSocket 같은 스트리밍 업데이트를 제공해 UI가 추측하지 않게 하세요.

멱등성 키: 중복 쓰기 없는 재시도

네트워크 타임아웃은 발생합니다. 프런트엔드가 POST /jobs를 재시도할 때 동일한 작업(그리고 동일한 청구)을 두 번 생성하지 않도록 하세요.

논리적 동작마다 Idempotency-Key를 요구하세요. 백엔드는 이 키와 결과 job_id/응답을 저장하고 반복 요청에는 동일한 결과를 반환합니다.

정리 및 만료 정책

장기 실행 AI 앱은 데이터를 빠르게 축적합니다. 보존 규칙을 초기에 정의하세요:

오래된 대화를 N일 뒤 만료(또는 사용자가 설정 가능)
소스가 삭제되면 파생 아티팩트를 삭제
실패한 작업과 중간 파일을 주기적으로 정리

정리는 상태 관리의 일부입니다: 위험, 비용, 혼란을 줄입니다.

스트리밍 응답 및 실시간 업데이트: 부분 상태 관리

스트리밍은 “답변”이 더 이상 단일 블롭이 아니기 때문에 상태를 더 까다롭게 만듭니다. 단어 단위로 도착하는 부분 토큰과 때로는 부분 도구 작업(검색이 시작되고 나중에 완료)이 있습니다. 따라서 UI와 백엔드는 무엇이 임시이고 무엇이 최종인지에 대해 합의해야 합니다.

백엔드: 단순 텍스트가 아닌 타입이 지정된 이벤트 스트림 전송

명확한 패턴은 타입과 페이로드가 있는 작은 이벤트들의 시퀀스를 스트리밍하는 것입니다. 예를 들면:

token: 점진적 텍스트(작은 청크)
tool_start: 도구 호출 시작(예: “검색 중…”, id 포함)
tool_result: 도구 출력 준비(동일 id)
done: 어시스턴트 메시지 완료
error: 실패(사용자용 안전 메시지와 디버그 id 포함)

이 이벤트 스트림은 프런트엔드가 추측하지 않고 진행 상황을 정확히 렌더링할 수 있게 해 디버깅과 버전 관리가 쉽습니다.

프런트엔드: 추가(append-only) 업데이트 후 최종 커밋

클라이언트에서는 스트리밍을 추가 전용으로 처리하세요: “초안” 어시스턴트 메시지를 만들고 token 이벤트가 도착할 때마다 이어붙입니다. done을 받으면 커밋을 수행하세요: 메시지를 최종으로 표시하고(로컬에 저장한다면) 영속화하고 복사, 평가, 재생성 같은 작업을 잠금 해제합니다.

이 방식은 스트리밍 중에 기록을 다시 쓰는 일을 피하고 UI를 예측 가능하게 유지합니다.

중단 처리(취소, 연결 끊김, 타임아웃)

스트리밍은 중간에 끝난 작업의 가능성을 높입니다:

사용자 취소: 취소 신호를 보내고 토큰 렌더링을 중단하며 초안을 시각적으로 취소로 표시
네트워크 끊김: 스트림 중단, “재연결 중…” 표시, 완료를 가정하지 않음
서버 타임아웃/오류: 초안을 실패로 마감하고 재시작은 새 요청으로 하게 함(스트림을 조용히 이어 붙이지 않음)

재구성(rehydration): 안정 상태로 재로딩 및 재구성

페이지가 스트리밍 도중 새로고침되면 최신 커밋된 메시지와 저장된 초안 메타데이터(message id, 누적 텍스트, 도구 상태)를 기반으로 재구성하세요. 스트림을 재개할 수 없다면 초안을 중단된 것으로 보여주고 사용자가 재시도하도록 하세요. 완료된 것처럼 속이지 마세요.

보안 및 개인정보: 엔드투엔드로 상태 보호하기

빌드하면서 크레딧 적립

Koder.ai에 배포한 결과를 공유하거나 동료를 추천해 추가 크레딧을 받으세요.

무료 가입

상태는 단순히 “저장하는 데이터”가 아닙니다—사용자 프롬프트, 업로드, 환경설정, 생성된 출력, 그리고 모든 것을 연결하는 메타데이터입니다. AI 앱에서는 이러한 상태가 매우 민감할 수 있으므로 각 레이어에 보안을 설계해야 합니다.

비밀은 서버에 보관

클라이언트가 앱을 가장해 접근할 수 있게 하는 항목은 모두 백엔드 전용으로 유지하세요: API 키, 프라이빗 커넥터(슬랙/드라이브/DB 자격증명), 내부 시스템 프롬프트나 라우팅 로직 등. 프런트엔드는 “이 파일을 요약해줘” 같은 동작을 요청할 수 있지만, 백엔드가 어떻게 어떤 자격으로 실행할지 결정해야 합니다.

모든 쓰기(및 대부분의 읽기)를 권한 검사

각 상태 변형을 권한이 필요한 작업으로 취급하세요. 클라이언트가 메시지를 생성하거나 대화 이름을 바꾸거나 파일을 첨부하려 하면, 백엔드는 다음을 검증해야 합니다:

사용자가 인증되었는가
사용자가 리소스(대화, 워크스페이스, 프로젝트)의 소유자인가
사용자가 그 동작을 수행할 권한이 있는가(역할, 요금제 한도, 조직 정책)

이렇게 하면 conversation_id를 바꿔 다른 사용자의 기록에 접근하는 “ID 추측” 공격을 방지할 수 있습니다.

브라우저를 믿지 말 것: 검증 및 정제

클라이언트가 제공한 모든 상태는 신뢰할 수 없는 입력이라고 가정하세요. 스키마와 제약(타입, 길이, 허용된 열거형)을 검증하고 대상(예: SQL/NoSQL, 로그, HTML 렌더링)에 맞게 정제하세요. 상태 업데이트(환경설정, 도구 파라미터 등)를 허용할 때는 임의 JSON을 병합하지 말고 허용된 필드만 화이트리스트로 처리하세요.

중요한 동작에 대한 감사 로그

영속 상태를 변경하는 동작(공유, 내보내기, 삭제, 커넥터 접근)에 대해서는 누가 언제 무엇을 했는지 기록하세요. 가벼운 감사 로그는 사고 대응, 고객 지원, 규정 준수에 도움이 됩니다.

데이터 최소화 및 암호화

기능 제공에 필요한 것만 저장하세요. 영구적으로 전체 프롬프트가 필요하지 않다면 보존 기간이나 삭제(마스킹)를 고려하세요. 민감한 상태(토큰, 커넥터 자격증명, 업로드된 문서)는 적절히 암호화해 저장하고 전송 시 TLS를 사용하세요. 운영 메타데이터와 콘텐츠를 분리해 접근을 더 엄격히 제어하세요.

실용적 참조 아키텍처와 빌드 체크리스트

AI 앱에 대한 유용한 기본은 단순합니다: 백엔드가 진실의 원천이고 프런트엔드는 빠른 낙관적 캐시입니다. UI는 즉각적으로 느껴질 수 있지만(메시지, 작업 상태, 도구 출력, 청구 관련 이벤트 등) 잃어버리면 안 되는 항목은 반드시 서버 측에서 확인하고 저장하세요.

빠른 제품 표면을 빠르게 생성하는 “vibe-coding” 워크플로우로 작업할 때는 상태 모델이 더욱 중요해집니다. Koder.ai 같은 플랫폼은 채팅에서 전체 웹/백엔드/모바일 앱을 빠르게 배포하도록 도와주지만 동일한 규칙이 적용됩니다: 소스 오브 트루스, ID, 상태 전환을 사전에 설계하는 것이 빠른 반복에서 안전합니다.

배포 가능한 참조 아키텍처

프런트엔드(브라우저/모바일)

UI 상태: 열린 패널, 초안 프롬프트 텍스트, 선택된 모델, 임시 “입력 중” 표시
캐시된 서버 상태: 최근 대화, 마지막 알려진 작업 상태, 부분 스트림 버퍼
항상 첨부되는 단일 요청 파이프라인: session_id, conversation_id, 새로운 request_id

백엔드(API + 워커)

API 서비스: 입력을 검증하고 레코드를 생성하며 스트리밍 응답 발행
영속 저장소(SQL/NoSQL): 대화, 메시지, 도구 호출, 작업 상태
큐 + 워커: 장기 작업(RAG 인덱싱, 파일 파싱, 이미지 생성)
캐시(선택): 버전/타임스탬프로 키를 지정한 핫 리드(대화 요약, 임베딩 메타데이터 등)

참고: 일관성을 유지하는 실용적 방법은 백엔드 스택을 초기에 표준화하는 것입니다. 예를 들어 Koder.ai가 생성한 백엔드는 일반적으로 Go와 PostgreSQL을 사용하고 프런트엔드에 React를 사용해 권위 있는 상태를 SQL에 중앙화하고 클라이언트 캐시는 폐기 가능하게 유지하기 쉽습니다.

먼저 상태 모델을 설계하라

화면을 만들기 전에 각 레이어에서 의존할 필드를 정의하세요:

ID와 소유권: user_id, org_id, conversation_id, message_id, request_id.
타임스탬프와 정렬: created_at, updated_at, 메시지 순서를 위한 명시적 sequence.
상태 필드: 작업과 도구 호출을 위한 queued | running | streaming | succeeded | failed | canceled.
버전 관리: 충돌 안전 업데이트를 위한 etag 또는 version.

이렇게 하면 UI는 “보기에는 맞는 것 같지만” 재시도, 새로고침, 동시 편집을 조정하지 못하는 고전적 버그를 피할 수 있습니다.

일관된 API 형태 사용

기능 전반에서 엔드포인트를 예측 가능하게 유지하세요:

GET /conversations (목록)
GET /conversations/{id} (조회)
POST /conversations (생성)
POST /conversations/{id}/messages (추가)
PATCH /jobs/{id} (상태 업데이트)
GET /streams/{request_id} 또는 POST .../stream (스트림)

오류를 포함해 모든 곳에서 동일한 응답 포맷을 반환해 프런트엔드가 일관되게 상태를 갱신하도록 하세요.

상태가 깨질 수 있는 곳에 관찰성 추가

모든 AI 호출에 대해 request_id를 로그하고 반환하세요. 도구 호출의 입력/출력을(마스킹/비식별화와 함께) 기록하고, 지연, 재시도, 최종 상태를 기록하세요. “모델이 무엇을 보았고, 어떤 도구가 실행되었으며, 어떤 상태를 영속화했는가?”에 답할 수 있게 만드세요.

빌드 체크리스트(일반적인 상태 버그 방지용)

백엔드가 진실의 원천이고 프런트엔드 캐시는 명확히 라벨된 폐기 가능 항목이다.
모든 쓰기는 request_id(또는 Idempotency-Key)를 사용해 멱등성이 보장되어 재시도가 안전하다.
상태 전환은 명시적이고 검증된다(예: queued에서 succeeded로의 무언의 점프 금지).
스트리밍 업데이트는 ID/시퀀스로 병합되며 “마지막 메시지 승리”로 처리하지 않는다.
충돌은 version/etag 또는 서버측 병합 규칙으로 처리된다.
PII와 비밀은 클라이언트 상태에 저장되지 않으며 로그는 기본적으로 마스킹된다.
디버깅용 대시보드가 하나 있다: 요청, 도구 호출, 작업 상태, 오류를 보여주는 뷰.

더 빠른 빌드 사이클(AI 보조 생성 포함)을 채택할 때는 스키마 검증, 멱등성, 이벤트형 스트리밍 같은 가드레일을 자동으로 적용해 “빨리 움직이기”가 상태 표류로 이어지지 않도록 고려하세요. 실제로 이런 점에서 Koder.ai 같은 종단 간 플랫폼은 전달 속도를 높이되 상태 처리 패턴을 웹, 백엔드, 모바일 전반에 걸쳐 일관되게 유지하는 데 유용할 수 있습니다.