TIL(Today I Learned)

12월 22일(금)

공부한 내용을 제 언어로 빠르게 정리한 내용이라서 잘못된 내용이 있을 수 있습니다.

인프런: 모든 개발자를 위한 HTTP 웹 기본 지식(김영한님 강의)

모든 것이 HTTP

  • HTTP는 HyperText Transfer Protocol로 html 을 전송하기 위해 개발된 프로토콜
  • 지금은 모든 것을 HTTP 메시지로 전송
    • HTML, TEXT
    • IMAGE, 음성, 영상, 파일
    • JSON, XML(API)
    • 거의 모든 형태의 데이터 전송 가능
    • 서버간의 데이터를 주고 받을 때도 대부분 HTTP 사용
    • 지금은 HTTP 시대!
  • HTTP 역사
    • HTTP/0.9 1991년: GET 메서드만 지원, HTTP 헤더 X
    • HTTP/1.0 1996년: 메서드, 헤더 추가
    • HTTP/1.1 1997년: 가장 많이 사용, 우리에게 가장 중요한 버전
      • RFC2068(1997) -> RFC2616(1999) -> RFC7230~7235(2014)
    • HTTP/2 2015년: 성능 개선
    • HTTP/3 진행중: TCP 대신에 UDP 사용, 성능 개선
  • 기반 프로토콜
    • TCP: HTTP/1.1, HTTP/2
      • TCP는 3 way handshake 등 때문에 느리다. 그래서 3버전은 UDP 사용
    • UDP: HTTP/3
    • 현재 HTTP/1.1 주로 사용
      • HTTP/2, HTTP/3도 점점 증가
  • HTTP 특징
    • 클라이언트 서버 구조
    • 무상태 프로토콜(Stateless), 비연결성
    • HTTP 메시지
    • 단순함, 확장 가능

클라이언트 서버 구조

  • Request Response 구조
  • 클라이언트는 서버에 요청을 보내고, 응답을 대기
  • 서버가 요청에 대한 결과를 만들어서 응답
  • 예전에는 클라이언트와 서버가 분리되어있지 않았음.
    • 비지니스 로직, 데이터는 서버에 넣음
    • 클라이언트는 UI, 사용성만 집중
    • 사용자가 늘어나도 클라이언트는 건들지 않고 서버만 확장하면된다는 이점

무상태 프로토콜

  • 서버가 클라이언트 상태를 보존하지 않음
  • 장점: 서버 확정성 높음
  • 단점: 클라이언트가 추가 데이터 전송해야함
  • 예제
    • Stateful, Stateless 차이 (고객, 점원 비유; 고객은 클라이언트, 점원은 서버)
      • Stateful(상태유지, 서버가 클라이언트의 이전 상태를 보존)
          고객: 이 노트북 얼마인가요?
          점원: 100만원 입니다. (노트북 상태 유지)
          고객: 2개 구매하겠습니다.
          점원: 200만원 입니다. 신용카드, 현금 중에 어떤걸로 구매하시겠어요? (노트북, 2개 상태 유지)
          고객: 신용카드로 구매하겠습니다.
          점원: 200만원 결제완료되었습니다. (노트북, 2개, 신용카드 상태 유지)
        
      • Stateful, 점원이 중간에 바뀌면? 이상하게 작동함
          고객: 이 노트북 얼마인가요?
          점원A: 100만원 입니다.
          고객: 2개 구매하겠습니다.
          점원B: ? 무엇을 2개 구매하시겠어요?
          고객: 신용카드로 구매하겠습니다.
          점원C: ? 무슨 제품을 몇개 신용카드로 구매하시겠어요?
        
      • Stateless
          고객: 이 노트북 얼마인가요?
          점원: 100만원 입니다.
          고객: 노트북 2개 구매하겠습니다.
          점원: 노트북 2개 200만원 입니다. 신용카드, 현금 중에 어떤걸로 구매하시겠어요?
          고객: 노트북 2개를 신용카드로 구매하겠습니다.
          점원: 200만원 결제완료되었습니다.
        
      • Stateless, 점원이 바뀌어도 정상 작동
          고객: 이 노트북 얼마인가요?
          점원A: 100만원 입니다.
          고객: 노트북 2개 구매하겠습니다.
          점원B: 노트북 2개 200만원 입니다. 신용카드, 현금 중에 어떤걸로 구매하시겠어요?
          고객: 노트북 2개를 신용카드로 구매하겠습니다.
          점원C: 200만원 결제완료되었습니다.
        
  • 정리
    • 상태유지: 중간에 다른 점원으로 바뀌면 안된다.(중간에 다른 점원으로 바뀔때 상태 정보를 다른 점원에게 미리 알려줘야한다.)
    • 무상태: 중간에 다른 점원으로 바뀌어도 된다.
      • 갑자기 고객이 증가해도 점원을 대거 투입할 수 있다.
      • 갑자기 클라이언트 요청이 증가해도 서버를 대거 투입할 수 있다.
    • 무상태는 응답 서버를 쉽게 바꿀 수 있다. -> 무한한 서버 증설가능
  • 장점
    • Scale Out - 수평 확장 유리
  • 한계
    • 모든것을 무상태로 설계 할 수 있는 경우도 있고 없는 경우도 있다.
    • 무상태
      • 예) 로그인이 필요 없는 단순한 서비스 소개화면
    • 상태유지
      • 예) 로그인
    • 로그인한 사용자의 경우 로그인 했다는 상태를 서버에 유지
    • 일반적으로 브라우저 쿠키와 서버 세션등을 사용해서 상태 유지
    • 상태 유지는 최소한으로만 사용해야한다. (꼭 필요한 경우에만)
    • 상태를 매번 클라이언트에서 보내야하므로 전송해야하는 데이터가 많다는 단점

비연결성(Connectionless)

  • 연결을 유지하는 모델
    • 클라이언트가 요청을 보내면 TCP/IP 연결을 하고 서버는 응답을 보내고 연결을 유지하는 모델
    • 서버는 연결을 계속 유지, 서버 자원 소모
  • 연결을 유지하지 않는 모델
    • 클라이언트가 요청을 보내면 응답을 보내고 연결을 끊는 모델
    • 서버는 연결 유지하지 않고 최소한의 자원만 사용
  • 비연결성
    • HTTP는 기본이 연결을 유지하지 않는 모델
    • 일반적으로 초단위 이하의 빠른 속도로 응답
    • 1시간 동안 수천명이 서비스를 사용해도 실제 서버에서 동시에 처리하는 요청은 수십개 이하로 매우 작음
      • 예) 웹 브라우저에서 계속 연속해서 검색 버튼을 누르지는 않는다.
    • 연결을 유지하지 않으므로 서버 자원을 매우 효율적으로 사용할 수 있음
  • 한계
    • TCP/IP 연결을 새로 맺어야함 - 3 way handshake를 계속 다시 해야하므로 시간 추가
    • 웹 브라우저로 사이트를 요청하면 HTML 뿐만 아니라 자바스크립트, CSS, 추가 이미지 등 수많은 자원이 함께 다운로드
      • 매 자원마다 TCP/IP 연결을 하면 비효율적, 지금은 HTTP 지속 연결(Persistent Connections)로 문제 해결
        • HTTP 지속 연결(Persistent Connections)은 페이지에 필요한 모든 자원이 다운로드 될때까지 연결을 유지
    • HTTP/2, 3에서 더많은 최적화
  • 서버 개발자들이 어려워하는 업무
    • 정말 같은 시간에 딱 맞추어 발생하는 대용량 트래픽
    • 예) 선착순 이벤트, 명절 KTX 예약, 학과 수업 등록
    • 예) 저녁 6시 선착순 1000명 치킨 할인 이벤트 -> 수만명 동시 요청
    • 이를 위해 최대한 Stateless하게 설계한다.
      • 첫페이지는 로그인 없는 정적 페이지만 보여주게 하고, 이벤트 참여 버튼을 만들어서 다른 내용보다가 참여버튼을 누르게 하도록함

HTTP 메세지

  • HTTP 메세지 구조
    • start-line 시작라인
    • header 헤더
    • empty line 공백 라인(CRLF)
    • message body
  • 요청 메시지와 응답 메시지는 시작라인이 다름
  • 요청 메세지도 message body를 가질수도 있다.
  • 공식 스펙
    HTTP-message = start-line
    *( header-field CRLF)
    CRLF
    [ message-body ]
    
  • 시작라인
    • 요청 메시지
      • start-line = request-line
      • request-line = method SP(공백) request-target SP HTTP-version CRLF(엔터)
        • method: GET, POST, PUT, DELETE …
        • 서버가 수행해야할 동작 지정
          • GET: 리소스 조회
          • POST: 요청 내역. 처리
        • 요청 대상
          • absolute-path[?query](절대경로[?쿼리]_
          • 절대경로는 “/”로 시작하는 경로
            • 참고: *, http://…?x=y 와 같은 다른 유형의 경로 지정 방법도 있다.
    • 응답 메시지
      • start-line = status-line
      • status-line = HTTP-version SP status-code SP reason-phrase CRLF
        • HTTP 버전
        • HTTP 상태 코드: 요청 성공, 실패를 나타냄
          • 200: 성공
          • 400: 클라이언트 요청 오류
          • 500: 서버 내부 오류
        • reason-phrase: 사람이 이해할 수 있는 짧은 상태 코드 설명 글(OK)
  • 헤더
    • header-field = field-name “:” OWS field-value OWS (OWS: 띄어쓰기 허용)
      • field-name은 대소문자 구문 없음
    • HTTP 전송에 필요한 모든 부가정보가 들어감
    • 예) 메세지 바디의 내용, 바디의 크기, 압축, 인증, 요청 클라이언트(브라우저) 정보, 서버 애플리케이션 정보, 캐시 관리 정보…
    • 필요시 임의의 헤더 추가 가능(약속한 클라이언트와 서버에서 필요한 헤더)
  • 메시지 바디
    • 실제 전송할 데이터
    • HTML 문서, 이미지, 영상, JSON 등등 byte로 표현할 수 있는 모든 데이터 전송 가능
  • 단순함 확장 가능
    • HTTP는 단순하다, 스펙도 읽어볼만…
    • HTTP 메시지도 매우 단순
    • 크게 성공하는 표준 기술은 단순하지만 확장 가능한 기술