Computer Science/📡Network

[Network] HTTP 기본

seungwookim 2021. 10. 4. 18:52

김영한님의 모든 개발자를 위한 HTTP 웹 기본 지식 강의를 듣고 정리하였습니다.

모든 것이 HTTP

HTTP(HyperText Transfer Protocol)란, 인터넷 상에서 데이터를 주고 받을 때 사용하는 통신 규약이다.

초기에는 HTML과 같은 하이퍼텍스트 문서를 전송하는 데 주로 사용되었지만, 현재는 다양한 형태의 정보를 전송하는데 사용된다.

  • HTTP 메시지에 모든 것을 전송
    • HTML, TEXT
    • 이미지, 음성, 영상, 파일
    • JSON, XML (API)
  • 거의 모든 형태의 데이터 전송 가능
  • 서버 간에 데이터를 주고 받을 때도 대부분 HTTP 사용

 

HTML 역사

  • HTTP/0.9 1991년: GET 메서드만 지원, HTTP 헤더 X
  • HTTP/1.0 1996년: 메서드, 헤더 추가
  • HTTP/1.1 1997년: 가장 많이 사용, 우리에게 가장 중요한 버전
    • RFC2068(1997) -> RFC2616(1999) -> RFC7230~7235(2014)
  • HTTP/2 2015년: 성능 개선
  • HTTP/3 진행중: TCP 대신에 UDP 사용, 성능 개선

 

기반 프로토콜

  • TCP: HTTP/1.1, HTTP/2
  • UDP: HTTP/3
    • TCP가 안정적이고 좋지 않나?
      • TCP는 3-way handshake를 수행하며, 데이터의 양이 많고, 속도가 빠른 메커니즘이 아니다.
    • UDP 위에, 어플리케이션 레벨에서 성능을 최적화하도록 새롭게 설계
  • 현재 HTTP/1.1 주로 사용
  • HTTP/2, HTTP/3 사용도 점점 증가

 

HTTP 특징

  • 클라이언트-서버 구조
  • 무상태 프로토콜(stateless)
  • 비연결성(connectionless)
  • HTTP 메시지
  • 단순함, 확장 가능

 

클라이언트-서버 구조

(사진 출처: 인프런 강의)

  • Request-Response 구조
  • 클라이언트는 서버에 요청을 보내고, 응답을 대기
  • 서버가 요청에 대한 결과를 만들어서 응답
  • 양쪽이 독립적으로 진화할 수 있다.
    • Client와 Server의 개념적 분리
      • Client는 UX/UI, 사용성 등에 집중
      • Server는 비즈니스 로직, 데이터 핸들링 등에 집중
    • 효율적

 

무상태 프로토콜(stateless)

  • 서버가 클라이언트의 상태를 보존하지 않음
    • 장점: 서버 확장성 높음(스케일 아웃-수평 확장 유리)
    • 단점: 클라이언트가 추가 데이터 전송
  • 실무 한계
    • 모든 것을 무상태로 설계할 수 있는 경우도 있고 없는 경우도 있다.
    • 무상태
      • 예) 로그인이 필요 없는 단순한 서비스 화면
    • 상태 유지
      • 예) 로그인
        • 로그인한 사용자의 경우 로그인 했다는 상태를 서버에 유지
        • 일반적으로 브라우저 쿠키와 서버 세션등을 사용해서 상태 유지
      • 상태 유지는 최소한만 사용

 

Stateful, Stateless 차이

Stateful

고객: 이 노트북 얼마인가요?
점원: 100만원 입니다. (노트북 상태 유지)

고객: 2개 구매하겠습니다.
점원: 200만원 입니다. 신용카드, 현금중에 어떤 걸로 구매하시겠어요? (노트북, 2개 상태 유지)

고객: 신용카드로 구매하겠습니다.
점원: 200만원 결제 완료되었습니다. (노트북, 2개, 신용카드 상태 유지)
  • 점원이 중간에 바뀌면?
    • 고객: 이 노트북 얼마인가요?
      점원A: 100만원 입니다.
      
      고객: 2개 구매하겠습니다.
      점원B: 무엇을 2개 구매하시겠어요?
      
      고객: 신용카드로 구매하겠습니다.
      점원C: 무엇을 몇 개 신용카드로 구매하시겠어요?

Stateless

고객: 이 노트북 얼마인가요?
점원: 100만원 입니다.

고객: 노트북 2개 구매하겠습니다.
점원: 노트북 2개는 200만원 입니다. 신용카드, 현금중에 어떤 걸로 구매하시겠어요?

고객: 노트북 2개를 신용카드로 구매하겠습니다.
점원: 200만원 결제 완료되었습니다.
  • 점원이 중간에 바뀌면?
    • 고객: 이 노트북 얼마인가요?
      점원A: 100만원 입니다.
      
      고객: 노트북 2개 구매하겠습니다.
      점원B: 노트북 2개는 200만원 입니다. 신용카드, 현금중에 어떤 걸로 구매하시겠어요?
      
      고객: 노트북 2개를 신용카드로 구매하겠습니다.
      점원C: 200만원 결제 완료되었습니다.

정리

  • 상태 유지(Stateful)
    • 중간에 다른 점원으로 바뀌면 안된다.
      • 중간에 다른 점원으로 바뀔 때 상태 정보를 다른 점원에게 미리 알려줘야 한다.
    • 항상 같은 서버가 유지되어야 한다.
      • 서버가 상태를 보관한다.
      • 중간에 서버가 장애나면?
        • 클라이언트가 일을 처음부터 다시해야 하는 문제 발생

 

  • 무상태(Stateless)
    • 중간에 다른 점원으로 바뀌어도 된다.
      • 갑자기 고객이 증가해도 점원을 대거 투입할 수 있다.
      • 갑자기 클라이언트 요청이 증가해도 서버를 대거 투입할 수 있다.
    • 아무 서버나 호출해도 된다.
      • 서버가 상태를 보관하지 않는다.
      • 중간에 서버가 장애나면?
        • 다른 서버를 이용하면 됨 (문제 X)
    • 스케일 아웃 - 수평 확장 유리
    • 응답 서버를 쉽게 바꿀 수 있다 -> 무한한 서버 증설 가능

 

비 연결성(connectionless)

연결을 유지하는 모델

- TCP/IP 연결
- 요청 및 응답
- 서버는 연결을 계속 유지, 서버 자원 소모

연결을 유지하지 않는 모델

- TCP/IP 연결
- 요청 및 응답
- TCP/IP 연결 종료
- 서버는 연결을 유지 X, 최소한의 자원 유지
  • HTTP는 기본이 연결을 유지하지 않는 모델
    • 일반적으로 초 단위 이하의 빠른 속도로 응답
    • 1시간 동안 수천명이 서비스를 사용해도 실제 서버에서 동시에 처리하는 요청은 수십개 이하로 매우 작음
      • 예) 웹 브라우저에서 계속 연속해서 검색 버튼을 누르지는 않는다.
    • 서버 자원을 매우 효율적으로 사용할 수 있음

 

한계와 극복

  • TCP/IP 연결을 새로 맺어야 함 - 3 way handshake 시간 추가
  • 웹 브라우저로 사이트를 요청하면 HTML 뿐만 아니라 자바스크립트, css, 추가 이미지 등 수 많은 자원이 함께 다운로드
  • 지금은 HTTP 지속 연결(Persistent Connections)로 문제 해결
  • HTTP/2, HTTP/3에서 더 많은 최적화

 

HTTP 초기 - 연결, 종료 낭비

(사진 출처: 인프런 강의)

 

HTTP 지속 연결(Persistent Connections)

(사진 출처: 인프런 강의)

 

스테이트리스를 기억하자

  • 서버 개발자들이 어려워하는 업무
    • 같은 시간에 딱 맞추어 발생하는 대용량 트래픽
      • 예) 선착순 이벤트, 명절 KTX 예약, 학과 수업 등록
      • 예) 저녁 6시 선착순 1000명 치킨 할인 이벤트
        • 수만명 동시 요청
  • 최대한 스테이트리스하게 설계하는 것이 중요
    • 대용량 트래픽이 올 때도 서버를 늘려서 대응할 수 있는 부분이 많아짐

 

HTTP 메시지

HTTP 메시지 구조

Start-line 시작 라인
header 헤더
empty line 공백 라인(CRLF)
message body

HTTP 요청 메시지 (예시)

GET /search?q=hello&hl=ko HTTP/1.1
Host: www.google.com
  • 요청 메시지도 body 본문을 가질 수 있음

HTTP 응답 메시지 (예시)

HTTP/1.1 200 OK
Content-Type: text/html;charset=UTF-8
Content-Length: 3423

<html>
  <body>...</body>
</html>

 

시작 라인

  • 요청 메시지
    • start-line = request-line / status-line
      • request-line = method SP request-target SP HTTP-version CRLF (SP: 스페이스, CRLF: 엔터)
    • HTTP 메서드
      • 종류: GET, POST, PUT, DELETE 등
      • 서버가 수행해야할 동작 지정
        • GET: 리소스 조회
        • POST: 요청 내역 처리
    • 요청 대상
      • absolute-path[?query] (절대경로[?쿼리])
      • 절대경로="/"로 시작하는 경로
    • HTTP Version
  • 응답 메시지
    • start-line = request-line / status-line
      • status-line = HTTP-version SP status-code SP reason-phrase CRLF
    • HTTP 버전
    • HTTP 상태 코드: 요청 성공, 실패를 나타냄
      • 200: 성공
      • 400: 클라이언트 요청 오류
      • 500: 서버 내부 오류
    • reason-phrase(이유 문구): 사람이 이해할 수 있는 짧은 상태 코드 설명 글

 

HTTP 헤더

  • header-field = field-name ":" OWS field-value OWS (OWS: 띄어쓰기 허용)
  • field-name은 대소문자 구분 없음
  • 물론 field-value는 대소문자 구분
  • 용도
    • HTTP 전송에 필요한 모든 부가정보
      • 예) 메시지 바디의 내용, 메시지 바디의 크기, 압축, 인증, 요청 클라이언트(브라우저) 정보, 서버 애플리케이션 정보, 캐시 관리 정보...
    • 표준 헤더가 매우 많음
    • 필요시 임의의 헤더 추가 가능

 

HTTP 메시지 바디

  • 용도
    • 실제 전송할 데이터
    • HTML 문서, 이미지, 영상, JSON 등등 byte로 표현할 수 있는 모든 데이터 전송 가능

 

단순함, 확장 가능

  • HTTP는 단순하다
  • HTTP 메시지도 매우 단순
  • 크게 성공하는 표준 기술은 단순하지만 확장 가능한 기술