Computer Science/📡Network
[Network] HTTP 기본
seungwookim
2021. 10. 4. 18:52
김영한님의 모든 개발자를 위한 HTTP 웹 기본 지식 강의를 듣고 정리하였습니다.
모든 것이 HTTP
HTTP(HyperText Transfer Protocol)란, 인터넷 상에서 데이터를 주고 받을 때 사용하는 통신 규약이다.
초기에는 HTML과 같은 하이퍼텍스트 문서를 전송하는 데 주로 사용되었지만, 현재는 다양한 형태의 정보를 전송하는데 사용된다.
- HTTP 메시지에 모든 것을 전송
- HTML, TEXT
- 이미지, 음성, 영상, 파일
- JSON, XML (API)
- 거의 모든 형태의 데이터 전송 가능
- 서버 간에 데이터를 주고 받을 때도 대부분 HTTP 사용
HTML 역사
- HTTP/0.9 1991년: GET 메서드만 지원, HTTP 헤더 X
- HTTP/1.0 1996년: 메서드, 헤더 추가
- HTTP/1.1 1997년: 가장 많이 사용, 우리에게 가장 중요한 버전
- RFC2068(1997) -> RFC2616(1999) -> RFC7230~7235(2014)
- HTTP/2 2015년: 성능 개선
- HTTP/3 진행중: TCP 대신에 UDP 사용, 성능 개선
기반 프로토콜
- TCP: HTTP/1.1, HTTP/2
- UDP: HTTP/3
- TCP가 안정적이고 좋지 않나?
- TCP는 3-way handshake를 수행하며, 데이터의 양이 많고, 속도가 빠른 메커니즘이 아니다.
- UDP 위에, 어플리케이션 레벨에서 성능을 최적화하도록 새롭게 설계
- TCP가 안정적이고 좋지 않나?
- 현재 HTTP/1.1 주로 사용
- HTTP/2, HTTP/3 사용도 점점 증가
HTTP 특징
- 클라이언트-서버 구조
- 무상태 프로토콜(stateless)
- 비연결성(connectionless)
- HTTP 메시지
- 단순함, 확장 가능
클라이언트-서버 구조
(사진 출처: 인프런 강의)
- Request-Response 구조
- 클라이언트는 서버에 요청을 보내고, 응답을 대기
- 서버가 요청에 대한 결과를 만들어서 응답
- 양쪽이 독립적으로 진화할 수 있다.
- Client와 Server의 개념적 분리
- Client는 UX/UI, 사용성 등에 집중
- Server는 비즈니스 로직, 데이터 핸들링 등에 집중
- 효율적
- Client와 Server의 개념적 분리
무상태 프로토콜(stateless)
- 서버가 클라이언트의 상태를 보존하지 않음
- 장점: 서버 확장성 높음(스케일 아웃-수평 확장 유리)
- 단점: 클라이언트가 추가 데이터 전송
- 실무 한계
- 모든 것을 무상태로 설계할 수 있는 경우도 있고 없는 경우도 있다.
- 무상태
- 예) 로그인이 필요 없는 단순한 서비스 화면
- 상태 유지
- 예) 로그인
- 로그인한 사용자의 경우 로그인 했다는 상태를 서버에 유지
- 일반적으로 브라우저 쿠키와 서버 세션등을 사용해서 상태 유지
- 상태 유지는 최소한만 사용
- 예) 로그인
Stateful, Stateless 차이
Stateful
고객: 이 노트북 얼마인가요?
점원: 100만원 입니다. (노트북 상태 유지)
고객: 2개 구매하겠습니다.
점원: 200만원 입니다. 신용카드, 현금중에 어떤 걸로 구매하시겠어요? (노트북, 2개 상태 유지)
고객: 신용카드로 구매하겠습니다.
점원: 200만원 결제 완료되었습니다. (노트북, 2개, 신용카드 상태 유지)
- 점원이 중간에 바뀌면?
-
고객: 이 노트북 얼마인가요? 점원A: 100만원 입니다. 고객: 2개 구매하겠습니다. 점원B: 무엇을 2개 구매하시겠어요? 고객: 신용카드로 구매하겠습니다. 점원C: 무엇을 몇 개 신용카드로 구매하시겠어요?
-
Stateless
고객: 이 노트북 얼마인가요?
점원: 100만원 입니다.
고객: 노트북 2개 구매하겠습니다.
점원: 노트북 2개는 200만원 입니다. 신용카드, 현금중에 어떤 걸로 구매하시겠어요?
고객: 노트북 2개를 신용카드로 구매하겠습니다.
점원: 200만원 결제 완료되었습니다.
- 점원이 중간에 바뀌면?
-
고객: 이 노트북 얼마인가요? 점원A: 100만원 입니다. 고객: 노트북 2개 구매하겠습니다. 점원B: 노트북 2개는 200만원 입니다. 신용카드, 현금중에 어떤 걸로 구매하시겠어요? 고객: 노트북 2개를 신용카드로 구매하겠습니다. 점원C: 200만원 결제 완료되었습니다.
-
정리
- 상태 유지(Stateful)
- 중간에 다른 점원으로 바뀌면 안된다.
- 중간에 다른 점원으로 바뀔 때 상태 정보를 다른 점원에게 미리 알려줘야 한다.
- 항상 같은 서버가 유지되어야 한다.
- 서버가 상태를 보관한다.
- 중간에 서버가 장애나면?
- 클라이언트가 일을 처음부터 다시해야 하는 문제 발생
- 중간에 다른 점원으로 바뀌면 안된다.
- 무상태(Stateless)
- 중간에 다른 점원으로 바뀌어도 된다.
- 갑자기 고객이 증가해도 점원을 대거 투입할 수 있다.
- 갑자기 클라이언트 요청이 증가해도 서버를 대거 투입할 수 있다.
- 아무 서버나 호출해도 된다.
- 서버가 상태를 보관하지 않는다.
- 중간에 서버가 장애나면?
- 다른 서버를 이용하면 됨 (문제 X)
- 스케일 아웃 - 수평 확장 유리
- 응답 서버를 쉽게 바꿀 수 있다 -> 무한한 서버 증설 가능
- 중간에 다른 점원으로 바뀌어도 된다.
비 연결성(connectionless)
연결을 유지하는 모델
- TCP/IP 연결
- 요청 및 응답
- 서버는 연결을 계속 유지, 서버 자원 소모
연결을 유지하지 않는 모델
- TCP/IP 연결
- 요청 및 응답
- TCP/IP 연결 종료
- 서버는 연결을 유지 X, 최소한의 자원 유지
- HTTP는 기본이 연결을 유지하지 않는 모델
- 일반적으로 초 단위 이하의 빠른 속도로 응답
- 1시간 동안 수천명이 서비스를 사용해도 실제 서버에서 동시에 처리하는 요청은 수십개 이하로 매우 작음
- 예) 웹 브라우저에서 계속 연속해서 검색 버튼을 누르지는 않는다.
- 서버 자원을 매우 효율적으로 사용할 수 있음
한계와 극복
- TCP/IP 연결을 새로 맺어야 함 - 3 way handshake 시간 추가
- 웹 브라우저로 사이트를 요청하면 HTML 뿐만 아니라 자바스크립트, css, 추가 이미지 등 수 많은 자원이 함께 다운로드
- 지금은 HTTP 지속 연결(Persistent Connections)로 문제 해결
- HTTP/2, HTTP/3에서 더 많은 최적화
HTTP 초기 - 연결, 종료 낭비
(사진 출처: 인프런 강의)
HTTP 지속 연결(Persistent Connections)
(사진 출처: 인프런 강의)
스테이트리스를 기억하자
- 서버 개발자들이 어려워하는 업무
- 같은 시간에 딱 맞추어 발생하는 대용량 트래픽
- 예) 선착순 이벤트, 명절 KTX 예약, 학과 수업 등록
- 예) 저녁 6시 선착순 1000명 치킨 할인 이벤트
- 수만명 동시 요청
- 같은 시간에 딱 맞추어 발생하는 대용량 트래픽
- 최대한 스테이트리스하게 설계하는 것이 중요
- 대용량 트래픽이 올 때도 서버를 늘려서 대응할 수 있는 부분이 많아짐
HTTP 메시지
HTTP 메시지 구조
Start-line 시작 라인
header 헤더
empty line 공백 라인(CRLF)
message body
HTTP 요청 메시지 (예시)
GET /search?q=hello&hl=ko HTTP/1.1
Host: www.google.com
- 요청 메시지도 body 본문을 가질 수 있음
HTTP 응답 메시지 (예시)
HTTP/1.1 200 OK
Content-Type: text/html;charset=UTF-8
Content-Length: 3423
<html>
<body>...</body>
</html>
시작 라인
- 요청 메시지
- start-line = request-line / status-line
- request-line = method SP request-target SP HTTP-version CRLF (SP: 스페이스, CRLF: 엔터)
- HTTP 메서드
- 종류: GET, POST, PUT, DELETE 등
- 서버가 수행해야할 동작 지정
- GET: 리소스 조회
- POST: 요청 내역 처리
- 요청 대상
- absolute-path[?query] (절대경로[?쿼리])
- 절대경로="/"로 시작하는 경로
- HTTP Version
- start-line = request-line / status-line
- 응답 메시지
- start-line = request-line / status-line
- status-line = HTTP-version SP status-code SP reason-phrase CRLF
- HTTP 버전
- HTTP 상태 코드: 요청 성공, 실패를 나타냄
- 200: 성공
- 400: 클라이언트 요청 오류
- 500: 서버 내부 오류
- reason-phrase(이유 문구): 사람이 이해할 수 있는 짧은 상태 코드 설명 글
- start-line = request-line / status-line
HTTP 헤더
- header-field = field-name ":" OWS field-value OWS (OWS: 띄어쓰기 허용)
- field-name은 대소문자 구분 없음
- 물론 field-value는 대소문자 구분
- 용도
- HTTP 전송에 필요한 모든 부가정보
- 예) 메시지 바디의 내용, 메시지 바디의 크기, 압축, 인증, 요청 클라이언트(브라우저) 정보, 서버 애플리케이션 정보, 캐시 관리 정보...
- 표준 헤더가 매우 많음
- 필요시 임의의 헤더 추가 가능
- HTTP 전송에 필요한 모든 부가정보
HTTP 메시지 바디
- 용도
- 실제 전송할 데이터
- HTML 문서, 이미지, 영상, JSON 등등 byte로 표현할 수 있는 모든 데이터 전송 가능
단순함, 확장 가능
- HTTP는 단순하다
- HTTP 메시지도 매우 단순
- 크게 성공하는 표준 기술은 단순하지만 확장 가능한 기술