기본 개념

파싱(Parsing) 이란

joungdev 2025. 1. 9. 08:52

 Parsing은 구문 분석이라고 한다. 문장을 이루고 있는 구성 요소를 분해하고 분해된 성분의 위계 관계를 분석하여 구조를 결정하는 것이다. 즉 데이터를 분해 분석하여, 이를 원하는 형태로 조합한 뒤 다시 추출할 수 있도록 해주는 프로그램이나 함수가 파서(parser)이며, 이 과정을 파싱(parsing)이라고 한다.

 

 예를 들어, 웹 페이지에서 떠도는 데이터는 List, Dictionary 같은 자료 구조와 달리, 사용자 마음대로 접근하고 자르고 추가하고 하는 것이 어렵다. 그렇기 때문에 이런 데이터들을 다루기 쉬운 형태로 변환하는 과정이 필요하며, 이를 담당하는 함수나 프로그램이 바로 파서이다. 파싱은 데이터를 구조화된 형식으로 바꾸어, 우리가 쉽게 사용할 수 있도록 도와준다.

파싱의 예


파싱의 예

// CSV 파일의 내용

이름, 나이, 직업
홍길동,30,개발자
김철수,25,디자이너
이영희,28,마케터
// 파싱 코드(python)

import csv

# CSV 파일 열기
with open('data.csv', mode='r', encoding='utf-8') as file:
	# CSV 파서 생성
    csv_reader = csv.reader(file)
    
    # 첫 번째 줄(헤더)은 건너뜀
    next(csv_reader)
    
    # 각 행을 파싱하여 출력
    for row in csv_reader:
    	이름, 나이, 직업 = row
        print(f"이름: {이름}, 나이: {나이}, 직업: {직업}")

 

출력결과

이름 : 홍길동, 나이: 30, 직업: 개발자
이름: 김철수, 나이: 25, 직업: 디자이너
이름: 이영희, 나이: 28, 직업: 마케터

 

 이처럼 파싱은 특정 자료 형태를 해석 가능한 단위로 변환하여, 사용자가 의도한 형태로 재가공하고 활용하는데 중요한 역할을 한다. 파싱은 웹 상에서만 이루어 지는 것이 아니라 다양한 환경에서도 사용된다. 사실 파싱은 웹뿐만 아니라 많은 소프트웨어 시스템에서 핵심적인 역할을 한다.

 

 컴파일러나 인터프리터, 파일 파싱, 문서 파싱 등 특정 패턴이나 데이터를 추출하고, 이를 사용 목적에 맞게 재가공하는 과정도 모두 파싱이라 할 수 있다.

반응형

'기본 개념' 카테고리의 다른 글

빌드(Build)란 - 컴파일에서 실행까지  (1) 2025.01.17
링크(Link), 링킹(Linking)이란  (0) 2025.01.14
컴파일(Complie) 이란  (0) 2025.01.13
브라우저란  (0) 2025.01.08