코드공부방

(Javascript, Python) 문장에서 HTML 코드, 태그 제거 본문

웹프로그래머/기억보단 기록

(Javascript, Python) 문장에서 HTML 코드, 태그 제거

:- ) 2021. 9. 1. 12:47
반응형

문장에서 HTML 코드 제거 (javascript, python)


웹크롤링을 하거나 또는 가공된 데이터를 가져다 쓰다보면 데이터 내에 HTML코드가 삽입되어 있어 이를 제거하고 싶은 경우가 생길 수 있다. 이때 아래처럼 함수를 만들어 사용하여 간단하게 HTML코드 제거가 가능하다.

 

# Python

import re

def remove_html(sentence) :
	sentence = re.sub('(<([^>]+)>)', '', sentence)
	return sentence
    
sentence = '나는 지금 <span class="mark">화장품</span>을 <strong>사러</strong> <em>가고</em> 있다.'
sentence = remove_html(sentence)
print(sentence)

# > 나는 지금 화장품을 사러 가고 있다.

# Javascript

function remove_html(sentence){
	result = sentence.replace(/(<([^>]+)>)/gi, '')
	return result
}

sentence = '나는 지금 <span class="mark">화장품</span>을 <strong>사러</strong> <em>가고</em> 있다.'
sentence = remove_html(sentence)
console.log(sentence)

// > 나는 지금 화장품을 사러 가고 있다.

 

 

코드공부방

텍스트(*.txt) 파일 불러와(import) 출력(print)하기 python에서 text파일 읽어와 print 테스트를 하기 위해 샘플 text파일을 생성했다. (파이썬 파일과 동일경로에 생성) 1. 출력하기 방법1 > 내장함수 사

code-study.tistory.com

 

코드공부방

정말 오랜만에 블로그에 글을 남긴다. 년 초반에는 거의 1일 1포스팅을 할 정도로 열정이 넘쳤었는데, 조금씩 바쁘다는 핑계로 멀리하다가 이제는 아예 관리를 안하는 수준까지 왔다. (블로그의

code-study.tistory.com

 

반응형
Comments