Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 파이썬
- @keyframes
- 뉴스수집
- 프레임워크
- CSS로딩
- Vue.js
- html제거
- 자바스크립트
- python
- 자기개발
- 개발회고
- MariaDB
- vueJS
- 구글스타일가이드
- 코딩규칙
- 로딩UI
- 스타일가이드
- 구글CSS
- 코딩컨밴션
- vue-cli
- CSS애니메이션
- to do list
- css rule
- vuejs입문
- javascript
- 투두리스트
- 웹스크래핑
- google style guide
- 코딩가이드
- css규칙
Archives
- Today
- Total
코드공부방
(Javascript, Python) 문장에서 HTML 코드, 태그 제거 본문
반응형
문장에서 HTML 코드 제거 (javascript, python)
웹크롤링을 하거나 또는 가공된 데이터를 가져다 쓰다보면 데이터 내에 HTML코드가 삽입되어 있어 이를 제거하고 싶은 경우가 생길 수 있다. 이때 아래처럼 함수를 만들어 사용하여 간단하게 HTML코드 제거가 가능하다.
# Python
import re
def remove_html(sentence) :
sentence = re.sub('(<([^>]+)>)', '', sentence)
return sentence
sentence = '나는 지금 <span class="mark">화장품</span>을 <strong>사러</strong> <em>가고</em> 있다.'
sentence = remove_html(sentence)
print(sentence)
# > 나는 지금 화장품을 사러 가고 있다.
# Javascript
function remove_html(sentence){
result = sentence.replace(/(<([^>]+)>)/gi, '')
return result
}
sentence = '나는 지금 <span class="mark">화장품</span>을 <strong>사러</strong> <em>가고</em> 있다.'
sentence = remove_html(sentence)
console.log(sentence)
// > 나는 지금 화장품을 사러 가고 있다.
반응형
'웹프로그래머 > 기억보단 기록' 카테고리의 다른 글
python ImportError: DLL load failed while importing _api: 지정된 모듈을 찾을 수 없습니다. (1) | 2021.09.09 |
---|---|
Python 텍스트(*.txt) 파일 읽고 출력(print)하기 (0) | 2020.11.17 |
Comments