Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- vueJS
- javascript
- 웹스크래핑
- 뉴스수집
- css rule
- 코딩규칙
- vuejs입문
- @keyframes
- Vue.js
- vue-cli
- 코딩컨밴션
- 자기개발
- 구글CSS
- 로딩UI
- 스타일가이드
- 프레임워크
- to do list
- html제거
- MariaDB
- python
- css규칙
- 자바스크립트
- CSS로딩
- 개발회고
- google style guide
- 파이썬
- 투두리스트
- 구글스타일가이드
- CSS애니메이션
- 코딩가이드
Archives
- Today
- Total
목록정규표현식 (1)
코드공부방

웹사이트 크롤링 작업을 하다보면 무조건 직면하게 되는 문제가 있다. 바로 문장에서 HTML태그를 제거해야하는 순간이 온다. 사실은 HTML태그를 제거하는 것은 아니고 HTML코드는 '내용'형태로 되어있기 때문에 정규식을 활용하여 text뭉치에서 '' 문자를 찾아 안에 있는 태그명과 함께 삭제를 하는 것이다. 아래 예제를 보면 자. 웹에서 수집된 HTML태그 제거가 필요한 텍스트는 아래와 같다. 채널배정이 "RB", "A"인 차량 대상 차량 기본 정보 / 배정 정보 1일 2회 업데이트 (오전 10시 / 오후 10시) 차량 조회 수 (매 시간) 리본 상담 수 정보 (매 시간) 엔카 상담 정보 1일 1회 업데이트 (오후 5시) Python에서 정규 표현식을 사용하기 위해서는 내장 모듈인 re를 사용해야 하므로..
웹프로그래머/Python
2023. 5. 3. 13:31