| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
- vueJS
- 자기개발
- @keyframes
- CSS애니메이션
- javascript
- MariaDB
- 로딩UI
- 자바스크립트
- 투두리스트
- python
- html제거
- 스타일가이드
- 코딩가이드
- 코딩컨밴션
- google style guide
- 코딩규칙
- 프레임워크
- 웹스크래핑
- Vue.js
- vue-cli
- to do list
- vuejs입문
- 개발회고
- 파이썬
- 구글CSS
- css규칙
- CSS로딩
- 뉴스수집
- 구글스타일가이드
- css rule
- Today
- Total
목록2021/09 (4)
코드공부방
데이터를 CSV형태로 저장하면 간단한 2차원 데이터밖에 표현할 수 없지만 JSON을 사용하면 list 또는 dict를 조합한 복잡한 데이터 구조를 쉽게 다룰 수 있다. 파이썬은 JSON(JavaScript Object Notation) 형식을 쉽게 다룰 수 있는 모듈을 제공한다. # json 모듈 로드 import json persons = [ {'name':'Han Byungik', 'age':35, 'hobby':'game'}, {'name':'Park junkyu', 'age':34, 'hobby':'walk'}, {'name':'Lee hyunbok', 'age':37, 'hobby':'talk'}, {'name':'Yoon hyejun', 'age':37, 'hobby':'sleep'}, {'n..
[웹크롤링, 웹스크래핑] 웹사이트 인코딩 확인 및 디코딩하기 (python) 파이썬 urllib을 사용해 스크래핑을 할때, HTTP헤더와 HTML의 meta 태그를 기반으로 웹페이지 인코딩 방식을 판별해야 한다. 인코딩 방식을 제대로 판별하지 않으면 문자가 깨져보여 정확한 데이터를 추출할 수 없다. 먼저 urllib.request 모듈을 사용하여 네이버 웹페이지 소스를 추출해보자. from urllib.request import urlopen f = urlopen('https://naver.com') f.read() 위 코드를 실행하면 아래와 같은 결과값을 얻을 수 있다. 한글이 모두 깨져서 출력이 된다. HTTPResponse.read() 메소드로 추출한 값은 bytes 자료형이므로 원하는 정보를 얻으..
pystan, fbprophet 라이브러리를 설치 및 import 후 간단한 테스트를 위해 프로그램을 실행하려는데 "ImportError: DLL load failed while importing _api: 지정된 모듈을 찾을 수 없습니다." 에러를 뱉어내며 실행이 되지 않는다. 예감이 좋지 않았다. 그리고 예감은 적중했다. 이것을 해결하는데 무려 1시간 30분이나 소요됐다. 결론만 얘기하면 pystan을 2.18이전 버전으로 돌려야 하는 문제이다. 아래와 같이 설치하면 된다. pip install "pystan
문장에서 HTML 코드 제거 (javascript, python) 웹크롤링을 하거나 또는 가공된 데이터를 가져다 쓰다보면 데이터 내에 HTML코드가 삽입되어 있어 이를 제거하고 싶은 경우가 생길 수 있다. 이때 아래처럼 함수를 만들어 사용하여 간단하게 HTML코드 제거가 가능하다. # Python import re def remove_html(sentence) : sentence = re.sub('(]+)>)', '', sentence) return sentence sentence = '나는 지금 화장품을 사러 가고 있다.' sentence = remove_html(sentence) print(sentence) # > 나는 지금 화장품을 사러 가고 있다. # Javascript function remov..