- 아나콘다 가상환경 작성방법
- 파이썬에서 thumbnail만들면서 io 에러난 경우 해결방법
- libraw 라이브러리 사용방법
- 아나콘다 업데이트하기
- 우분투에서 python pip 인스톨하기
- 파이썬으로 웹 스크랩하기10/10
- 파이썬으로 웹 스크랩하기9/10 Curr
- 파이썬으로 웹 스크랩하기8/10
- 파이썬으로 웹 스크랩하기7/10
- 파이썬으로 웹 스크랩하기6/10
- 파이썬으로 웹 스크랩하기5/10
- 파이썬으로 웹 스크랩하기4/10
- 파이썬으로 웹 스크랩하기3/10
- 파이썬으로 웹 스크랩하기2/10
- 파이썬으로 웹 스크랩하기1/10
- 파이썬으로 파일 다루기 13 / 13
- 파이썬으로 파일 다루기 12 / 13
- 파이썬으로 파일 다루기 11 / 13
- 파이썬으로 파일 다루기 10 / 13
- 파이썬으로 파일 다루기 9 / 13
- 파이썬으로 파일 다루기 8 / 13
- 파이썬으로 파일 다루기 7 / 13
- 파이썬으로 파일 다루기 6 / 13
- 파이썬으로 파일 다루기 5 / 13
- 파이썬으로 파일 다루기 4 / 13
- 파이썬으로 파일 다루기 3 / 13
- 파이썬으로 파일 다루기 2 / 13
- 파이썬으로 파일 다루기 1 / 13
- 파이썬으로 문자열 다루기 2/2
- 파이썬으로 문자열 다루기1/2
- 파이썬에서 사전 데이터 유형 이용하기2
- 파이썬에서 사전 데이터 유형 이용하기
- 파이썬에서 문자열 연결 및 복제하기
- 파이썬에서 수학 연산자 사용하기
- 13. 데이터베이스 13.8 데이터 삭제
- 13. 데이터베이스 13.7 데이터 수정
- 13. 데이터베이스 13.6 데이터 검색
- 13. 데이터베이스 13.5 데이터 조회
- 13. 데이터베이스 13.4 데이터 입력
- 13. 데이터베이스 13.3 데이터베이스 테이블 생성하기
- 13. 데이터베이스 13.2 SQL 맛보기
- 13. 데이터베이스 13.1 데이터베이스 설치
- 12. 디버깅
- 11.표준 라이브러리 11.2 logging 모듈
- 11. 표준 라이브러리 11.1 sys 모듈
- 10. 예외처리 10.6 with
- 10. 예외처리 10.5. try finally
- 10. 예외처리 10.4 예외 발생시키기
- 10. 예외처리 10.3 예외 처리
- 10. 예외처리 10.2 예외
- 10. 예외처리 10.1 오류
- 9.입력과 출력 9.4 유니코드
- 9.입력과 출력 9.3 Pickle
- 9.입력과 출력 9.2 파일입출력
- 9. 입력과 출력 9.1 입출력
- 8.자료구조 8.7 넘파이(numpy)
- 8.자료구조 8.6 집합(Set)
- 8.자료구조 8.5 열거형(Enum)
- 8.자료구조 8.4 사전
- 8.자료구조 8.3 튜플
- 8.자료구조 8.2 리스트
- 8.자료구조 8.1 문자열
- 7. 클래스 7.4 상속
- 7. 클래스 7.3 객체 초기화
- 7. 클래스 7.2 클래스의 사용
- 7. 클래스 7.1 클래스 정의하기
- 6. 모듈 과 패키지 6.5 패키지
- 6. 모듈 과 패키지 6.4 모듈의 name속성
- 6. 모듈 과 패키지 6.3 바이트 컴파일된 .pyc 파일
- 6. 모듈 과 패키지 6.2 dir() 함수를 이용하여 모듈 정보 알아내기
- 2018년 3월 프로그래밍 인기순위
- 6. 모듈 과 패키지 6.1 모듈을 정의하고 불러오기
- 5. 함수 5.7 람다(lambda) 함수
- 5. 함수 5.6 파이썬 내장함수
- 5. 함수 5.5 DocString
- 5. 함수 5.4 VarArgs 매개 변수
- 5. 함수 5.3 키워드 인수
- 5. 함수 5.2 기본 인수값
- 5. 함수 5.1 지역변수
- 4. 제어문 다루기 4.3 for
- 4. 제어문 다루기 4.2 while
- 4. 제어문 다루기 4.1 if문
- 파이썬 Python - OS.PATH 기초 정리
- 3. 연산자와 수식
- 2. 파이썬 기초 2.2 파이썬 기초
- 2. 파이썬 기초 2.1 첫걸음
- python 메소드 및 함수정리 모음
- C급 개발자와 함께하는 파이썬 - 01. 파이선 시작하기 #4
- C급 개발자와 함께하는 파이썬 - 01. 파이선 시작하기 #3
- 파이썬으로 간단한 스케줄러 만들기
- C급 개발자와 함께하는 파이썬 - 01. 파이선 시작하기 #2
- C급 개발자와 함께하는 파이썬 - 01. 파이선 시작하기 #1
- 파이썬(python)으로 RSS 크롤링하기
- Ubuntu(우분투) 리눅스에서 파이썬 설치하기
- 유용한 파이썬 라이브러리 모듈
- 파이썬으로 오늘날짜 폴더 생성하기
- 파이썬 프로그래밍에 대해서
- 두뇌를 정복하는 방법
- 윈도에서 BeautifulSoup4 설치방법
- 파이썬 알고리즘 배우기 좋은 사이트
파이썬으로 웹 스크랩하기9/10
파이썬으로 웹 스크랩하기9/10
h1 정보를 가져와 보도록 하겠습니다.
위의 코드는 BeautifulSoup에서 html을 가져와서 원하는 부분의 값을 가져오는 부분을 추가한 소스입니다.
html을 selenium을 가져와서 BeautifulSoup을 이용하면 좀더 쉽게 html 소스의 내용을 가져올 수 있습니다.
위와 같이 h1의 내용을 가져오는 것을 확인할 수 있습니다.
requests 를 사용하는 것과 selenuim을 사용하는것의 차이는 사실상 거의 없습니다. 작업을 하다 찾은건데 내용은 다음과 같습니다.
requests 모듈을 이용해서 html을 가져오는 경우는 서버가 보내준 그대로의 html을 받아오고 있습니다. 그런데 selenium을 이용해서 가져오는 경우 크롬으로 또는 그이외의 드라이버로 가져오는 경우이기 때문에 브라우저가 변환해서 가져온 html을 리턴하고 있습니다. 그래서 가끔 잘못된 html을 보내주는 경우에는 selenium을 이용하는 경우가 정상적인 결과를 얻기도 합니다.
Every person above the ordinary has a certain mission that they are called to fulfill.