본문 바로가기
반응형

방구석코딩/주식 크롤링 분석12

[파이썬] 주식 데이터 크롤링(4) - 웹 브라우저 체크박스 해제 (selenium) 파이썬을 이용한 주식 데이터 크롤링을 위해 앞에서 사전준비 할 내용과 필요 패키지, 웹 브라우저 자동 실행에 대해서 알아보았다. 이번에는 실행한 웹 브라우저에서 네이버 증권의 체크박스를 해제하는 방법에 대해 알아보겠다. 체크박스 해제네이버 증권에서 선택되어 있는 체크박스를 해제하는 이유는 이후작업에서 내가 원하는 체크박스를 클릭하기 위해서다. 해제를 위해 먼저 증권 페이지가 어떻게 짜여져 있는지 확인이 필요하고, 파이썬의 명령어를 통해 체크박스를 해제해야 한다. html 열기 및 선택  네이버 증권의 페이지가 어떻게 구성되어 있는지 확인하기 위해서는 해당 페이지에서 빈곳의 아무데나 마우스 우클릭을 하면 아래 화면의 오른편과 같이 팝업창이 뜨는데 검사를 선택한다. 여기서부터 중요한데 사실 html이나 c.. 2024. 7. 10.
[파이썬] 주식 데이터 크롤링(3) - 웹 브라우저 자동 실행(webdriver) 이번에는 주식 정보 크롤링을 위한 실질적인 코드 작성이 들어가는 단계이다. 네이버 증권에 있는 주식 정보를 불러오는 방법이다.  웹 브라우저 실행주식 데이터 크롤링을 하기 위해서는 맨 처음으로 정보가 들어있는 웹 페이지를 실행해야 한다. 아래 코드를 보며 순서대로 실행해보자. 앞의 컨텐츠에서 얘기했는 주석을 체계적으로 달아주어야 향후에 변동이 생기거나 내가 변경해야 할 것들이 있으면 알아보기 쉽다. 아래 코드를 하나씩 아래에 설명해보도록 하자.########################################################################## 01. kospi 페이지 정보 및 브라우저 실행###############################################.. 2024. 7. 9.
[파이썬] 증권 전 종목 크롤링(2) - 필요 패키지 파이썬을 통해 주식 데이터 크롤링을 위해서 어떤 패키지가 필요한지 알아보고 웹브라우저를 핸들링할 수 있는 방법을 알아보겠다. 한번에 모든 내용을 자세히 적기에는 양이 많기 때문에 하나씩 연결해서 진행할 예정이다. 1. 준비사항 - 주피터노트북 설치파이썬을 활용하기 위해 나는 주피터 노트북을 이용해서 코드를 작성하였다. 주피터노트북은 웹브라우저를 통해 파이썬 코드를 작성하고 실행할 수 있는 도구이다.  IDLE, 구글에서 제공하는 코랩 등을 이용할 수도 있지만 IDLE은 도스창 같이 생겨서 익숙하지 않을 수 있다. 코랩은 웹에서 작동하기 때문에 잘 모르는 부분이 있어 오프라인에서도 작동할 수 있는 주피터 노트북을 선택하였다.  만약 컴퓨터 사양이 너무 안좋은 경우에는 코랩을 이용하는 것도 나쁘지 않은 선택.. 2024. 7. 8.
[파이썬] 증권 전 종목 크롤링 하기 (1) - 사전 작업 파이썬을 통해 증권 정보를 크롤링 하는 방법에 대해서는 여러 자료에서 찾아볼 수 있다. 하지만 내가 원하는 전 종목, 모든 항목에 대해서 한번에 크롤링 할 수 있는 자료를 찾는 건 쉽지 않았다. 어떻게 모든 종목에 대한 크롤링을 했는지 살펴보자. 블로그, 유튜브, 챗GPT 등 여러 군데에서 자료를 찾고 힘겹게 완성한 자료다. 먼저 흐름대로 코딩을 하고 이해하고 다음으로 함수화하여 최대한 간단하게 매크로 형식으로 만들었다. 처음부터 매크로 형태로 만들면 이해하기 어려우니 매크로 형태로 작성하기 전 코딩한 자료부터 보겠다.  코드를 작성하기 전 먼저 알아두어야 할 사전 정보부터 알아보고 다음 내용부터 코딩에 대한 부분을 들어가보도록 하겠다. 자료(페이지) 탐색크롤링을 하기 위해서는 먼저 어떤 정보가 있는지 .. 2024. 7. 4.
반응형