유용한생활정보

구글 스프레드 시트 크롤링으로 실시간 데이터 불러오기

말랑뚱이 2022. 3. 21. 23:12
반응형

 

안녕하세요!

 

오늘은 구글 스프레드 시트를 활용해서 실시간 데이터를 불러오는 방법에 대해서 포스팅하려고합니다.

 

와이프랑 가계 관리를 엑셀로 하고있는데요, 

같이 모으는 공금으로 투자도 하려고하는데 투자 일지 등을 정리하려고보니 실시간으로 현재 시세나, 환율 등을 불러올 수 있으면 좋겠다는 생각이 들더라구요.

 

그래서 좀 알아보니 구글 스프레드시트에서는 그런 기능들이 간단하게 사용 할 수 있도록 구현되어있더라구요!

 

그 방법은 importxml 함수를 활용하는 방법입니다.

 

importxml(web주소,XPath)

 : web주소의 XPath에 해당하는 값을 불러오는 함수

 

이 기능을 활용하면 웹사이트에 등재되어있는 특정 텍스트를 XPath 경로를 통해 불러 올 수있습니다.

 

예를 들어볼게요

 

브라우저는 크롬을 사용했습니다.

 

 

네이버 환율을 검색하면 이렇게 출력이 되는데요.

 

이때 원달러 환율인 1,215 값을 불러오고 싶습니다.

 

그러면 필요한 것은 저 1,215의 값의 XPath 주소와 웹사이트 URL인데요

 

 ① URL : https://search.naver.com/search.naver?where=nexearch&sm=top_sug.pre&fbm=1&acr=2&acq=%EB%84%A4%EC%9D%B4%EB%B2%84+%ED%99%98%EC%9C%A0&qdt=0&ie=utf8&query=%EB%84%A4%EC%9D%B4%EB%B2%84+%ED%99%98%EC%9C%A8

 

네이버 환율 : 네이버 통합검색

'네이버 환율'의 네이버 통합검색 결과입니다.

search.naver.com

URL은 너무 쉽죠? 

이건 설명하는 걸 생략할게요.

 

그럼 XPath를 찾는 방법에 대해서 알아볼게요.

 

먼저 크롬의 경우 F12 버튼을 눌러주세요.

그럼 요소라는탭에서 페이지의 html 내용을 확인 할 수 있는데요.

 

이때 요소 탭 왼쪽을 잘 보시면 마우스 커서 모양 버튼이 있어요.

 

 

위에 보이시는 노란색 버튼을 눌러줍니다.

 

그러면 웹페이지 쪽에 마우스를 가져가면 아래와 같이 변하는 것을 볼 수 있습니다.

 

 

환율 1,1215.50에 커서를 가져가면 이렇게 <strong>1,215.50</strong> 문자열을 확인 할 수 있는데요.

 

이 위치를 저희가 불러와야합니다.

이 위치에 대한 XPath 값을 불러오기 위해서는 

 

 

여기서 XPath 복사를 선택해주세요

 

그러면 이런 값을 얻을 수 있습니다.

 

② XPath : //*[@id="_cs_foreigninfo"]/div/div[2]/div/div[1]/div[1]/div[1]/div[1]/h3/a/span[2]/strong

 

자 그러면 우리가 스프레드시트에서 필요한 두가지 값을 모두 얻었죠?

 

그럼 스프레드 시트로 가서 확인해보겠습니다.

 

importxml(URL, XPath) 이렇게 입력했더니 1,215.50 원이 출력되는 것을 알 수 있죠???

 

이 기능을 활용하면 주식 현 시세도 바로 확인이 가능합니다.

 

 

이렇게 SPY 시세도 한번에 불러올 수 있죠.

 

실시간으로 업데이트가 되는 것 같지는 않지만, 그래도 현재 시세를 어느정도 크롤링해서 바로 가져올 수 있기 때문에 좋은 방법으로 활용이 가능 할 것 같습니다.

 

오늘도 글 읽어주셔서 감사합니다!

반응형