본문 바로가기

카테고리 없음

코딩 없이 웹 크롤링 마스터하기: 메이크, AI, 그리고 Apify(F5) 완벽 활용법

 

 

웹 크롤링 & 데이터 분석 with 파이썬 - 프로그래밍 언어 | 쿠팡

쿠팡에서 4.8 구매하고 더 많은 혜택을 받으세요! 지금 할인중인 다른 6 제품도 바로 쿠팡에서 확인할 수 있습니다.

www.coupang.com

"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."

 

코딩 없이 웹 크롤링 마스터하기: 메이크, AI, 그리고 Apify(F5) 완벽 활용법

웹 크롤링, 한 번쯤은 시도해 보고 싶었지만 코딩 장벽에 가로막혀 포기하셨나요? 이제 걱정 마세요! 메이크(Make), ChatGPT 같은 AI 도구, 그리고 Apify(F5)를 활용하면 코딩 없이도 웹사이트 정보를 손쉽게 수집하고, 이를 기반으로 업무 자동화까지 가능합니다. 이번 포스팅에서는 메이크를 중심으로 AI와 Apify를 결합해 웹 크롤링을 구현하는 방법을 자세히 알려드리겠습니다. 

웹 크롤링, 왜 필요한가?

 웹 크롤링은 단순한 정보 수집을 넘어 업무 효율성을 극대화하는 강력한 도구입니다. 다양한 웹사이트에서 데이터를 자동으로 수집하고 분석함으로써 다음과 같은 이점을 얻을 수 있습니다/

  • 데이터 기반 의사 결정: 시장 조사, 경쟁사 분석, 트렌드 파악 등 다양한 분야에서 정확한 데이터를 기반으로 중요한 결정을 내릴 수 있습니다.
  • 시간 절약: 수동으로 데이터를 수집하는 시간을 줄이고, 핵심 업무에 집중할 수 있습니다.
  • 업무 프로세스 자동화: 웹 크롤링 결과를 다른 시스템과 연동하여 반복 업무를 자동화할 수 있습니다.

웹 크롤링 유형 이해하기

 효율적인 웹 크롤링을 위해서는 웹사이트의 유형을 파악하는 것이 중요합니다. 웹사이트는 크게 두 가지로 나눌 수 있습니다.

1. 정적 웹사이트

  • 특징: HTML 파일로 구성되어 서버에서 전달된 내용이 그대로 표시됩니다
  • 크롤링 난이도: HTTP 요청만으로 데이터 수집 가능
  • 예시: 블로그, 기업 소개 페이지

2. 동적 웹사이트

  • 특징: 자바스크립트, Ajax 등을 사용해 동적으로 콘텐츠를 생성합니다
  • 크롤링 난이도: HTTP 요청만으로는 데이터 수집이 어려움
  • 예시: 쇼핑몰, 소셜 미디어

코딩 없이 웹 크롤링? 메이크가 답이다!

정적 웹사이트 크롤링

메이크를 활용하면 코딩 없이도 정적 웹사이트의 데이터를 수집할 수 있습니다. 다음 단계를 따라 해 보세요:

  1. 메이크 시나리오 생성: 메이크에 로그인하고 새 시나리오를 생성합니다.
  2. HTTP 모듈 추가: HTTP 모듈에서 Make a request를 선택하고, 크롤링할 웹사이트의 URL을 입력합니다.
  3. HTML to Text 모듈 추가: 텍스트 파서(Text Parser)에서 HTML to text 모듈을 추가합니다.
  4. ChatGPT 모듈 추가: ChatGPT 모듈에서 Create a completion을 선택하고, API 키를 연결합니다.
  5. JSON 파서 추가: JSON 모듈에서 Parse JSON을 추가합니다.
  6. 데이터 저장 모듈 추가: 추출 데이터를 저장할 모듈을 추가합니다 (예: Google Sheets, Airtable 등).

동적 웹사이트 크롤링: Apify(F5)와 메이크의 조합

동적 웹사이트는 자바스크립트로 로딩되므로 HTTP 요청만으로 데이터를 수집하기 어렵습니다. 이 경우 Apify를 활용하세요.

  1. Apify 계정 생성 및 로그인: Apify에 접속하여 계정을 만들고 로그인합니다.
  2. 웹 스크레이퍼 액터 사용: 스토어에서 Web Scraper 액터를 선택합니다.
  3. 액터 설정: 크롤링할 웹사이트 URL을 입력하고 자바스크립트로 HTML 콘텐츠를 가져옵니다.
  4. 메이크에 Apify 연결: 메이크에서 Apify 모듈을 추가하고, Watch actor runs를 설정합니다.
  5. Apify 데이터셋 아이템 가져오기: Apify 모듈에서 Get dataset items를 추가합니다.
  6. ChatGPT와 연동: ChatGPT 모듈을 활용하여 추출된 데이터를 구조화하거나 추가로 분석합니다.
  7. 데이터 저장: 결과 데이터를 원하는 플랫폼(Google Sheets 등)에 저장합니다.


"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."

 

웹 크롤링 & 데이터 분석 with 파이썬 - 프로그래밍 언어 | 쿠팡

쿠팡에서 4.8 구매하고 더 많은 혜택을 받으세요! 지금 할인중인 다른 6 제품도 바로 쿠팡에서 확인할 수 있습니다.

www.coupang.com

https://link.coupang.com/a/b44WKz

 

칼퇴하는 일잘러의 업무 스킬 파이썬 업무 자동화:엑셀부터 워드·PDF·이메일·웹 크롤링·파일

쿠팡에서 5.0 구매하고 더 많은 혜택을 받으세요! 지금 할인중인 다른 2 제품도 바로 쿠팡에서 확인할 수 있습니다.

www.coupang.com

 

웹 크롤링 예시

1. AI 최신 논문 정보 크롤링

  • 웹사이트: arXiv.org
  • 추출 정보: 논문 제목, 저자, 링크
  • 방법: 메이크로 정적 웹사이트 크롤링

2. 테크크런치 AI 뉴스 크롤링

  • 웹사이트: techcrunch.com
  • 추출 정보: 기사 제목, 요약, 링크
  • 방법: 메이크로 크롤링 후 ChatGPT를 이용해 요약

3. 크몽 서비스 데이터 크롤링

  • 웹사이트: kmong.com
  • 추출 정보: 상품명, 가격, 별점, 링크
  • 방법: 메이크와 Apify를 연동한 동적 웹사이트 크롤링

웹 크롤링, 이제 여러분의 손안에!

이제 메이크와 AI, Apify를 활용해 코딩 없이도 웹사이트에서 데이터를 원하는 대로 추출할 수 있습니다. 복잡한 코딩 없이도 업무 생산성을 극대화할 수 있는 강력한 도구를 손에 쥐어 보세요. 

궁금한 점이 있다면 언제든 댓글로 문의해주세요!