본문 바로가기
my_lesson/_C++

C++_ Verry simple Crawler(C++20)

by boolean 2021. 5. 7.
728x90

원작자 :웹페이지 이미지 크롤링 [ C++20 ]

 

웹페이지 이미지 크롤링 [ C++20 ]

개발환경 >> Visual Studio 언어 >> C++20 운영체제 >> Windows10 안녕하세요~!~!~!~!!! 이번에는 C++로 간단하게 웹페이지 이미지 크롤링 자동화를 만들어 보겠습니다. 우선 이번에 사용할 사이트는 pokemonkorea

mawile.tistory.com

#include <urlmon.h>
#include <iostream>
#pragma comment(lib, "urlmon.lib")

int main() {
	//url to crawling
	const char base[] = "https://data1.pokemonkorea.co.kr/newdata/pokedex/full/";
    //folder path to save
    //If the folder doesn't exist, you have to create it.
	const char source[] = "D:\\img\\";
	char buf[1024], path[1024];
	int cnt = 1;
    // 테스트 할 때 과부하가 걸리므로 89301을 1000 정도로 수정하자
	for (int i = 101; i < 89301 + 100; i += 100) {
    	// 
		sprintf_s(buf, "%s%.6d.png", base, i);
		sprintf_s(path, "%s%d.png", source, cnt);
		URLDownloadToFileA(0, buf, path, 0, 0);
		std::cout << buf << " saved image in " << path << std::endl;
		cnt += 1;
	}
}

사용된 헤더파일 라이브러리 함수 설명

 

댓글