프로그램/Java Project

[Java Project] 홈페이지에서 글/사진가져오기 Galmuri

간단한 크롤링 프로그램을 하나 만들어서 배포합니다. 

- 프로그램명 : Galmuri.exe

- 제작기간 : '21.11.02. ~ '21.11.04 (3일) 

- 제작자 : REDUCTO

- 사용언어 : JAVA

- 사용라이브러리 : Jsoup, Swing

- 버전 : v1.0

 

Galmuri.zip
0.03MB

 

 


소개

Galmuri는 홈페이지에서 정적 스크립트를 읽어와 글 / 사진 / 영상의 태그 소스를 수집하는 크롤러입니다.

 

* 무단배포는 금지합니다.(댓글달아주세용)
* 기능에 커스터마이징이 필요하시다면 댓글달아주세용

* 글을 캡쳐한 경우 폴더아래 char\result.txt에 저장됩니다.

* User-Agent와 cookie설정이 없는 프로그램이기에 Robots.txt가 허용된 곳만 탐색가능합니다.


사용예시

더보기

1. 수집할 홈페이지 url을 galmuri에 넣고, 수집할 대상을 선택합니다.

 2. ▶누르면 끝! 완료된 결과는 폴더에 태그별로 정리되어있습니다. 

* scrapbody.html에 Galmuri가 접근한 html이 있습니다.

* result.txt는 글을 크롤링한 경우에만 유효한 파일입니다.


로드맵

 

* 로그인된 화면 혹은 차단된 화면 가져올 수 있게 수정(~11월)