간단한 크롤링 프로그램을 하나 만들어서 배포합니다.
- 프로그램명 : Galmuri.exe
- 제작기간 : '21.11.02. ~ '21.11.04 (3일)
- 제작자 : REDUCTO
- 사용언어 : JAVA
- 사용라이브러리 : Jsoup, Swing
- 버전 : v1.0
소개
Galmuri는 홈페이지에서 정적 스크립트를 읽어와 글 / 사진 / 영상의 태그 소스를 수집하는 크롤러입니다.
* 무단배포는 금지합니다.(댓글달아주세용)
* 기능에 커스터마이징이 필요하시다면 댓글달아주세용
* 글을 캡쳐한 경우 폴더아래 char\result.txt에 저장됩니다.
* User-Agent와 cookie설정이 없는 프로그램이기에 Robots.txt가 허용된 곳만 탐색가능합니다.
사용예시
더보기
1. 수집할 홈페이지 url을 galmuri에 넣고, 수집할 대상을 선택합니다.
2. ▶누르면 끝! 완료된 결과는 폴더에 태그별로 정리되어있습니다.
* scrapbody.html에 Galmuri가 접근한 html이 있습니다.
* result.txt는 글을 크롤링한 경우에만 유효한 파일입니다.
로드맵
* 로그인된 화면 혹은 차단된 화면 가져올 수 있게 수정(~11월)
'프로그램 > Java Project' 카테고리의 다른 글
[Java Project] 해시검사, 무결성검사기 INTMAN (0) | 2021.11.10 |
---|---|
[Java Project] 비밀번호 난수생성기 RANGAN (0) | 2021.11.05 |