언론개혁1 [Jsoup] Java 로 웹 크롤링 하기. 최근까지 각종 뉴스들로 많은 이야기가 있었다. 검찰 개혁, 조국 전 법무부 장관, 언론 등 관련 뉴스를 보면서 문득 기사의 내용들을 긁어서 나만 볼 수 있는 방법이 있을까? 라는 궁금증이 생겼고 그것에 대한 해결책으로 웹 크롤링을 찾게 되었다. 나는 Java 를 주로 다루니깐 Java 를 사용하여 웹 크롤링을 하는 방법을 찾았다. 대표적인 것으로 Jsoup 이 있는데, 물론 이걸 사용하지 않고도 직접 코딩해서 크롤링을 하는것도 가능하다. 하지만 난 귀차니즘이 많은 사람이므로 누군가 만들어놓은 오픈 소스 Jsoup 을 사용한다. 사용 방법은 간단하다. 우선, Jsoup 홈페이지에 들어가 설치 방법을 찾아본다. https://jsoup.org/ jsoup Java HTML Parser, with best o.. 2019. 12. 3. 이전 1 다음