Octoparse는 웹 사이트에서 구조화되지 않은 또는 반 구조화 된 데이터를 구조화 된 데이터 세트로 변환하는 무료 클라이언트 측 Windows 웹 스크래핑 소프트웨어로 코딩이 필요하지 않습니다. 웹에서 데이터를 수집하는 사용하기 쉬운 웹 스크래핑 도구입니다. Octoparse에서 실행되는 크롤러는 구성된 추출 규칙에 의해 결정됩니다. 추출 규칙은 Octoparse를 말할 것이다 : 어떤 웹 사이트를 열 것인가; 크롤링하려는 데이터 등은 최대 10개의 동시 스레드를 수행하는 고속 데이터 수집을 제공합니다. Windows 응용 프로그램이기 때문에 Octoparse는 웹 페이지가 Ajax를 사용하는 웹 페이지를 포함하여 정적 및 동적 웹 사이트에 적합합니다. CSV, EXCEL, HTML, TXT 및 데이터베이스(MySQL, SQL Server 및 Oracle)와 같은 다양한 내보내기 형식이 있습니다. Octoparse는 웹 페이지와 상호 작용하는 인간의 작업을 시뮬레이션합니다. 양식을 작성하고, 검색어를 텍스트 상자에 입력하는 등의 놀라운 기능을 사용하면 웹 데이터를 훨씬 쉽게 추출할 수 있습니다. 추출 프로젝트를 자체 컴퓨터(로컬 추출) 또는 클라우드 추출(클라우드 추출)에서 실행할 수 있습니다. Octoparse는 매우 사용자 친화적이고 간단한 시각적 작업 창을 제공합니다. Octoparse는 웹 페이지 열기, 계정에 로그인, 텍스트 입력, 웹 요소를 가리키고 클릭하는 등 인간 웹 브라우징 동작을 시뮬레이션합니다. 기본 제공 브라우저에서 웹 사이트의 정보를 클릭하고 추출을 수행하면 필요한 구조화 된 데이터를 얻을 수 있습니다. 분산 컴퓨팅을 기반으로 대규모로 웹을 동시에 긁는 것은 Octoparse의 가장 강력한 기능입니다. 구성 프로젝트를 클라우드에 업로드한 후 많은 클라우드 서버를 사용하여 동시에 추출을 수행하도록 선택할 수 있습니다. 짧은 시간 내에 10,000개의 웹 페이지를 긁어내야 하는 경우 Octoparse 클라우드 서비스가 가장 적합합니다.
버전 기록
- 버전 6.4.1 에 게시 2017-03-07
프로그램 세부 정보
- 범주: 네트워크 및 인터넷 > 네트워크 모니터링
- 게시자: Octopus Data Inc.
- 라이센스: 무료
- 가격: N/A
- 버전: 6.4.1
- 플랫폼: windows