웹 데이터 추출기 Pro는 다양한 데이터 유형의 대량 수집을 위해 특별히 설계된 웹 스크래핑 도구입니다. URL, 전화 및 팩스 번호, 이메일 주소, 메타 태그 정보 및 본문 텍스트를 수집할 수 있습니다. WDE Pro의 특징은 구조화 된 데이터의 사용자 정의 추출입니다. 이 고속 및 다중 스레드 프로그램은 웹 사이트 또는 파일의 URL 목록을 거미게 하여 키워드를 검색 엔진에 사용하여 작동합니다. 또한 원래 페이지의 외부 링크를 따라 URL 경로에 깊숙이 들어가 실제로 전체 인터넷을 검색할 수 있습니다. 웹 데이터 추출기는 여러 계층의 웹 사이트를 검색하여 제공하는 키워드와 관련된 구조화 된 정보 및 특정 데이터 유형을 수집하는 데 탁월합니다.
버전 기록
- 버전 3.10 에 게시 2020-01-06
이메일 주소의 파서가 크게 향상되었습니다. 사용자 에이전트 목록이 업데이트되었습니다. 추가 & 추출되지 않은 URL & quot;및 quot;향상된 인간 요인 & 옵션 연결에서 대상 웹 사이트와의 보다 효과적인 작업을 위해; 추가 옵션 & 각 X 분 및 견적 및 프록시와의 보다 효과적인 작업을 위해 프록시 서버에서 링크 및 견적의 Y 번호를 읽은 후 다시 갱신; 고객 리뷰에 따라 많은 개선이 이루어졌습니다! - 버전 3.9 에 게시 2018-12-30
검색 엔진 목록은 오래된 링크/끊어진 링크에서 지워집니다. 이를 통해 검색 엔진 모드에서 소프트웨어 속도를 높일 수 있었습니다. 크게 개선 된 이메일 주소 파서, 특히 JS (자바 스크립트) 숨겨진 이메일;CSV 파일에서 자신의 프록시 서버를 가져올 개선 된 옵션;HTTPS 웹 사이트와 개선 된 작업;큰 URL 목록으로 작업 할 때 성능 향상;개선 및 quot;쿠키 캡처 & quot; 옵션; 고객 피드백에 따른 다양한 사소한 수정/개선 사항 - 버전 3.8 에 게시 2017-12-29
PDF 파일에서 정보를 로드하고 추출하는 기능이 추가되었습니다. 프로그램 사용 의 평가판 기간이 만료되면 UI 양식에서 라이선스 파일을 직접 로드하는 기능이 추가되었습니다. 또는 평가판 기간이 아직 만료되지 않은 경우 라이선스 파일을 옵션 -> 정보 양식에서 업로드할 수 있습니다. 프록시 서버를 통해 작업이 크게 개선되었습니다. 인코딩된 JS 이메일의 파서가 개선되었습니다. 컨텍스트 메뉴 항목 및 견적 및 URL 다시 시작 및 목록및 소프트웨어 내부 데이터 저장소를 사용하여 작업 개선됨; 모든 데이터 및 서비스 파일과 함께 세션을 삭제하는 기능을 추가했으며 소프트웨어는 프로그램의 내부 리포지토리를 자동으로 압축하여 필요한 디스크 공간을 줄이는 기능을 추가했습니다. UI에 초기 참조기 및 쿼트 텍스트 필드가 추가되었습니다. 일부 웹 사이트는 어떤 외부 사이트에서 왔는지에 따라 다른 정보를 표시할 수 있습니다. "초기 참조자 & 쿼트 필드를 사용하면 이러한 사이트의 웹 주소를 지정할 수 있습니다. 또한 고객의 피드백을 바탕으로 다양한 사소한 변경 및 개선 사항을 했습니다. - 버전 3.7 에 게시 2017-02-28
개선된 작업 & 검색 엔진 & quot;mode;개선 및 인용 제거 HTML 태그" 및 quot;Page데이터"필터를 추출하기 위해 다음 텍스트를 포함해야 합니다. 추가 & 국가 IP 필터 & quot"필터를 사용하여(지리적 위치별로) 선택된 국가에 관련이 없는 서버의 결과를 제외할 수 있습니다.&검색 엔진 옵션; 상당히 향상 된 이메일 파서 및 사용자 지정 빌더 파서; 데이터 검색 및 추출의 일반적인 개선; 또한 고객의 피드백을 바탕으로 다양한 사소한 변경 및 개선 사항을 했습니다. - 버전 3.6 에 게시 2016-08-22
추가 된 확인란 및 quot;리디렉션 된 URL & 인용 및 인용 및 사용자 지정 데이터 편집기 & 양식을 사용하여 리디렉션을 통해 제공되는 URL (예 : 웹 사이트 주소)을 추출하십시오. 추가 된 확인란 및 quot;비응답 프록시처럼 비응답 프록시를 자동으로 & quot;. 세션 프록시 서버가 불량(작동하지 않음)으로 판단되는 경우 자동으로 비활성으로 표시되고 세션에서 사용되지 않습니다. 데이터를 단일 문자열로 병합하기 위해 새 옵션 및 quot;quot 및 단일 회선 병합 및 쿼트 사용이 추가되었습니다. 예를 들어, 같은 티셔츠 색상을 내보낼 수 있습니다: "T-셔츠", & 블랙, 옐로우, 레드, 그린; 인터넷에서 공용 프록시 서버의 로딩이 크게 향상되었습니다. "인적 요인&쿼트 옵션이 개선되었습니다. JS 이메일 adresses에 의해 폐쇄의 파서를 향상; 구글을 통해 데이터를 검색 할 때 구글 캡차를 전달하는 향상된 옵션; 또한 고객의 피드백을 바탕으로 다양한 사소한 변경 및 개선 사항을 했습니다. - 버전 2.0 에 게시 2012-08-29
스캔 깊이를 결정하기 위한 알고리즘을 재작업, 데이터베이스의 물리적 손상에 대한 프로그램 지속 가능성 추가, 전반적인 성능에 긍정적 인 영향을 미치는 향상된 스트림 제어, 및 quot;Search Engines & quot; 모드의 키워드의 큰 목록으로 작업 개선
프로그램 세부 정보
- 범주: 네트워크 및 인터넷 > 검색/조회 도구
- 게시자: WebExtractor System
- 라이센스: 무료 평가판
- 가격: $199.00
- 버전: 3.10
- 플랫폼: windows