프로그램별 wikipedia2xml.sf.net
-
wikipedia2XML 무료
원래 위키백과 데이터베이스 백업 덤프에서 XML 코퍼스(언어 목적을 위한 대규모 텍스트 컬렉션)를 만들고 처리하는 파이썬 스크립트 컬렉션입니다. 여기에는 MediaWiki 태그 언어에 대한 정규 식 기반 파서가 포함됩니다.
원래 위키백과 데이터베이스 백업 덤프에서 XML 코퍼스(언어 목적을 위한 대규모 텍스트 컬렉션)를 만들고 처리하는 파이썬 스크립트 컬렉션입니다. 여기에는 MediaWiki 태그 언어에 대한 정규 식 기반 파서가 포함됩니다.