본문 바로가기

IT 이야기/데이터베이스

DBLP - parsing

 

DBLP 에서 제공하는 parsing 예제.

http://www.informatik.uni-trier.de/~ley/db/about/simpleparser/index.html

 

Parser.java

Publication.java

Person.java

...

 

Compile

 ...

class file + dblp.xml + dblp.dtd

java -mx900M -DentityExpansionLimit=2500000 Parser dblp.xml > out.txt

 

Result file : out.txt 

 

## 돌려보니까 dblp.xml 파일이 작아서 다행히 금방 컴파일 됨. 10초정도 ?

## 아마 Xerces Parser 를 바로 사용하기에는 불가하고,( 약간씩 자료를 빠뜨리는 경우가 발생한다고 함. )

## 따라서 소스코드 수정을 어느정도 필요하다고 생각함.

 

Xerces Parser 사용 예제.

http://tilia.blog.me/150086967240

 

 

 

 

 

이 글은 스프링노트에서 작성되었습니다.

'IT 이야기 > 데이터베이스' 카테고리의 다른 글

dblp_last2  (0) 2011.01.12
dblp.xml  (0) 2011.01.12
XML Parser  (0) 2011.01.12
Project 소개  (0) 2011.01.12
Oracle Text  (0) 2011.01.12