Ace-T's Blog 내 검색 [네이버 커넥트 이웃 합니다~^-^/ 요청 大 환영~~]

[Lecene 6회차] Welcome to New face & Analyze about Index.

OpenSource/Lucene 2012.09.20 19:34
[Good Comment!!, Good Discussion!!, Good Contens!!]
[ If you think that is useful, please click the finger on the bottom~^-^good~ ]
by ace-T



2012/09/13 - [OpenSource/Lucene] - [Lucene 5] - Talk and Analyze about Index with goodtac!

1. 새로운 멤버 영입 : er1ca, 아도니우스
   총 멤버 : 4명(4ceT, 굿택,  er1ca, 아도니우스)

2. 색인 분석(index analyze)
    색인 주요 클래스는 처음 스터디를 할 때 정리를 했었다.
    더욱 Detail하게 알아보자!^0^good~
  
    1. IndexWriter : 색인 과정 전체를 총괄하는 클래스. 새로운 색인을 만들 수 있으며,
                          색인에 문서를 추가하는 작업도 IndexWriter를 통해야만 한다.
        ※ 단, 버전이 바뀌어서 사용법이 1.x 하고는 다르다.

       사용법
       IndexWriterConfig <--이녀석이 새로 생김.
       - 새롭게 변경 된 내용이며, 
         call the setters to set your configuration, then pass it to IndexWriter이다.
         설정을 불러서 IndexWriter에 넘긴다는 것이다.^-^good~

       IndexWriterConfig conf = new IndexWriterConfig(Version.LUCENE_35, new KeywordAnalyzer() );
       => 위의 코드를 보면 루씬버전과 형태소분석이 들어가는 것을 볼 수 있다.
        
       IndexWriter writer = new IndexWriter(idxDir, conf);
       IndexWriter은 위에서 설명한 것과 같이 색인관련 클래스이다.
       레퍼런스에는 An IndexWriter creates and maintains an index. 라고 정의 되어져있다.

       // Directory => 색인 저장, 색인저장소 - 1) FSDirectory, RAMDirectory
       Directory idxDir = FSDirectory.open(new File(idxPath));
   
       - to be continue..

acet 박태하가 추천하는 readtrend 추천글!

설정

트랙백

댓글

:::: facebook을 이용하시는 분들은 로그인 후 아래에 코멘트를 남겨주세요 ::::

[Study_4회차(2)] Lucene 셋팅(3.5.0)

OpenSource/Lucene 2012.09.07 01:42
[Good Comment!!, Good Discussion!!, Good Contens!!]
[ If you think that is useful, please click the finger on the bottom~^-^good~ ]
by ace-T
참고 사항 : 2012/08/29 - [OpenSource/Lucene] - [Study_2회차] Lucene 셋팅


가장 중요한 소스가 있는!! 
url : http://grepcode.com/snapshot/repo1.maven.org/maven2/org.apache.lucene/lucene-core/3.5.0

보너스로^^~
api : http://lucene.apache.org/core/old_versioned_docs/versions/3_5_0/api/all/index.html


소스를 받아서 프로젝트를 만들고 import 시킨다. (filesystem)
그런 뒤에 아래의 main이 있는 indexer.java를 한번 수행해본다.



자바 코드를 넣으면 아래와 같이 오류가 난다.


위의 오류를 해결하기 위해 jar파일을 넣어주면 된다.



jar를 넣어주면 아래와 같이 에러들이 사라지게 된다.



이제 Run을 시키기 위해 Dir 2개를 만들고, 특히 data쪽에는 txt 파일을 만들고 내용은 영어 아무거나 넣어줍니다.



index Dir에는 아무것도 생성하지 않습니다.



자! 이제 Run을 시켜보면..


콘솔에는 아래와 같은 메시지가 출력 되어집니다.


또한 index 폴더로 가시면 놀라운 것을 볼 수가 있습니다. 네! 바로 색인 파일들입니다.!^-^good~~


마지막으로 우리가 스터디 4(1)에서 Luke jar를 다운받았습니다! 괜히 받은것은 아니겠죠? ㅎㅎ
Luke를 통해 색인된 파일들을 확인 해 봅시다^-^good~


2012/09/06 - [OpenSource/Lucene] - [Study_4회차(1)] Luke 셋팅


luke jar 즉, lukeall-3.5.0.jar 더블클릭 하신 뒤에 luke를 띄웁니다.
then, 색인이 저장된 Dir를 선택하여 줍니다.



luke로 확인 한 결과!


여기까지가~~~색인을 돌려본 결과 입니다^-^good
다음 스터디는 색인에 대해서 분석하여 봅시다~~~^0^~~~~Bye

Lucene Study는 매주 목요일 입니다.


- 끝 -

acet 박태하가 추천하는 readtrend 추천글!

설정

트랙백

댓글

:::: facebook을 이용하시는 분들은 로그인 후 아래에 코멘트를 남겨주세요 ::::

티스토리 툴바