Ace-T's Blog 내 검색 [네이버 커넥트 이웃 합니다~^-^/ 요청 大 환영~~]

[색인&검색] 음..

OpenSource/Lucene 2014. 6. 19. 11:51
[Good Comment!!, Good Discussion!!, Good Contens!!]
[ If you think that is useful, please click the finger on the bottom~^-^good~ ]
by ace-T




음....멍2


궁금한것이 생겼다..


루씬에서 doc01.scd 라는 수집되어진 문서가 있다고 하자.

그 안에는 다음과 같이 <searchNum><title><contents>  로 구성 되어져있다.

내가 원하는 것은 검색을할 때 문서를 찾고 그 안에서 offset을 통해 검색되어진

<searchNum><title><contents> 만 뽑아내고 싶다...

찾아보는데 잘 찾아지지 않는다..하하;

음...생각해보면 역시..오픈소스는 좋은 것 같다. 이런저런 고민도 하게 해준다ㅋㅋ

기존에 검색엔진을 가지고 개발은 많이 해봤지만 뭔가 주인의식이 없다고 할까?..

오픈소스 루씬은 설치부터 개발까지 그안에 있는 것들도 확장가능하니 이 얼마나 좋은 오픈소스인가!! +ㅁ+/

라고 생각을 해본다.


<searchNum> 001

<title> lucene books

<contents> goooood lucene

<searchNum> 002

<title> lucene dev

<contents> very goooood

<searchNum> 003

<title> lucene taeha

<contents> dev prd lucene

<searchNum> 004

<title> this is my project

<contents> taeha


title에 색인을 걸어주고 lucene으로 검색어를 날렸을 때 004 searchNum를 

제외한 001 002 003만 가져와서 뿌려주고 싶다.


Luke로 Search를 해봐도 검색범위가 해당 document 즉, data01.scd 전체를 대상으로 한다.

그렇게 되면...아래와 같이 해주어야할 것이다.. 이건 아니잖아! ㅠ ㅠ 

평화

data01.scd

<searchNum> 001

<title> lucene books

<contents> goooood lucene


data02.scd

<searchNum> 002

<title> lucene dev

<contents> very goooood


data03.scd

<searchNum> 003

<title> lucene taeha

<contents> dev prd lucene


data04.scd

<searchNum> 004

<title> this is my project

<contents> taeha



2014/06/16 - [OpenSource/Lucene] - [색인&검색]루씬 - FSDirectory() 사용


2014/06/04 - [OpenSource/Lucene] - [색인&검색] - 루씬 JUnit Test 해보기& RAMDirectory() 사용!


2014/06/03 - [OpenSource/Lucene] - 다시 시작하는 루씬!!!



음...더 고민해보고 찾아봐야겠다. ㅎㅎㅎ 



acet 박태하가 추천하는 readtrend 추천글!

설정

트랙백

댓글

:::: facebook을 이용하시는 분들은 로그인 후 아래에 코멘트를 남겨주세요 ::::