본문 바로가기
반응형

OpenSource/Lucene14

[색인&검색] UI에 루씬 붙여보기! 에고고...환절기 감기 조심하세요...갑자기 엊그제 선풍기 틀어놓고 창문 열어놓고 잤더니...편도가 심하게 부어서...미열(37.5)도 나서 죽을 것 같네요...@.@;;; 하지만 고고씽 해볼까용~약먹고 궁디에 주사도 맞아서 조금 나아졌네요 헤헤; 간단하게 spring을 사용하여 루씬을 붙여보겠습니다~ 환경springframework 3.1mavenlucene 4.0알파아파치 톰캣 6.0Junit test - 색인 구현 검색바 부분 검색어 : taeha로 검색을 하였을 때!~ 검색결과 부분 수집기를 이제 한번 만들어봐야할 것 같습니다.또한 매~~~우 기본적으로 검색을 구축 하였습니다.아직 풀지 못한 친구와 통계와 정렬, 자동완성, 인기어, 유사어, 불용어, 결과내 재검색 등등 해봐야 할 것들이 많네요!~.. 2014. 6. 21.
[색인&검색] 음.. 음.... 궁금한것이 생겼다.. 루씬에서 doc01.scd 라는 수집되어진 문서가 있다고 하자.그 안에는 다음과 같이 로 구성 되어져있다.내가 원하는 것은 검색을할 때 문서를 찾고 그 안에서 offset을 통해 검색되어진 만 뽑아내고 싶다...찾아보는데 잘 찾아지지 않는다..하하;음...생각해보면 역시..오픈소스는 좋은 것 같다. 이런저런 고민도 하게 해준다ㅋㅋ기존에 검색엔진을 가지고 개발은 많이 해봤지만 뭔가 주인의식이 없다고 할까?..오픈소스 루씬은 설치부터 개발까지 그안에 있는 것들도 확장가능하니 이 얼마나 좋은 오픈소스인가!! +ㅁ+/라고 생각을 해본다. 001 lucene books goooood lucene 002 lucene dev very goooood 003 lucene taeha dev.. 2014. 6. 19.
[색인&검색]루씬 - FSDirectory() 사용 Ref url : http://lucene.apache.org/core/4_0_0/core/org/apache/lucene/ 2014/06/04 - [OpenSource/Lucene] - [색인&검색] - 루씬 JUnit Test 해보기& RAMDirectory() 사용! 에 이이서~! 이번 시간에는 RAMDiretory() => FSDirectory() 로 만들어 보겠습니다.색인 후 Luke로 잘 되었는지 확인을 해보면 좋습니다. 아래는 stackoverflow 에 답변 단 Test 코드에서 나온 Luke 내용 입니다. 머리털 나고 처음으로 답변을 달아봤습니다. ㅋㅋ;http://stackoverflow.com/questions/18862600/how-to-use-lucene-indexreader-to.. 2014. 6. 16.
[색인&검색] - 루씬 JUnit Test 해보기& RAMDirectory() 사용! 우선! https://github.com/macluq/HelloLucene/blob/master/pom.xmlpom.xml을 보시면 루씬 core말고도 여러가지가 있습니다! 일단은 그냥 복사해서 붙여넣기를 해봅시다!차근차근! 알아가보도록 하겠습니다^-^/사이트에 가서 보기 싫으신 분은 아래를 클릭! org.apache.lucene lucene-core 4.0.0-ALPHA org.apache.lucene lucene-queries 4.0.0-ALPHA org.apache.lucene lucene-test-framework 4.0.0-ALPHA org.apache.lucene lucene-analyzers-common 4.0.0-ALPHA org.apache.lucene lucene-queryparser .. 2014. 6. 4.
다시 시작하는 루씬!!! 처음 사내 스터디로 진행했던 루씬 검색엔진..어느정도 파악을 한 뒤...웹쪽을 고민하던 차에..스프링프레임워크를 공부해보자하여 잠시 접어두었던..이제는 스프링과 루씬의 환상적인 조화를~~이룰때가 온것 같다. ㅎㅎㅎ (잠시..스프링강좌는 저멀리~~;;) LUKE 사이트https://code.google.com/p/luke/사이트에 가보면 루크의 안정적인 버전은 루씬이 4.0.0-ALPHA라는 것을 알 수가 있다. 굳!Current stable release of Luke is 4.0.0-ALPHA and it includes Lucene 4.0.0-ALPHA and Hadoop 0.20.2. 그러므로! 4.0 ver으로 해보자! 우선 luke부터 다운 받아보자!https://code.google.com/p.. 2014. 6. 3.
[Lucene 7회 차] about index 2012/09/20 - [OpenSource/Lucene] - [Lecene 6회차] Welcome to New face & Analyze about Index.6회차에서 아래와 같이 를 공부하였다.더욱 더 오늘 파고 들어보자!^0^ good~Directory : 루씬의 책에서는 Directory 클래스가 루씬의 색인 파일 저장을 책임 진다고 나와있다.여러가지는 지원하지만 보통 이야기를 할 때  FSDirectory, RAMDirectory를 말한다.특히,  FSDirectory를 많이 쓰는 편 이다. 이름에서 알 수 있듯이 RAMDirectory는 컴퓨터의 메인 메모리를 색인 저장소로 사용하게 해주는 Directory의 하위 클래스이다.소스에서 보면import org.apache.lucene.store.. 2012. 10. 4.
[Lecene 6회차] Welcome to New face & Analyze about Index. 2012/09/13 - [OpenSource/Lucene] - [Lucene 5] - Talk and Analyze about Index with goodtac! 1. 새로운 멤버 영입 : er1ca, 아도니우스 총 멤버 : 4명(4ceT, 굿택, er1ca, 아도니우스) 2. 색인 분석(index analyze) 색인 주요 클래스는 처음 스터디를 할 때 정리를 했었다. 더욱 Detail하게 알아보자!^0^good~ 1. IndexWriter : 색인 과정 전체를 총괄하는 클래스. 새로운 색인을 만들 수 있으며, 색인에 문서를 추가하는 작업도 IndexWriter를 통해야만 한다. ※ 단, 버전이 바뀌어서 사용법이 1.x 하고는 다르다. 사용법 IndexWriterConfig 위의 코드를 보면 루씬버전과.. 2012. 9. 20.
[Lucene 5] - Talk and Analyze about Index with goodtac! oh my god....keyborad bug.....I can't write in Korean...T.T 1. optimize deprecated! Good bye... optimize @Deprecated public void optimize(boolean doWait) throws CorruptIndexException, IOException Deprecated. This method has been deprecated, as it is horribly inefficient and very rarely justified. Lucene's multi-segment search performance has improved over time, and the default TieredMergePolicy .. 2012. 9. 13.
[Study_4회차(2)] Lucene 셋팅(3.5.0) 참고 사항 : 2012/08/29 - [OpenSource/Lucene] - [Study_2회차] Lucene 셋팅 가장 중요한 소스가 있는!! url : http://grepcode.com/snapshot/repo1.maven.org/maven2/org.apache.lucene/lucene-core/3.5.0 보너스로^^~ api : http://lucene.apache.org/core/old_versioned_docs/versions/3_5_0/api/all/index.html 소스를 받아서 프로젝트를 만들고 import 시킨다. (filesystem) 그런 뒤에 아래의 main이 있는 indexer.java를 한번 수행해본다. 자바 코드를 넣으면 아래와 같이 오류가 난다. 위의 오류를 해결하기 위해.. 2012. 9. 7.
[Study_4회차(1)] Luke 셋팅 Luke 셋팅은 매우 간단하다.. 그냥 색인 분석을 위한 도구로 사용 할 예정이기 때문에 jar파일만 받아서 수행하면 된다. url : http://code.google.com/p/luke/downloads/list result jar를 받아서 더블클릭을 해주면 된다. 하지만..2가지 예외 상황이 발생하기도 한다. 1) 알집이 열릴 때 2) java와 연결이 되지 않았을 때 해결방법 1) 알집의 옵션을 조정(.jar 제외) 2) JRE 에서 javaw를 선택! ex) C:\Program Files\Java\jre6\bin\javaw 그런 뒤에 더블클릭을 하면 된다^-^good~ - 끝 - 2012. 9. 6.
<안정적인 버전> 루씬과 루크 스터디 2일차에 셋팅 루씬 3.6x를 하였고 색인을 보다보니 루크라는 녀석이 있었다..이녀석은..루씬 3.6.1에대한 녀석은 없었다..찾아보니 버그리포팅에 올라와있었고 lucene3.6.patch라는파일이 있었지만 어떻게 적용시켜야할지 몰라..버전을 조금 닞추기로 하였다. lucene 3.6.1 -> 2.9.4 원인 : luke 지원(루씬 3.6.1 ver 지원 X) # 2.9.4는 신규 문법이 아니라서.. Luke 3.5.0 (using Lucene 3.5.0) Current stable release of Luke is 4.0.0-ALPHA and it includes Lucene 4.0.0-ALPHA and Hadoop 0.20.2. Available is also Luke 3.5.0 (using .. 2012. 9. 6.
[Study_3회차] Lucene 색인 분석 금일은 Lucene 책 2장. 색인을 둘러 볼 계획이다. 또한 아래의 소스를 커스트마이징 하면서 분석 할려고 한다. ////////////////[분석 대상 파일]/////////////////////////// ////////////////////////////////////////////////////////// // 어제 새벽에 작업하던 파일 ㅋㅋ;; ////////////////////////////////////////////////////////// - 금일 스터디 때 작성 예정..- 2012. 8. 30.
[Study_2회차] Lucene 셋팅 금일 스터디는 OSM교육으로 인해..늦어져..루씬 셋팅을 목표로 해보자! ^0^good~ 루씬..오픈소스! 개발을 위해~스따뚜~~ 1] 루씬 소스를 받자! URL : http://apache.mirror.cdnetworks.com/lucene/java/3.6.1/ 환경 : 32bit window 윈도우다보니....zip을 받으면 되는 줄 알고...lucene-3.6.1.zip 을 받았는데 알고보니 배포판이였다^0^good~ 위와 같이 lucene-3.6.1-src.tqz를 받으면 됩니다.^-^ 받으신 뒤에 원하는 경로에 압축 풀기 및 저장을 합니다. 2) 이제!! 남은 것은 이클립스를 받으면 됩니다. http://www.eclipse.org/downloads/download.php?file=/techno.. 2012. 8. 29.
[Study_1회차] Lucene이란?? 책 : Lucene in Action 오픈소스 자바 검색엔진 2012.08.28 스터디 시작! 인원 : 2명(with 굿택) 시간 : 회사 업무 이후(6시~9시) 1장. 루씬과의 첫 만남 책을 읽다가 보면 JUnit, 리팩토링, mock 객체 등을 소개 한뒤 기본편 1부가 시작 된다. 이번 스터디는 루씬이 뭔가? 색인 api, 검색 api등을 알아보는게 중점 이다. 루씬?? 한마디로 정보검색(IR, Information Retrieval) 라이브러리이다. 자바로 만들어진 오픈소스 소프트웨어이며 아파치 소프트웨어 재단의 자카르타 프로젝트에 속해있다^0^good~ 그냥 자바 라이브러리라고 보면 되고, 흔히 말하는 비지니스 로직이라고 말하는 부분은 루씬에는 전혀 포함 되어있지 않다. 고로 작성해야한다^-^ 그.. 2012. 8. 28.
반응형