Changes between Version 1 and Version 2 of MariaDB Mroonga


Ignore:
Timestamp:
Nov 11, 2025, 6:08:59 PM (4 weeks ago)
Author:
yongwoo
Comment:

Legend:

Unmodified
Added
Removed
Modified
  • MariaDB Mroonga

    v1 v2  
    22= Mroonga =
    33https://mroonga.org/docs/
     4
     5일본에서 ムルンガ라고 하므로 무룽가라고 발음하면 될 듯 하다.
    46
    57MariaDB가 기본 제공하는 Full-Text 검색 엔진은 구분자 기준 색인을 하기 때문에 띄어쓰기가 잘못된 경우는 검색하지 못한다. 특히나 띄어쓰기 없이 조사를 붙이거나 합성어를 붙여쓰는 경우가 많은 한국어의 특징에 맞지 않아 잘 안쓴다.
     
    209211 - 공백 및 특수 문자 처리: 불필요한 공백이나 특수 문자를 제거
    210212
     213{{{--mode GET}}}을 추가하면 인덱싱을 할 때 사용하는 토큰이 아니라 검색어를 추려낼 때 사용하는 토큰을 알 수 있다.
     214{{{
     215> select MROONGA_COMMAND('tokenize TokenBigram "한글 검색" NormalizerAuto --mode GET');
     216 [{"value":"한글","position":0,"force_prefix":false},{"value":"검색","position":2,"force_prefix":false}] 
     217}}}
     218 - "한글 검색"이라는 데이터를 저장할 때는 "한글", "글", "검색", "색" 이렇게 네 개의 토큰을 저장한다. 가능한 한 많은 토큰으로 쪼개어 인덱스에 추가하기 위함이다.
     219 - "한글 검색"이라는 검색어를 입력하면 인덱스에서 "한글", "검색" 이렇게 두 개의 토큰만 찾는다. 검색 효율과 정확도를 위해 문서 인덱싱 때보다 좀 더 간결하거나 통합된 토큰을 생성하는 경향이 있다.
     220
    211221{{{
    212222-- 테스트 데이터 입력
     
    325335mroonga_command() 함수는 mroonga 명령을 직접 실행할 때 쓴다. MariaDB 명령보다 빠르다.
    326336
    327 ~~mroonga_command() 함수는 UDF로 Mroonga에 포함되어 있지만 CREATE FUNCTION 명령으로 함수를 등록해야만 사용할 수 있다.~~
     337mroonga_command() 함수는 UDF로 Mroonga에 포함되어 있지만 CREATE FUNCTION 명령으로 함수를 등록해야만 사용할 수 있다.
    328338{{{
    329339CREATE FUNCTION mroonga_command RETURNS STRING SONAME 'ha_mroonga.so';