Lucene Score resultater

stemmer
39

I Lucene hvis du hadde flere indekser som dekket bare én partisjon hver. Hvorfor det samme søket på ulike indekser returnere resultater med forskjellige score? Resultatene fra ulike servere samsvare nøyaktig.

dvs. hvis jeg søkte på:

  • Navn - John Smith
  • DOB - 11/11/1934

Skillevegg 0 vil returnere en score på 0,345

Partisjon 1 vil returnere en score på 0,337

Begge passer nøyaktig på navn og DOB.

Publisert på 02/08/2008 klokken 09:28
kilden bruker
På andre språk...                            


3 svar

stemmer
20

Den scoring inneholder Inverse Document Frequency (IDF). Hvis begrepet "John Smith" er i en partisjon, 0, 100 ganger og i område 1, en gang. Poengsummen for å søke etter John Smith ville bli høyere søk i område 1 som begrepet er mer mangelvare.

For å komme rundt dette du ville visne må ha indeksere være over alle partisjoner, eller du trenger å overstyre IDF.

Svarte 02/08/2008 kl. 09:51
kilden bruker

stemmer
14

Fordi resultatet er bestemt på indeksen hvis jeg ikke helt feil.

Hvis du har ulike indekser (mer / mindre eller annen data som ble indeksert), vil resultatet være forskjellig:

http://lucene.apache.org/core/3_6_0/scoring.html

(Advarsel: Inneholder Math :-))

Svarte 02/08/2008 kl. 09:52
kilden bruker

stemmer
9

Du kan også være interessert i produksjonen av explain()metoden , og den resulterende Explanationobjektet , som vil gi deg en idé om hvordan ting scoret slik de er.

Svarte 02/08/2008 kl. 20:03
kilden bruker

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more