Notkun málmódela í XML upplýsingaleit ?>

Notkun málmódela í XML upplýsingaleit

 

Nú er að verða nokkuð ljóst hvaða stefnu ég mun taka í rannsóknum mínum. Eins og staðan er í dag lítur út fyrir að ég muni sérhæfa mig í aðlögun málmódela (e. language models) að upplýsingaleit í XML skjölum. Málmódel eru afar vinsæl þessa dagana í upplýsingaleitar heiminum. Eftir að hafa reynst vel í talmálsgreiningu (e. speech recognition) hefur málmódelum vaxið fiskur um hrygg. Þau eru meðal annars notuð í setningarhlutagreiningu, rithandargreiningu, o.fl. Í talmálsgreiningu eru módelin notuð til að reikna líkur á að tiltekin upptaka af töluðu máli sé upplestur ákveðins texta. Þ.e. líkurnar á að upptakan sé form upplestursins eftir ferð í gegnum truflaða rás (e. noisy channel). Í upplýsingaleit eru módelin notuð til að reikna líkur á að tiltekinn texti sé svar við ákveðinni fyrirspurn. Litið er á að fyrirspurnin sé form textans eftir að hann hefur farið í gengum einhvers konar truflaða rás. Hvernig málmódel reynast í XML upplýsingaleit verður líklega hægt að lesa í doktorsrigerðinni minni sem mun vonandi koma út í árslok 2006.

Skildu eftir svar