(Q2840)
Statements
Členění textu na jednotlivá slova je jedním ze způsobů segmentace textu (hláska, morf, slabika, slovo, věta). Slova jsou uspořádána do vyšších syntaktických, sémantických apod. struktur. Problematika rozptylu slov v textu je důležitá zejména při řešení vyhledávání informací. Vyhledávací systémy nejsou schopny porozumět textovým souvislostem a proto musí slova organizovaná ve větách strukturovat do jiných např. frekvenčních struktur, v nichž jsou slova rozptýlená z různých textů uspořádána abecedně podle počtu výskytů v textech. Zákonitostí existujících mezi rozptýlenými slovy se potom užívá při algoritmizaci vyhledávacího softwaru.
1 reference
42-51
000003163
0 references
2003-12-08
(December 8th, 2003)
(December 8th, 2003)
0 references