tsearch2: polskie lexemy, prawie działa..
ErkA - 22-03-2007 00:05
tsearch2: polskie lexemy, prawie działa..
hello
Juz prawie mi sie udalo wszystko uruchomic, ale niestety nadal mam problemy...
1. select lexize('pl_ispell', 'słowa'), lexize('pl_ispell', 'słowami'); -> słowo - jest ok
2. select lexize('pl_ispell', 'slowa'), lexize('pl_ispell', 'slowami'); - nic sie nie pojawia (hmmm - nie ma w slowniku czy cos nie halo?)
3. SELECT * FROM to_tsvector('default', 'między słowami uciekają głośniki') -> indeksuje wszystko jak leci..ale jest dam:
ale jak dam jakies zdanie po angielsku 'white walls gets blue' otrzymuje podstawowe formy (wall, get) Co i gdzie jeszcze musze zmienic, zeby to sprawnie dzialalo?
ps. nie wiedzialem, ze te wszystkie kroki dodawania nowego slownika sa tak przekombinowane :), tworzenie slow stop etc - to trzeba samemu tworzyc ("zalatwiac"), i nigdzie nie ma wprost napisane, ze to maja byc zwykle pliki txt ;)
-- pozdrawiam serdecznie rafi
+++++++++++to++nie++jest++reklama++;)+++++++++++ www.BAZAREK.pl - DARMOWE SKLEPY INTERNETOWE, Otwórz sklep online i zarabiaj-bez opłat, bez prowizji ++++++++++++++++++++++++++++++++++++++++++++++++
=?iso-8859-2?q?Filip_Rembia=B3kowski?= - 22-03-2007 00:05
=?iso-8859-2?q?Re:_tsearch2:_polskie_lexemy,_prawie_dzia=B3a. .?=
On 21 Mar, 03:17, ErkA <a...@antyspamowy.pl> wrote: > hello > > Juz prawie mi sie udalo wszystko uruchomic, ale niestety nadal mam > problemy... > > 1. select lexize('pl_ispell', 'słowa'), lexize('pl_ispell', 'słowami'); > -> słowo - jest ok > > 2. select lexize('pl_ispell', 'slowa'), lexize('pl_ispell', 'slowami'); > - nic sie nie pojawia (hmmm - nie ma w slowniku czy cos nie halo?)
w konfigu (bodajże tabela pg_ts_cfgmap) możesz dla każdej rozpoznawanej klasy wyrazów podać _listę_ słowników; jeśli na końcu podasz 'simple' to słowa nie znalezione w żadnym z poprzednich będą też indeksowane
skorzystaj z funkcji ts_debug żeby zobaczyć jak są rozpoznawane wyrazy
> ps. nie wiedzialem, ze te wszystkie kroki dodawania nowego slownika sa > tak przekombinowane :), tworzenie slow stop etc - to trzeba samemu > tworzyc ("zalatwiac"), i nigdzie nie ma wprost napisane, ze to maja byc > zwykle pliki txt ;) w wersji 8.3 postgresa ma być prościej :)
ErkA - 22-03-2007 00:06
Filip Rembiałkowski napisał(a):
> w konfigu (bodajże tabela pg_ts_cfgmap) możesz dla każdej > rozpoznawanej klasy wyrazów podać _listę_ słowników;
dzieki za odpowiedz, mam kolejne pytania czy gdzies sa opisane te klasy slow? Czy dla wiersza:
429315;"default_polish";"lword";"{pl_ispell}" moge dodac {simple}
"default_polish";"lword";"{pl_ispell}{simple}" ?
generalnie mam takie wartosci:
"default_polish";"email";"{simple}" "default_polish";"file";"{simple}" "default_polish";"float";"{simple}" "default_polish";"host";"{simple}" "default_polish";"hword";"{simple}" "default_polish";"int";"{simple}" "default_polish";"lhword";"{pl_ispell}" "default_polish";"lpart_hword";"{pl_ispell}" "default_polish";"lword";"{pl_ispell}" "default_polish";"nlhword";"{simple}" "default_polish";"nlpart_hword";"{simple}" "default_polish";"nlword";"{simple}" "default_polish";"part_hword";"{simple}" "default_polish";"sfloat";"{simple}" "default_polish";"uint";"{simple}" "default_polish";"uri";"{simple}" "default_polish";"url";"{simple}" "default_polish";"version";"{simple}" "default_polish";"word";"{simple}"
-- pozdrawiam serdecznie rafi
+++++++++++to++nie++jest++reklama++;)+++++++++++ www.BAZAREK.pl - DARMOWE SKLEPY INTERNETOWE, Otwórz sklep online i zarabiaj-bez opłat, bez prowizji ++++++++++++++++++++++++++++++++++++++++++++++++
ErkA - 22-03-2007 00:06
Filip Rembiałkowski napisał(a):
> skorzystaj z funkcji ts_debug żeby zobaczyć jak są rozpoznawane > wyrazy >
select * from ts_debug('czemu chlebak nie ma mąki');
"default";"lword";"Latin word";"czemu";"{en_stem}";"'czemu'" "default";"lword";"Latin word";"chlebak";"{en_stem}";"'chlebak'" "default";"lword";"Latin word";"nie";"{en_stem}";"'nie'" "default";"lword";"Latin word";"ma";"{en_stem}";"'ma'" "default";"word";"Word";"mąki";"{simple}";"'mą ki'"
wyglada na to, ze gdzie jeszcze musze ustawic, aby default korzystal pl_ispell, ale pytanie... czy mam to w brzydki sposob update'nac czy porzadnie gdzies ustawic, to co trzeba (gdzie i co??). Ponizej wartosci z pg_ts_cfgmap:
"default";"email";"{simple}" "default";"file";"{simple}" "default";"float";"{simple}" "default";"host";"{simple}" "default";"hword";"{simple}" "default";"int";"{simple}" "default";"lhword";"{en_stem}" "default";"lpart_hword";"{en_stem}" "default";"lword";"{en_stem}" "default";"nlhword";"{simple}" "default";"nlpart_hword";"{simple}" "default";"nlword";"{simple}" "default";"part_hword";"{simple}" "default";"sfloat";"{simple}" "default";"uint";"{simple}" "default";"uri";"{simple}" "default";"url";"{simple}" "default";"version";"{simple}" "default";"word";"{simple}"
"default_polish";"email";"{simple}" "default_polish";"file";"{simple}" "default_polish";"float";"{simple}" "default_polish";"host";"{simple}" "default_polish";"hword";"{simple}" "default_polish";"int";"{simple}" "default_polish";"lhword";"{pl_ispell}" "default_polish";"lpart_hword";"{pl_ispell}" "default_polish";"lword";"{pl_ispell}" "default_polish";"nlhword";"{simple}" "default_polish";"nlpart_hword";"{simple}" "default_polish";"nlword";"{simple}" "default_polish";"part_hword";"{simple}" "default_polish";"sfloat";"{simple}" "default_polish";"uint";"{simple}" "default_polish";"uri";"{simple}" "default_polish";"url";"{simple}" "default_polish";"version";"{simple}" "default_polish";"word";"{simple}"
-- pozdrawiam serdecznie rafi
+++++++++++to++nie++jest++reklama++;)+++++++++++ www.BAZAREK.pl - DARMOWE SKLEPY INTERNETOWE, Otwórz sklep online i zarabiaj-bez opłat, bez prowizji ++++++++++++++++++++++++++++++++++++++++++++++++
zanotowane.pldoc.pisz.plpdf.pisz.pleffulla.pev.pl
|
Import za =?ISO-8859-2?Q?pomoc=B1_EMS_Data_Import_for_?==?ISO-8859-2?Q?MySQL_-_polskie_litery=2E?=
xHarbour/CLipper/Linuks - brak polskich =?ISO-8859-2?Q?znak=F3w_?==?ISO-8859-2?Q?w_GET?=
=?ISO-8859-2?Q?[psql]_Polskie_t=B3umaczenie_?= =?ISO-8859-2?Q?licencji_BSD_dla_PostgreSQL=3F?=
[MySQL] Po aktualizacji =?ISO-8859-2?Q?znikn=EA=B3y_polskie_?==?ISO-8859-2?Q?znaki=2E?=
polski nowy klip. realizacja Fotki i montaż: Rymek Błaszczak. animki fx i CC: mariusz mario zdanowski
VFP 8 i problem z polskimi znakami przy otwieraniu dbf-a z dosowego Fox-a
=?ISO-8859-2?Q?[firebird]_gdzie_si=EA_podzia=B3y_polskie_literki?=
=?iso-8859-2?q?mysql_+_polskie_znaczki_+_brak_pomys=B3=F3w?=
Zapis polskich literek w bazie danych US7ASCII z bazy EE8ISO8859P2
[MySql] Select, polskie znaki i duze oraz małe litery
zanotowane.pldoc.pisz.plpdf.pisz.plptsite.xlx.pl
Cytat
Decede mihi sole - nie zasłaniaj mi słonca. Gdy kogoś kochasz, jesteś jak stworzyciel świata - na cokolwiek spojrzysz, nabiera to kształtu, wypełnia się barwą, światłem. Powietrze przytula się do ciebie, choćby był mróz, a ty masz w sobie tyle radości, że musisz ją rozdawać wokoło, bo się w tobie nie mieści Hoc fac - tak czyń. A tergo - od tyłu; z tyłu. I czarne włosy posiwieją. Safona |
|