Usunąć polskie znaki
Tomek - 20-11-2006 00:31
Usunąć polskie znaki
Witam
Pobieram strone www z internetu. Wiadomo, czasem jest ona kodowana w UTF-8, czasem w iso-8859-2, czasem w windows-1250.
Jak bez wzgledu na to usunac z niej wszystkie polskie znaki ? Jest jakas metoda ? Moze jakies wyrazenie regularne, ktore zostawi tylko okreslone znaki ?
PLEASE HELP
Tomek
Tomek - 20-11-2006 00:31
Otoz splodzilem wlasnie taka funkcje:
for(int i = 0; i < data.length; i++) { /*ę*/ if (data[i] == 0xEA || data[i] == 0xEA ) data[i] = 'e'; else /*ó*/ if (data[i] == 0xF3 || data[i] == 0xF3 ) data[i] = 'o'; else /*ą*/ if (data[i] == 0xB9 || data[i] == 0xB1 ) data[i] = 'a'; else /*ś*/ if (data[i] == 0x9C || data[i] == 0xB6 ) data[i] = 's'; else /*ł*/ if (data[i] == 0xB3 || data[i] == 0xB3 ) data[i] = 'l'; else /*ż*/ if (data[i] == 0xBF || data[i] == 0xBF ) data[i] = 'z'; else /*ź*/ if (data[i] == 0x9F || data[i] == 0xBC ) data[i] = 'z'; else /*ć*/ if (data[i] == 0xE6 || data[i] == 0xE6 ) data[i] = 'c'; else /*ń*/ if (data[i] == 0xF1 || data[i] == 0xF1 ) data[i] = 'n'; else /*Ę*/ if (data[i] == 0xCA || data[i] == 0xCA ) data[i] = 'E'; else /*Ó*/ if (data[i] == 0xD3 || data[i] == 0xD3 ) data[i] = 'O'; else /*Ą*/ if (data[i] == 0xA5 || data[i] == 0xA1 ) data[i] = 'A'; else /*Ś*/ if (data[i] == 0x8C || data[i] == 0xA6 ) data[i] = 'S'; else /*Ł*/ if (data[i] == 0xA3 || data[i] == 0xA3 ) data[i] = 'L'; else /*Ż*/ if (data[i] == 0xAF || data[i] == 0xAF ) data[i] = 'Z'; else /*Ź*/ if (data[i] == 0x8F || data[i] == 0xAC ) data[i] = 'Z'; else /*Ć*/ if (data[i] == 0xC6 || data[i] == 0xC6 ) data[i] = 'C'; else /*Ń*/ if (data[i] == 0xD1 || data[i] == 0xD1 ) data[i] = 'N'; }
Zna ktos prostsze rozwiazanie ?
Tomek
Krzysztof Wolny - 20-11-2006 00:32
Tomek napisał(a): > Otoz splodzilem wlasnie taka funkcje: > Zna ktos prostsze rozwiazanie ?
wyjasnij to (podwojny warunek w if'ie :)
if (data[i] == 0xEA || data[i] == 0xEA ) data[i] = 'e'; ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
-- ================================ Krzysztof Wolny
[ http://rtfm.bsdzine.org ][ http://tiny.pl/g776 ]
O: No bo normalnie to każdy czyta z góry na dół... P: Dlaczego ??? O: Pisanie nad cytatem ! P: Co należy do bardziej wkurzających obyczajów niektorych ludzi ?
yaro - 20-11-2006 00:33
>> Otoz splodzilem wlasnie taka funkcje: > > Zna ktos prostsze rozwiazanie ? > > wyjasnij to (podwojny warunek w if'ie :) > > if (data[i] == 0xEA || data[i] == 0xEA ) data[i] = 'e'; > ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
Moze gosc sie poprostu jąka jąka :)
yaro
zanotowane.pldoc.pisz.plpdf.pisz.pleffulla.pev.pl
|
Import za =?ISO-8859-2?Q?pomoc=B1_EMS_Data_Import_for_?==?ISO-8859-2?Q?MySQL_-_polskie_litery=2E?=
xHarbour/CLipper/Linuks - brak polskich =?ISO-8859-2?Q?znak=F3w_?==?ISO-8859-2?Q?w_GET?=
=?ISO-8859-2?Q?[psql]_Polskie_t=B3umaczenie_?= =?ISO-8859-2?Q?licencji_BSD_dla_PostgreSQL=3F?=
polski nowy klip. realizacja Fotki i montaż: Rymek Błaszczak. animki fx i CC: mariusz mario zdanowski
VFP 8 i problem z polskimi znakami przy otwieraniu dbf-a z dosowego Fox-a
=?ISO-8859-2?Q?[firebird]_gdzie_si=EA_podzia=B3y_polskie_literki?=
=?iso-8859-2?q?mysql_+_polskie_znaczki_+_brak_pomys=B3=F3w?=
Zapis polskich literek w bazie danych US7ASCII z bazy EE8ISO8859P2
hurtowa zmiana polskich liter w nazwach =?ISO-8859-2?Q?plik=F3w_?=
[MySQL] - konwersja polskich znaków i jeszcze małe "conieco"
zanotowane.pldoc.pisz.plpdf.pisz.plabsolwenci.keep.pl
Cytat
Decede mihi sole - nie zasłaniaj mi słonca. Gdy kogoś kochasz, jesteś jak stworzyciel świata - na cokolwiek spojrzysz, nabiera to kształtu, wypełnia się barwą, światłem. Powietrze przytula się do ciebie, choćby był mróz, a ty masz w sobie tyle radości, że musisz ją rozdawać wokoło, bo się w tobie nie mieści Hoc fac - tak czyń. A tergo - od tyłu; z tyłu. I czarne włosy posiwieją. Safona |
|