www.novezahradnimesto.net

Oznámení a důležité věci k přečtení - Opravená databáza

JoHnY - 6.4.2006, 12:31
Předmět: Opravená databáza
Takže vážení, práve sa mi podarilo totálne rozbiť diakritiku v celej databáze. Neviem si to vysvetliť lebo som menil akurát default charset pre mysql demon a s databázou som nič nerobil. Zálohu som mazal tesne pred tým, s tým že idem robiť novú.

Týmto sa všetkým ospravedlňujem a fakt neviem čo mám robiť, ale napraviť sa to nedá Neutral

UPDATE: Svitla nadej ze sa s tymi nieco bude dat spravit. Cakajte a mozno sa dockate.
dcom - 6.4.2006, 12:35
Předmět: Re: Pokašlaná databáza
JoHnY napsal:
Takže vážení, práve sa mi podarilo totálne rozbi? diakritiku v celej databáze. Neviem si to vysvetli? lebo som menil akurát default charset pre mysql demon a s databázou som ni? nerobil. Zálohu som mazal tesne pred tým, s tým že idem robi? novú.

Týmto sa všetkým ospravedl?ujem a fakt neviem ?o mám robi?, ale napravi? sa to nedá Sad((


at zije utf-8 Laughing Razz Cool Wink
dcom - 6.4.2006, 12:36
Předmět: Re: Pokašlaná databáza
JoHnY napsal:
Takže vážení, práve sa mi podarilo totálne rozbiť diakritiku v celej databáze. Neviem si to vysvetliť lebo som menil akurát default charset pre mysql demon a s databázou som nič nerobil. Zálohu som mazal tesne pred tým, s tým že idem robiť novú.

Týmto sa všetkým ospravedlňujem a fakt neviem čo mám robiť, ale napraviť sa to nedá Sad((


a co zkusit nastavit kodovani v myphpadminovi ?
JoHnY - 6.4.2006, 12:38
Předmět:
číá?ýší?áčšží?áčš test
JoHnY - 6.4.2006, 12:39
Předmět:
prosim vsetkych nech vydrzia kym spravim aspon to ze v novych prispevkoch to bude fungovat
dakujem
dcom - 6.4.2006, 12:41
Předmět:
?á?žá?ž test test
JoHnY - 6.4.2006, 12:45
Předmět:
čšíáčíáľšžíáčžľéášč
navsteva - 6.4.2006, 12:45
Předmět:
Tak nevim, jak jsou na tom ostatni bezni uzivatele, ale pro me jsou slova s otazniky misto diakritiky porad asi tak o 300% vic srozumitelnejsi nez prispevky typu "lebo som menil akurát default charset pre mysql demon" , takze zadny spech
dcom - 6.4.2006, 12:48
Předmět:
navsteva napsala:
Tak nevim, jak jsou na tom ostatni bezni uzivatele, ale pro me jsou slova s otazniky misto diakritiky porad asi tak o 300% vic srozumitelnejsi nez prispevky typu "lebo som menil akurát default charset pre mysql demon" , takze zadny spech


preklad: vychozi znakova sada pro databazovou sluzbu Wink Cool
greticka - 6.4.2006, 12:50
Předmět:
A ja uz zacala stelovat kodovani v prohlizeci. Tak se snaz, Johny
JoHnY - 6.4.2006, 12:54
Předmět:
čľéšíáýéíáčýľš
JoHnY - 6.4.2006, 13:02
Předmět:
bohuzial, zakladne veci ako nazvy for zmenime, to je najmenej, ale tie prispevky s tym sa uz asi nic neda robit Sad
JoHnY - 6.4.2006, 13:15
Předmět:
mimochodom, v suvislosti s tymto keby vam to niekde pisalo nejaky error alebo by ste videli rozbitu diakritiku v novych prispevkoch alebo nieco podobne, prosim okamzite hlasit (sem, alebo cez privatnu spravu alebo mailom, cez icq a podobne)

dik
dcom - 6.4.2006, 13:25
Předmět:
test ěščřžýáíé
Milan V. - 6.4.2006, 13:31
Předmět:
Snažíme se, snažíme, tak mějte strpení, abychom alespoň to nejdůležitější opravili ...
JoHnY - 6.4.2006, 13:36
Předmět:
dcom napsal:
test ěščřžýáíé


čo toľko testuješ, anciáša ti naháňam! Very Happy
JoHnY - 6.4.2006, 13:43
Předmět:
mimochodom tato pokaslana databaza je urcite nejaka zaskodnicka akcia CG!! Very Happy
MUSTANG - 6.4.2006, 14:00
Předmět:
data v databazi asi spatne nejsou, neumim si predstavit ze by se vsecko "samo" updatovalo (a kdyby to nebylo MySQL tak by to bylo treba i zaCOMMITovat) Smile. Bud jsi zmenil nastaveni klienta, serveru nebo WebServeru. Trochu si s tim pohraj a uvidis, ze to vyresis Wink Je to magie, ale ne tak strasna...
JoHnY - 6.4.2006, 14:10
Předmět:
to som si aj ja myslel, neboj sa
ale vydumpoval som to a su tam otazniky, stiahol som tie files databazove k sebe a je to naozaj tak, tiez som tomu nemohol uverit
proste sa to "samo" updatovalo ako vravis, nerozumiem
rozum mi zostava stat lebo toto sa mi este nestalo nikdy a lubos sa tiez cudoval ale je to proste tak Sad
JoHnY - 6.4.2006, 14:12
Předmět:
A este prosim upravte si profily kto tam mate "nove zahradni mesto" s diakritikou v bydlisti tak nech sa to zobrazuje korektne, diky
MUSTANG - 6.4.2006, 14:30
Předmět:
a bezi to na tvem serveru nebo to nekdo hostuje a poskytuje ti DB/PHP?
dcom - 6.4.2006, 14:38
Předmět:
JoHnY napsal:
dcom napsal:
test ěščřžýáíé


čo toľko testuješ, anciáša ti naháňam! Very Happy


Test Test Test Test Test Test Test Test Test Test Test Test Test Laughing Razz Wink
JoHnY - 6.4.2006, 14:39
Předmět:
MUSTANG napsal:
a bezi to na tvem serveru nebo to nekdo hostuje a poskytuje ti DB/PHP?


je to moj server
Lubos - 6.4.2006, 14:41
Předmět:
Veru, obavam sa, ze sa budeme musiet naucit s tym zit... a rucne opravit aspon tie najdolezitejsie clanky.

Diakritika sux Sad
JoHnY - 6.4.2006, 14:42
Předmět:
Lubos napsal:
Diakritika sux Sad


Big time!
dcom - 6.4.2006, 14:51
Předmět:
JoHnY napsal:
Lubos napsal:
Diakritika sux Sad


Big time!


a co zkusit vyexportovat celou db a znovu ji nahrat (udelat si nejakou testovaci db) a pritom znova nastavit charset u vsech tabuleKč Idea
JoHnY - 6.4.2006, 14:55
Předmět:
dcom napsal:
JoHnY napsal:
Lubos napsal:
Diakritika sux Sad


Big time!


a co zkusit vyexportovat celou db a znovu ji nahrat (udelat si nejakou testovaci db) a pritom znova nastavit charset u vsech tabuleKč Idea


no ti vravim ze tie data v tabulkach su uz dodrbane... niektore znaky s diakritikou su proste uplne dropnute a miesto nich je len #3F
cize tam uz nepomoze nic Sad
dcom - 6.4.2006, 15:15
Předmět:
JoHnY napsal:
dcom napsal:
JoHnY napsal:
Lubos napsal:
Diakritika sux Sad


Big time!


a co zkusit vyexportovat celou db a znovu ji nahrat (udelat si nejakou testovaci db) a pritom znova nastavit charset u vsech tabuleKč Idea


no ti vravim ze tie data v tabulkach su uz dodrbane... niektore znaky s diakritikou su proste uplne dropnute a miesto nich je len #3F
cize tam uz nepomoze nic Sad


hmm ... tak to je blby Confused
MUSTANG - 6.4.2006, 15:19
Předmět:
nehazej flintu do zita, udelej si slovnik a vytvor skript, ktery porovna, jestli se slovo nenachazi ve slovniku (samozrejme s ohledem na #3F) a kdyz jo, tak ho pekne zamen v puvodnim textu Wink se to ho neboj... Smile

data z tabulek se asi daji tahat dynamicky (pocitam ze i MySQL ma neco jako data dictionary) tabulku po tabulce, sloupec po sloupci, zajimaji te jen textove typy, prozenes to rekonstrukci podle slovniku a updatujes zpatky. To by mohl byt celkem pekny zapoctak ne? trochu PHP nejakej regularni vyraz, spetku stojovyho casu, zamichat, povarit a muzeme servirovat Smile

udelat to na DUMPu by mohlo byt casove min narocne ale mnohem vic nebezpecne pro strukturu dat
JoHnY - 6.4.2006, 18:35
Předmět:
Pocuj, to nie je taky zly napad, udelujem ti zlatu plaketu D. Kunovskeho!
A co je este pozitivnejsie, pozeram dump tabulky nzm_search_wordlist a tam su vsetky tie slova v poriadku! Akurat ze netusim ake je to kodovanie atd. pretoze to je sejvnute v takomto formate nejakom:

INSERT INTO `nzm_search_wordlist` VALUES (0x383030, 1777, 0);
cize text je tam kodovany do hex values ale ked to importnem do tabulky co som vytvoril tak tam diakritika je (nie su otazniky) ale je rozbita. Skusal som dat collation tabulky cp1250 aj latin2 aj latin1, furt nic, stale je to nahovno.

Nemate chut niekto sa s tym pohrat a vyskumat ako treba nastavit tabulku/kodovanie/neviemco aby sa to do databazy importlo spravne?
respektive uplne by mi stacilo ak by ste to importli niekde k sebe so spravnou diakritikou a potom z toho vytiahli len tie slova a tie mi poslali v obycajnom textovom file...

ta tabulka je tu: http://www.novezahradnimesto.net/wordlist

A ked sa to podari tak je teda celkom slusna sanca ze sa podari obnovit tu diakritiku pretoze v tom wordliste by IMHO mali byt uplne vsetky slova ake sa tu kedy pouzili (je tam 41 tisic riadkov)
JoHnY - 6.4.2006, 20:47
Předmět:
Tak maximum co sa mi z toho podarilo dostat je toto: "bezpøedmìtné"
To ked prepnem do UTF8. Ked to prepnem na ISO-8859-2 alebo Win1250 tak to je uplne rozsypane.
Netusite niekto co s tymě Jak je mozne ze v ziadnom charsete sa henten text nezobrazi tak ako mač
dcom - 6.4.2006, 21:34
Předmět:
JoHnY napsal:
Pocuj, to nie je taky zly napad, udelujem ti zlatu plaketu D. Kunovskeho!
A co je este pozitivnejsie, pozeram dump tabulky nzm_search_wordlist a tam su vsetky tie slova v poriadku! Akurat ze netusim ake je to kodovanie atd. pretoze to je sejvnute v takomto formate nejakom:

INSERT INTO `nzm_search_wordlist` VALUES (0x383030, 1777, 0);
cize text je tam kodovany do hex values ale ked to importnem do tabulky co som vytvoril tak tam diakritika je (nie su otazniky) ale je rozbita. Skusal som dat collation tabulky cp1250 aj latin2 aj latin1, furt nic, stale je to nahovno.

Nemate chut niekto sa s tym pohrat a vyskumat ako treba nastavit tabulku/kodovanie/neviemco aby sa to do databazy importlo spravne?
respektive uplne by mi stacilo ak by ste to importli niekde k sebe so spravnou diakritikou a potom z toho vytiahli len tie slova a tie mi poslali v obycajnom textovom file...

ta tabulka je tu: http://www.novezahradnimesto.net/wordlist

A ked sa to podari tak je teda celkom slusna sanca ze sa podari obnovit tu diakritiku pretoze v tom wordliste by IMHO mali byt uplne vsetky slova ake sa tu kedy pouzili (je tam 41 tisic riadkov)


No zkousel jsem zadat nektery ty hexovy value sem:

http://www.cybermachine.org/

a pustit na to Hex 2 ASCII, ale stejně to vylezlo zmršený ...

např. 0x7679706fc3a8c3ad74c3a176c3a16e >> vypoèítává
dcom - 6.4.2006, 21:36
Předmět:
dcom napsal:
JoHnY napsal:
Pocuj, to nie je taky zly napad, udelujem ti zlatu plaketu D. Kunovskeho!
A co je este pozitivnejsie, pozeram dump tabulky nzm_search_wordlist a tam su vsetky tie slova v poriadku! Akurat ze netusim ake je to kodovanie atd. pretoze to je sejvnute v takomto formate nejakom:

INSERT INTO `nzm_search_wordlist` VALUES (0x383030, 1777, 0);
cize text je tam kodovany do hex values ale ked to importnem do tabulky co som vytvoril tak tam diakritika je (nie su otazniky) ale je rozbita. Skusal som dat collation tabulky cp1250 aj latin2 aj latin1, furt nic, stale je to nahovno.

Nemate chut niekto sa s tym pohrat a vyskumat ako treba nastavit tabulku/kodovanie/neviemco aby sa to do databazy importlo spravne?
respektive uplne by mi stacilo ak by ste to importli niekde k sebe so spravnou diakritikou a potom z toho vytiahli len tie slova a tie mi poslali v obycajnom textovom file...

ta tabulka je tu: http://www.novezahradnimesto.net/wordlist

A ked sa to podari tak je teda celkom slusna sanca ze sa podari obnovit tu diakritiku pretoze v tom wordliste by IMHO mali byt uplne vsetky slova ake sa tu kedy pouzili (je tam 41 tisic riadkov)


No zkousel jsem zadat nektery ty hexovy value sem:

http://www.cybermachine.org/

a pustit na to Hex 2 ASCII, ale stejně to vylezlo zmršený ...

např. 0x7679706fc3a8c3ad74c3a176c3a16e >> vypoèítává


ale tak me napada ... zkusim to importnout k sobe a pak vyexportovat ...
JoHnY - 6.4.2006, 21:48
Předmět:
no skus to... ak by to slo tak by to bolo najlepsie riesenie
to by chcelo dakeho charset guru-a
JoHnY - 6.4.2006, 21:51
Předmět:
inac to je presne to co mne z toho lezie... daj si to tam encodnut a potom si prepni kodovanie na UTF8 natvrdo v browseri... vylezie ti z toho nieco ako som sem ja pastoval... ze to vyzera aspon zhruba ako keby to chcelo byt spravne
dcom - 6.4.2006, 21:54
Předmět:
JoHnY napsal:
inac to je presne to co mne z toho lezie... daj si to tam encodnut a potom si prepni kodovanie na UTF8 natvrdo v browseri... vylezie ti z toho nieco ako som sem ja pastoval... ze to vyzera aspon zhruba ako keby to chcelo byt spravne


jasne ... no pohraju si s tim zejtra ...
JoHnY - 6.4.2006, 21:56
Předmět:
ja idem tiez spat, nech zajtra vecer nieco vydrzim Very Happy
zatial bye
MUSTANG - 7.4.2006, 07:21
Předmět:
ja se taky muzu pokusit. Ted v praci se k tomu urcite nedostanu, ale muzu to zkusit odpoledne nebo pres vikend...
Milan V. - 7.4.2006, 07:25
Předmět:
MUSTANG napsal:
ja se taky muzu pokusit. Ted v praci se k tomu urcite nedostanu, ale muzu to zkusit odpoledne nebo pres vikend...
Inu, proč ne, že ano. Pokud to dokážeš, o práci míň pro nás ... Wink
JoHnY - 7.4.2006, 09:27
Předmět:
no pocuvajte najdite medzi sebou dakeho character-set-mysql gurua lebo ja sa vzdavam, absolutne tomu nerozumiem a tam sa ten character set nastavuje na tolkych miestach ze to musel vymyslat nejaky ...
aktualne som chcel zmenit character set pre tabulku attachmentov lebo tam diakritika tiez bola ale daka divna, ked to zmenim tak su tam hned otazniky, a ked to zmazem, zmenim a znovu importnem tak je to furt rozhadzane
a tych moznosti ako a kde nastavit charset je tolko ze keby som to mal skusat tak to mam na mesiac prace.
MUSTANG - 7.4.2006, 09:46
Předmět:
hm, tak to je zle, vypada to, ze pri kazde akci se bere v potaz jina konfigurace. Tyhle free udelatka jsou dobry, kdyz se nainstalujou a nechaj bejt a nesaha se na ne a nic se jim nahodou nestane Sad. Bohuzel soudruzi vyvojari jsou vetsinou ze zemi, kde o diakritice nikdo moc nepremysli, vzdyt ji pouziva jen par pidinarodu na druhym konci sveta Smile

Moc se mi ale nezda, ze by zmena konfigurace okamzite vyvolala update dat. To je bud nejaky omyl, chyba nebo to vymyslel nejaky tululum. Na databazi o std. velikosti by si taky mohl vzit par dni dovolenou Smile a cekat az se to zupdatne. nemuzu si pomoct ale tomu neverim. kdyz zmenis konfiguraci DB a nezmenis klienta tak to muze byt vevnitr porad dobre ale po vyselektovani/exportu/dumpu to muze byt spatne (diky standardni konverzi mezi enforceovanym charsetem DB files a klienta). Zkusil sis DB soubory prohlednout primo binarnim editoremě
JoHnY - 7.4.2006, 09:50
Předmět:
problem je zrejme v tom ze ja som to zmenil sice len v konfiguracii servera, lenze ako board bezal tak tam sli nejake updaty/altery/neviemco ktore to znicili...
pretoze tabulky ktore sa nevyuzivali (ako napriklad ta tabulka attachmentov) su v pohode, ale to ostatne je dodrbane
takze to bude najskor ten problem
to uz je ale jedno, terat treba vymysliet ako to napravit
JoHnY - 7.4.2006, 10:14
Předmět:
pozeram znovu ten wordlist a tam pre znaky s diakritikou su dve hex values. to znamena ze to je v utf, nie? teda ako vravim, v tomto som uplne mimo ale z toho co som pochopil teraz co som cital tak utf pouziva pre znaky 128-32767 prave dve hex hodnoty. je to taKč
MUSTANG - 7.4.2006, 10:16
Předmět:
muze to byt obecne jakakoli forma Unicode, BigEndian/LittleEndian

http://www.unicode.org/faq/utf_bom.html
JoHnY - 7.4.2006, 10:24
Předmět:
MUSTANG napsal:
muze to byt obecne jakakoli forma Unicode, BigEndian/LowEndian


no ano, tak som to myslel, len mi nedoslo najprv ze to bude _nejaky_ unicode
a da sa teda nejako zistit co to je a previest to do rozumnej formy?

ja zacinam rozmyslat nad tym ze spravit to uplne jednoducho, tych diakritickych znakov je zopar, pozriet aku hodnotu ma kazdy v tom hex, a nahradit tie dve values jednou v cp1250
to bude asi najjednoduchsie, nie?

nech zhoria v pekle ti co vymysleli diakritiku
dcom - 7.4.2006, 10:33
Předmět:
JoHnY napsal:
MUSTANG napsal:
muze to byt obecne jakakoli forma Unicode, BigEndian/LowEndian


no ano, tak som to myslel, len mi nedoslo najprv ze to bude _nejaky_ unicode
a da sa teda nejako zistit co to je a previest to do rozumnej formy?

ja zacinam rozmyslat nad tym ze spravit to uplne jednoducho, tych diakritickych znakov je zopar, pozriet aku hodnotu ma kazdy v tom hex, a nahradit tie dve values jednou v cp1250
to bude asi najjednoduchsie, nie?

nech zhoria v pekle ti co vymysleli diakritiku


"nech zhoria v pekle ti co vymysleli diakritiku" tak s tim nelze nez souhlasit Laughing Razz Cool
dcom - 7.4.2006, 10:36
Předmět:
jinak nainstaloval jsem si na testovacim stroji phpmyadmina a zkousim to opravit ...
JoHnY - 7.4.2006, 10:40
Předmět:
a este nacrtnem moje riesenie ked sa podari vyriesit to kodovanie v tom fajle.

takze, mam aj povodnu tabulku nzm_search_wordmatch, co znacne zjednodusi pracu, cize by som to spravil takto nejako:


PHP:
<?php mysql_connect('localhost','login','heslo');
mysql_select_db('databaza');
 
$sql='SELECT post_id,post_text FROM nzm_posts_text';
$result=mysql_query($sql);

 while (
$row=mysql_fetch_array($result)) {
   
$sql2='SELECT nzm_search_wordlist.word_text FROM nzm_search_wordlist,nzm_search_wordmatch WHERE nzm_search_wordmatch.word_id=nzm_search_wordlist.word_id AND nzm_search_wordmatch.post_id={$row['post_id']}';

    
$result2=mysql_query($sql2);
    while (
$row2=mysql_fetch_array($result2)) {
       
//tu sa nejako matchnu slova s otaznikmi z $row['post_text'] s $row2['word_text'] a replacnu sa
    
}
?>


je to rozumne alebo je to uplna blbost?

a treba vymysliet daky regexp na to replacovanie a este vo word_texte je vsetko lowercase cize aj na to treba nejako dat pozor
JoHnY - 7.4.2006, 10:47
Předmět:
btw nzm_search_wordlist ma okolo 40k riadkov, nzm_search_wordmatch okolo 250k a nzm_posts_text asi 6k
MUSTANG - 7.4.2006, 11:21
Předmět:
JoHnY napsal:
nech zhoria v pekle ti co vymysleli diakritiku


no myslim, ze stacilo, aby prvni pocitac nebyl vynylezen v Anglii ale nekde v jazykove bohatsi zemi = Indie, Rusko, Československo (s pomlčkou nebo spojovníkem nebo i bez něj, jak kdo chce Smile), Polsko, Japonsko, Čína. Ono to presne ukazuje ne cestu nejmensiho odporu. My si to udelame takhle, nam to bude stacit a ostatni maji smulu Smile Ostatne co cekat. Pocitace byly vojenska technologie a nejaky zajem o univerzalnost natoz celosvetovou tenkrat rozhodne nebyl Smile
dcom - 7.4.2006, 11:34
Předmět:
JoHnY napsal:
a este nacrtnem moje riesenie ked sa podari vyriesit to kodovanie v tom fajle.

takze, mam aj povodnu tabulku nzm_search_wordmatch, co znacne zjednodusi pracu, cize by som to spravil takto nejako:


PHP:
<?php mysql_connect('localhost','login','heslo');
mysql_select_db('databaza');
 
$sql='SELECT post_id,post_text FROM nzm_posts_text';
$result=mysql_query($sql);

 while (
$row=mysql_fetch_array($result)) {
   
$sql2='SELECT nzm_search_wordlist.word_text FROM nzm_search_wordlist,nzm_search_wordmatch WHERE nzm_search_wordmatch.word_id=nzm_search_wordlist.word_id AND nzm_search_wordmatch.post_id={$row['post_id']}';

    
$result2=mysql_query($sql2);
    while (
$row2=mysql_fetch_array($result2)) {
       
//tu sa nejako matchnu slova s otaznikmi z $row['post_text'] s $row2['word_text'] a replacnu sa
    
}
?>


je to rozumne alebo je to uplna blbost?

a treba vymysliet daky regexp na to replacovanie a este vo word_texte je vsetko lowercase cize aj na to treba nejako dat pozor


... no v tom puvodnim fajlu co si sem dal jsou ty slova zakodovany v hexa ... naimportoval jsem si to a pak vyexportoval, tak ze jsou slova uz plain text no a zkousel jsem projet ruzny kodovani, ale bez uspechu ...

... to reseni jak navrhujes je asi dobry, ale bohuzel se zda, ze ta diakritika je totalne v ... Rolling Eyes
JoHnY - 7.4.2006, 11:47
Předmět:
dcom napsal:
JoHnY napsal:
a este nacrtnem moje riesenie ked sa podari vyriesit to kodovanie v tom fajle.

takze, mam aj povodnu tabulku nzm_search_wordmatch, co znacne zjednodusi pracu, cize by som to spravil takto nejako:


PHP:
<?php mysql_connect('localhost','login','heslo');
mysql_select_db('databaza');
 
$sql='SELECT post_id,post_text FROM nzm_posts_text';
$result=mysql_query($sql);

 while (
$row=mysql_fetch_array($result)) {
   
$sql2='SELECT nzm_search_wordlist.word_text FROM nzm_search_wordlist,nzm_search_wordmatch WHERE nzm_search_wordmatch.word_id=nzm_search_wordlist.word_id AND nzm_search_wordmatch.post_id={$row['post_id']}';

    
$result2=mysql_query($sql2);
    while (
$row2=mysql_fetch_array($result2)) {
       
//tu sa nejako matchnu slova s otaznikmi z $row['post_text'] s $row2['word_text'] a replacnu sa
    
}
?>


je to rozumne alebo je to uplna blbost?

a treba vymysliet daky regexp na to replacovanie a este vo word_texte je vsetko lowercase cize aj na to treba nejako dat pozor


... no v tom puvodnim fajlu co si sem dal jsou ty slova zakodovany v hexa ... naimportoval jsem si to a pak vyexportoval, tak ze jsou slova uz plain text no a zkousel jsem projet ruzny kodovani, ale bez uspechu ...

... to reseni jak navrhujes je asi dobry, ale bohuzel se zda, ze ta diakritika je totalne v ... Rolling Eyes


ale ved kazdy znak tam ma nejaky kod, nie? snad to nie je uplny bordel a 3f tam nie je miesto diakritiky
cize to co som navrhol v jednej sprave pred touto na ktoru si reagoval by malo predsa ist, logicky
ked je v tom subore cojaviem 0x3830 vzdy namiesto "č" tak nie je problem 0x3830 replacnut spravnym kodom v cp1250
hm?
dcom - 7.4.2006, 12:38
Předmět:
JoHnY napsal:
dcom napsal:
JoHnY napsal:
a este nacrtnem moje riesenie ked sa podari vyriesit to kodovanie v tom fajle.

takze, mam aj povodnu tabulku nzm_search_wordmatch, co znacne zjednodusi pracu, cize by som to spravil takto nejako:


PHP:
<?php mysql_connect('localhost','login','heslo');
mysql_select_db('databaza');
 
$sql='SELECT post_id,post_text FROM nzm_posts_text';
$result=mysql_query($sql);

 while (
$row=mysql_fetch_array($result)) {
   
$sql2='SELECT nzm_search_wordlist.word_text FROM nzm_search_wordlist,nzm_search_wordmatch WHERE nzm_search_wordmatch.word_id=nzm_search_wordlist.word_id AND nzm_search_wordmatch.post_id={$row['post_id']}';

    
$result2=mysql_query($sql2);
    while (
$row2=mysql_fetch_array($result2)) {
       
//tu sa nejako matchnu slova s otaznikmi z $row['post_text'] s $row2['word_text'] a replacnu sa
    
}
?>


je to rozumne alebo je to uplna blbost?

a treba vymysliet daky regexp na to replacovanie a este vo word_texte je vsetko lowercase cize aj na to treba nejako dat pozor


... no v tom puvodnim fajlu co si sem dal jsou ty slova zakodovany v hexa ... naimportoval jsem si to a pak vyexportoval, tak ze jsou slova uz plain text no a zkousel jsem projet ruzny kodovani, ale bez uspechu ...

... to reseni jak navrhujes je asi dobry, ale bohuzel se zda, ze ta diakritika je totalne v ... Rolling Eyes


ale ved kazdy znak tam ma nejaky kod, nie? snad to nie je uplny bordel a 3f tam nie je miesto diakritiky
cize to co som navrhol v jednej sprave pred touto na ktoru si reagoval by malo predsa ist, logicky
ked je v tom subore cojaviem 0x3830 vzdy namiesto "č" tak nie je problem 0x3830 replacnut spravnym kodom v cp1250
hm?


jo, tak to asi jo ... Wink Cool
JoHnY - 7.4.2006, 12:42
Předmět:
no dobre, vecer sa na to napijem a uvidime Very Happy
dcom - 7.4.2006, 12:45
Předmět:
JoHnY napsal:
no dobre, vecer sa na to napijem a uvidime Very Happy


jasne Razz Drink Drink Drink Tanec
JoHnY - 8.4.2006, 18:19
Předmět:
no, podarilo sa mi napravit to kodovanie, netusim ako sa podarilo tomu mysql replacnut tie znaky, proste tam boli uplne ine znaky ako mali byt
a bolo to presne 5 znakov
tu je moja prekladova tabulka

prva je povodna hodnota utf-8, druha nova

c3b8 - c599 ř
c3a8 - c48d č
c3ac - c49b ě
c3af - c48f ď
c3b9 – c5af ů

http://johny.sk/n.sql
JoHnY - 9.4.2006, 11:38
Předmět:
Tak, hotovo, diakritika opravena.

Akurat ze sa vsetko zmenilo na lowercase, ked bolo slovo v ktorom bola pokaslana diakritika, ale to az tak nevadi dufam.

Ale ak by sa niekomu chcelo rozmyslat nad tym ako to spravit aby to zachovalo aj ten case tak nech napise, nie je problem to spravit.

Inac skript ktorym som to spravil je tu ak by to niekoho zaujimalo: http://johny.sk/nzm2.phps
Trvalo to asi 20 sekund.
JoHnY - 9.4.2006, 11:41
Předmět:
Tak pozeram ze este "ť" musim zmenit
JoHnY - 9.4.2006, 12:33
Předmět:
uz je to snad vsetko, ak uvidite este nejake neprelozene znaky tak dajte vediet
vlastne este by som sa mohol pokusit sukromne spravy opravit

...aale, nie, na to kaslem, tam nie je ziadny wordmatch vlastne... takze kto pise sukromne spravy s diakritikou musi sa s tym vyrovnat

ale ak by niekomu napadlo ako to spravit aby zostali aj tie velke pismena na zaciatkoch viet a podobne tak napiste, to este mozem spravit...

edit: fuha, aj to sa mi podarilo... tam totiz nebola zmrsena ta diakritika v tabulkach, len nesedelo kodovanie.

...este rebuildnut search index a bude to vsetko...
dcom - 9.4.2006, 13:09
Předmět:
JoHnY napsal:
uz je to snad vsetko, ak uvidite este nejake neprelozene znaky tak dajte vediet
vlastne este by som sa mohol pokusit sukromne spravy opravit

...aale, nie, na to kaslem, tam nie je ziadny wordmatch vlastne... takze kto pise sukromne spravy s diakritikou musi sa s tym vyrovnat

ale ak by niekomu napadlo ako to spravit aby zostali aj tie velke pismena na zaciatkoch viet a podobne tak napiste, to este mozem spravit...

edit: fuha, aj to sa mi podarilo... tam totiz nebola zmrsena ta diakritika v tabulkach, len nesedelo kodovanie.

...este rebuildnut search index a bude to vsetko...


great work Wink Cool
JoHnY - 9.4.2006, 13:09
Předmět:
dvojpismenove slova neboli v search indexe, takze tie mozu byt pokazene... replacol som zatial "mě", "ač" a "či"
Milan V. - 10.4.2006, 07:37
Předmět:
Teda, jsi fakt šéf ... Cool Smile Guitar
Časy uváděny v GMT + 1 hodina
Powered by phpBB2