Vyhledávání a diakritika

Nešlo by upravit vyhledávání her, aby nevyžadovalo použití diakritiky? Respektive vím, že “někdy” to jde i bez ní, ale jakoby jen v případech, kdy diakritika chybí jen v jednom slově či snad u posledního písmena. 

23.3.2024 16:17:06

Třeba řetězec “po stopa” mi nabídne hru Po stopách Darwina, ale řetězec “po stopach” již ne.

23.3.2024 16:18:42

K tomu bych se tez primlouval. 

23.3.2024 18:03:29

+1

25.7.2024 01:46:29

+1

25.7.2024 09:45:40

+1

27.7.2024 22:21:15

+1

27.7.2024 23:18:39

Tohle bych sám hrozně rád, nicméně nejsem úplně expert na Elastic Search, který pro hledání používáme, takže je tam takové skoro výchozí nastavení (základní podpora pro češtinu a skloňování).

Kdyby tu byl někdo, kdo češtinu (a další jazyky) v Elasticu nastavovat a dokázal by poradit, budu moc rád.

28.7.2024 15:54:03

Já bohužel ne a věřím že googlit dovedeš, ale toto vypadá celkem navodne 

https://www.ludekvesely.cz/serial-elasticsearch-4-fulltextove-vyhledavani-v-cestine/amp/

28.7.2024 17:40:32

@kkaarr Ono víceméně podle tohoto návodu to nastavené je. Problém je, že když se CZ analyzátoru předhodí “stopach”, tak prostě takové CZ slovo neexistuje, tak ho nevyskloňuje a hledá natvrdo tento řetězec. A v dokumentu je uloženo mimo jiné slovo “stopa” (protože to právě CZ analyzátor udělá z jekéhokoli tvaru slova “stopa” jako třeba “stopách”)

Ale souhlas, i mě to zlobí a musím na to pamatovat, protože automaticky píšu bez diakritiky.

4.8.2024 10:32:10 | Upraveno autorem (porovnej)

No hlavně je nezvyk a vlastně i trochu úsměvné, že na anglickém BGG to funguje perfektně. Člověk by to čekal naopak, takže je to matoucí a ta hlava nepřepne, že teď jsem na českém, tak musím dávat pozor a samo mě to neopraví. :) Oni teda používají nějaký úplně jiný systém vyhledávání? A na ten by se nešlo přepnout? Já se v programování nevyznám, tak fakt vůbec netuším, jak moc složité by to bylo. Ale jestli by to ve výsledku nebylo jednodušší, než se to snažit vymyslet v tomto..

5.8.2024 08:54:12

Jestli chápu, jak to @Zeus  komentuje, tak by byl potřeba “cesky” slovník bez nabodeníček, se kterým by to pak fungovalo.

//Jsem netušil, že nějaký hledací tool si generuje alternativní tvary slova. Zajímavé… :)

5.8.2024 10:14:24

IMHO (ale bez vyzkoušení) by to fungovalo out of the box, kdybych nepoužíval slovník tvarů slov, ale integrovaný “fitrl”, který ty tvary slov dělá algoritmicky.

Budu se nad tím někdy muset zamyslet víc soustředěně, protože záludné i je, že mi používáme stejný mechanismus pro všechny názvy her a je jedno zda je v EN / CZ / PL / DE /… Což taky nabízí spoustu prostoru pro nelogické výsledky, ale tak nějak v průměru to funguje rozumně.

5.8.2024 10:26:36

a co je spatne na obycajnom contains a preco sa nepouziva? 

hladat ci nazov inzeratu, pripadne nazov hry obsahuje string ktory zadal uzivatel (+ignore case/diakritika) ?

5.8.2024 10:54:39

Nefunguje vyhledávání her.

30.8.2024 06:55:32

Vybíráme z Bazaru

Lost Ruins of Arnak EN
Lost Ruins of Arnak EN
Akt. cena: 1900 Kč
Končí za: 10 dnů

Velké herní akce

Kalendář všech akcí >>

Offcanvas