Alfabetiskuo parādavuošona
Alfabetiskuo parādavuošona ci kolaceja ir metods (Algorithm), kurs taisa alfabetisku sarokstu nu sevkurys vuordu kūpys, kas pīraksteiti nazkaidā cylvāku volūdys alfabetā (pīmāram, latgaļu alfabetā). Taida parādavuošona var baļsteitīs uz dažaidim principim. Goduos, kad svareiguoks ir matematiskai vīnkuoršs metods, a goduos, kad leidzeigim vuordim juoatsarūn sūplok. Leksikografu i vuordineicu dareituoju vydā izplateitī parādavuošonys metodi dūti zemļuok.
Voi jemt vārā lelūs/mozūs burtus?
[pataiseit | labot pirmkodu]Eiropys tautu volūduos jau nu Vydslaikim atsaškir lelūs burtu simboli nu mozūs burtu simbolim. Pīmāram, "A" i "a" - ir atškireigys rokstu zeimis. Ari leksikografejā lelī i mozī burti vīn reizim paleidz pazeit sovumvuordus (Proper noun) i eisynuojumus (Abbreviation) nu cytu vuordu. Pīmāram, Ceiruļs (cylvāka pavuorde) ir nazkas cyts nakai ceiruļs (putnu suga). No bīžuok vuordu nūzeime daudz nasamaina nu lelūs i mozūs burtu lītuojuma - pasaukuos i cytur bīži vyss teksts dūts ar lelajim burtim. Taida īmesļa dēļ alfabetiskuo parādavuošona Eiropys tautu volūduos bīžuok ir 2 sūļu process:
- Saparādavoj vuordus alfabetiskai, nasaverūt iz lelajim i mozajim burtim.
- Jo kaidi vuordi atsaškir vīn ar burtu lelumu, tod verās iz tū poziceju, kur pyrmuo atškireiba burtu lelumā. Pa prīšku īt tys vuords, kimā lītuots lelais burts. Pīmāram, Ceiruļs ir rokstoms ogruok nakai ceiruļs.
Taids algoritms ir lītuots angļu volūdā, bet tū var lītuot ari cytuos volūduos - ari lels daudzums latvīšu (baļtīšu) i latgaļu vuordineicu sastateits lītojūt itū sprostū parādavuošonys principu.
Sekundaruos burtu atškireibys baļtīšu i vuocu volūduos
[pataiseit | labot pirmkodu]Daudzuos volūduos ir skaņu mejis. Pīmāram, vuocu volūdā "der Baum" (kūks) -> "die Bäume" (kūki) (par latgaļu metatoneju roksteits zemļuok). Kab byutu vīgļuok atrast daudzskaitļa formu vuordineicā, kur dūtys vīn vīnskaitļa formys, vuocu leksikografi bīži pījam, ka "a" i "ä" ir, prūtams, atškireigi burti, no tī ir "mozuok atškireigi", nakai "ä" i "b". Tū sauc par sekundarū atškireibu. Kab tuos nabyutu, tod Baum i Bäume alfabetiskajā parādā nabyutu sūplok, a storpā byutu lelums cytu vuordu (lobajā stabeņā Baum i Bäume ir tuoli vīns nu ūtra - tys ir "sūds" par sekundaruos atškireibys "a" i "ä" vīnaiduošonu ar primarū atškireibu).
Baum Baum Bäume Baumwolle Baumwolle Baustelle Baustelle Bauwerk Bauwerk Bayern Bayern Bäume
Baļtīšu volūdā primarajā parādavuošonā ignorej atškireibys eisū i gorū patskaņu vydā (pīmāram, "Aa" i "Āā", "Ee" i "Ēē", ..., "Uu" i "Ūū"). Par tū, pīmāram, vuordi "Abava", "ābele", "ābelē", "aka", "akā" byus taidā kuorteibā, kai tī ite raksteiti ("ābele" īt pyrms "akys", ka "ā" i "a" pyrmiejuo kuortūšonā sakreit, a "b" pyrmiejuo kuorteibā ira pirms "k". Leidzskani (pīmāram, "Cc" i "Čč" voi "Ll" i "Ļļ") ir atškirami pyrmiejā kuortūšonā. Sekundarajā parādavuošonā īvāroj atškireibys eisū i gorū patskaņu vydā, bet ignorej atškireibys storp lelajim i mozajim burtim. Par tū "ābele" īt pirms "ābelē", ka primarajā parādavuošonā tī vuordi naatsaškir. Terciaruo parādavuošona atškir lelūs nu mozajim burtim - ābele kai sygys lītvuords atsaškir nu pavuordes vai nūsaukuma "Ābele" (vuordi ar lelajim burtim ir līkami prīškā).
Vuocu volūdā sekundaruo parādavuošana ir starp "Aa" i "Ää", "Oo" i "Öö, "Uu" i "Üü". Krīvu volūdā - starp "Ее" i "Ёё". Algoritms, kū lītoj volūduos, kur ir sekudaruos atškireibys burtu vydā ir taids:
- Saparādavoj vuordus piec jūs primaruo atškireibu (nasaverūt iz umlautim, garuma zeimem, i citom sekundarom atškireibom, kai i iz burtu lelumu ("ābele" īt pyrms "aka"; primaruos atškireibys najem vārā, voi tei ir "ābele" voi "abele")
- Tūs vuordus, kam nav primaruo atškireibu, parādavoj piec sekundarom atškireibom, verūtīs iz umlautim i garuma zeimem ("ābele" īt pyrms "ābelē")
- Tūs vuordus, kam nav primaruo i sekundaruo atškireibu, parādavoj piec burtu leluma (pīmāram, "Ābele" īt pyrms "ābele").
Inversais parāds
[pataiseit | labot pirmkodu]Volūdnīceibā nūder vēļ vīns vuordu parāds - inversais parāds, kimā iz vuordim verās nu ūtra gola, i tod parādavoj piec alfabeta. Tod vuordi ar vīnaidom golūtnem i vīnaidim pīdēklim stuov sūplok. Pīmāram, vysi vuordi, kam nominativā ir izskane -eiba byus vīgli atrūnami. Kairajā stabeņā dūti inversuo parāda pyrmī latgaļu vuordi, kas beja atrūnami lelā tekstu korpusā (latgola.lv komentūs). Vydus stabeņā dūts fragments iz vydus, kur sūplok stuov daudz laika apstuoklinīku. I lobajā stabeņā dūti inversuo parāda piedējī latgaļu vuordi.
a ... ... aba šūgod atsagrīž divdaba kod naatsagrīž kaba nakod juopīgrīž atrībeiba jebkod atgrīž darbeiba nikod apsasprīž sadarbeiba nazkod apguož īdarbeiba vysod nūlauž vardarbeiba tod snauž bezdarbeiba taitod izapauž seceiba dzērd juoizapauž garlaiceiba raud īgryuž reiceiba dūd atgryuž ... nadūd ... ...
Secynuojumi
[pataiseit | labot pirmkodu]Latgalīšu volūdai ir lela morfologiskuo boguoteiba - vuordim ir lūcejumi, kas puormaina jūs galūtnis. Ira ari metatoneja - patskani mainuos radnīceigu vuordu formu saknē (golds - gaļdeņš, nest - nasu, vāza - viezeņa, pyrmais - pirmeigs). Vuordineicā bīži roksta vīn pamata formu (nanūsaceibu nest a na nasu; raksteit a na rokstu). Deļ tuo cylvākam, kurs nazyn latgaļu metatonejis eipateibu, var byut gryutumi atrast vuordu vuordineicā - rokstu ir juomeklej pi vuordim, kas suocās ar ra-.... Latgalīšu volūdys vuordus nabyutu logiski parādavuot kai arabim (najemt vārā patskanus), i par tū tī gryutumi ir juopīcīš.
Latgalīšu volūdā navarim bez dūmuošonys puorjemt tuos sekundaruos atškireibys, kas pastuov, pīmāram, latvīšu voi vuocīšu volūdā - par tū, ka patskanu mejis latgaļu volūdā ir sovpateigys. Latgalīšu volūdys datorizaceja vēļ nav daguojuse da tam, kab byutu datoru bibliotekys ar standarta kolacejis algoritmim, kai tys ir latvīšu, krīvu i vuocīšu volūdom. Vēļ nav zynoms, voi latgaļu volūdā vajadzeigys sekundaruos atšķireibys starp eisajim i garajim burtim. Pīmāram, voi "a" i "ā" atsaškir primari voi sekundari. Pīmāram, voi vuorda "gods" formys goda i godā byutu juoroksta sūplok, a godadīna piec jū obadvieju. Voi ābļavuot(ēvelēt) ir alfabetiskai pyrms vuorda acteņa? Voi burti "i" i "y" atsaškir primari voi sekundari? Vysi tī vaicuojumi gaida sova atsacejuma. Varim vīn minēt, ka tuos metatonejis, kur "y" bīži puorīt iz "i", pīmāram, cylps - ciļpeņš, styprs - stiprinīks, varātu byut vīns nu īmeslim, deļ kuo latgaļu volūdā burti "i" i "y" ir atrūnami alfabetā sūplok, bet cytuos volūduos (anglīšu, franču, vuocīšu) "y" ir pošuos alfabeta beiguos pyrms "z".
Nūruodis
[pataiseit | labot pirmkodu]- "java.text.RuleBasedCollator" - Javys klase, kas ļaun taiseit sovus parādavuošonys algoritmus, kas atsaškir nu standarta lokalizaceju (pīmāram, lejislatvīšu(lv), angļu(en)).