Edukira salto egin | Salto egin nabigazioara

Tresna pertsonalak

Eibarko peoria, San Blasa baino hobia
Hemen zaude: Hasiera / Blogak / Teknosexua / Euskara hutsezko bilaketak Googlen

Euskara hutsezko bilaketak Googlen

Gari Araolaza 2006/10/26 09:54

Atzo, Google-ren Co-Op zerbitzu berria aurkitu eta di-da (ordu erdi) batean Euskara hutsezko bilatzailea sortu genuen Sustatun. Horrelako boteprontoko gauzekin (sarritan egiten ditugu) inoiz ez dut jakiten lotsatu behar garen ala harrotu, hain esfortzu txikiarekin hain emaitza onak ateratzean (Izan ere sistemaren mugak kontutan hartuta, uste dut emaitza oso onak ematen dituela).

Kontua da lan txiki horrek azaleratzen duela hainbeste urteren buruan daukagun beharra: Googlek euskarazko orriak identifikatzeko modua izatea.

Izan ere, guk martxan jarritako sistema oso mugatua da, euskarazko webguneak eskuz identifikatu eta sartu behar bait ditugu sisteman, eta pertsonengan oinarritutako sistema hauek ez dute luzarora balio. Egunen batean aspertuko gara sistema mantentzeaz, eta orduan segituan hasiko da emaitza okerrak ematen.

Irakurri nuenez gai hau azaleratu zuen Vicent Partalek E.H. 2.0 jardunaldietan

Nik badakit gure webgune guztietako HTML-a ongi etiketatuta emango bagenu euskarazko edukiak direla esanez ( lang="eu" atributua erabiliz) asko aurreratuko genukeela.

Baina uste dut pauso nagusia Googlerengan dagoela. Googlek kontutan hartu behar gaitu, euskarazko orriak identifikatuz. Testu bat hartuta euskarazkoa den ala ez erabakitzeko algoritmoak informatikarientzat ezagunak dira, eta badaude horretarako sortutako tresnak, hemengo hau bezalakoa

Orduan, Googlek euskara identifikatu ahal izatea ez da arazo teknikoa, lehentasun kontua baizik. Googlerentzat ez da lehentasuna euskarazko edukiak identifikatzea, euskal eduki eta internauta gutxi daudela iruditzen zaiolako. Nola konpon genezake hau? Egin beharreko lan batzuk (eta sentitzen dut, baina pilota bueltan datorkigu)

  • Entitate esanguratsuek (dela Jaurlaritza, Kontseilua edo denok) Google Españarekin (sentitzen dut baina gauza horrela da) kontaktua egin eta behar eta interes hau adierazi.
  • Gure nabigatzaileen hizkuntza lehenetsi moduan euskara konfiguratzeko esfortzu txikia egin, estatistiketan masa kritikoa lor dezagun. Euskaratu zure nabigatzailea
  • Sortzen ditugun euskarazko eduki eta webgune guztietan, lang="eu" atributua ongi jarri. Normalean hau hemen azaltzen den moduan honela:
       <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="eu" lang="eu"> 

Azkenik, uste dut Vicent Partalek azpimarratu zuen txindurri lana izango dela efektiboena, baina horretarako denok helburua garbi izan behar genuke.

etiketak: sarea
Iruzkina gehitu

Erantzuna formulario hau betez utzi dezakezu. Formatua testu arruntarena da. Web eta e-posta helbideak automatikoki klikagarri agertuko dira.

Galdera: Zenbat dira hogei ken bi? (idatzi zenbakiz)
Erantzuna:
Aurkezpena

naiz. Teknogauza guzti hauetaz idazteko sortu nuen bloga, baina orain gai eta maiztasun librean nabil.

Mastodon