PuntuEUS Behatokia

PUNTUEUS BEHATOKIA

PuntuEUS Fundazioaren ekimena da eta euskarak Interneten duen egoera neurtzea du helburu. Neurketa urtean behin egiten da, eta emaitza webgune honetan eta urteko txostenean argitaratzen da.

EUSKARAK

Interneten duten presentzia aztertzen du PuntuEUS Behatokiak, eta baita Internetek Euskal Herrian duen presentzia ere, modu kuantitatibo zein kualitatiboan, horretarako hiru alor neurtuz: .EUS domeinuen egoera, Interneten egoera Euskal Herrian eta euskararen egoera Interneten.

HELBURUA

euskarak Interneten duen presentzia indartzeko behar diren estrategia eta politikak definitzeko garaian beharrezko den tresna baliagarria euskal gizarte osoari eskaintzea da.

.EUS DOMEINUAREN EGOERA

Domeinuaren neurketa kualitatibo eta kuantitatiboa: banaketa lurraldeka, erakunde motaren arabera, eta domeinuaren barneratze-maila.

Denak
2016
2015

INTERNET EUSKAL HERRIAN

Lehen mailako domeinu nagusiek Euskal Herrian erregistratutako domeinu-izen kopurua eta merkatuaren banaketa.

EUSKARA EUSKAL HERRIKO INTERNETEN

Euskarak Interneten duen presentziaren neurketa, lehen mailako domeinu nagusietan eta sare sozialetan.

DOKUMENTUAK

METODOLOGIA

Azterketa honetan .EUS domeinuak eta Interneteko domeinu nagusiek Euskal Herrian duten barneratze-maila aztertzeaz gain, euskarak eta gainerako hizkuntza nagusiek duten presentzia aztertu da.

Hori egin ahal izateko, domeinuei dagozkien webguneetako eduki guztiak aztertu eta hizkuntzaren arabera sailkatu ditugu. Horrela jakin ahal izan dugu Euskal Herriko domeinu bakoitzean zenbat eduki dauden euskaraz, gaztelaniaz, ingelesez, frantsesez eta bestelako hizkuntzetan. Domeinuen azterketa hau egiteko bi estrategia baliatu ditugu:

- Domeinu mailako crawlinga : Lehenengo pausu batean domeinuari dagokion webguneko html edukiak deskargatzen dira modu automatikoan, JavaScript bidez sortutakoak ere aintzat hartuta. Ondoren, html edukietatik testua den informazioa erauzi, eta bere hizkuntza automatikoki identifikatzen da hizkuntza-eredu estatistikoen bidez. Estrategia honek 0.77ko zehaztasuna bermatzen du. Domeinuen prozesaketa paraleloan burutzen bada ere, estrategia honek trafiko handia eragiten du webgune handiak prozesatzen direnean. Hori dela eta, estrategia hau eduki gutxiko webguneak prozesatzeko soilik erabili da.

- Domeinu mailako web-bilaketak : Web-bilatzaileetan (adib., Google, Bing) oinarritutako estrategia hau tamaina handiko webguneak prozesatzeko erabili dugu, crawling prozesuak baino askoz trafiko gutxiago eragiten duelako. Halaber, eduki gutxiko webgune asko ez daude bilatzaileetan guztiz indexatuta. Hizkuntza bakoitzeko hitz adierazgarrienez (hizkuntza filtro-hitzak) osatutako bilaketa bat domeinu bakoitzaren gainean eginez, hizkuntza horretako edukien kopurua estimatzen dugu. Web-bilatzaileak domeinuan hizkuntza bakoitzeko hitz esanguratsuak (hizkuntza filtro-hitzak) dituzten orri-kopurua ematen digu. Web-bilatzaileak itzulitako lehen emaitzak hizkuntzaren arabera sailkatzen ditugu automatikoki hizkuntza filtro-hitzek ondo funtzionatu dutela berresteko. Estrategiak honek 0.82ko zehaztasuna ematen digu.

Aurreko estrategia automatikoez gain, .EUS domeinuen kasuan euskararen presentzia eskuz neurtu da, zehaztasun maila hobea lortuz.

Domeinuen sailkapenari dagokionez, honako domeinuak aztertu dira:

- gTLD edo lehen mailako domeinu generikoak :
.EUS, .COM, .NET, .INFO, .ORG eta .BIZ

- ccTLD edo estatu-kodeei dagozkien lehen mailako domeinuak :
.ES eta .FR domeinuak aztertu dira. .EU domeinuaren kasuan hizkuntza azterketak egin ahal izateko beharrezko ziren hainbat datu ez dira publikoak, eta hala zehazten da dagokionean azterketan zehar.

Babesleak