Elhuyarrek 'Dabilena' web corpusen ataria sortu du

'Dabilena' Ataria.
ELHUYAR
Actualizado: jueves, 15 julio 2021 18:01

BILBO, 15 (EUROPA PRESS)

Elhuyarrek 'Dabilena' web corpusen ataria sortu eta edonorentzat erabilgarri jarri du dabilena.elhuyar.eus helbidean. Atari horretan, azken urteetan Interneten euskaraz idatzi diren testu gehientsuenetan egin daitezke bilaketak, hau da, euskararen erabilera errealaren gaineko bilaketak egin daitezke.

Elhuyarretik ostegun honetan jakitera eman dutenez, 'Dabilena' tresna ezin hobea da hizkuntzaren arloko profesionalentzat, hala nola itzultzaile, hizkuntzalari eta hizkuntza irakasleentzat, baita haientzako hizkuntza baliabideak sortzen eta hizkuntza teknologiak garatzen dituztenentzat ere.

Webguneak hiru atal nagusi ditu: 'Non erabili da?', 'Nola itzuli da?' eta 'Zer hitzekin konbinatzen da?'. 'Non erabili da?' atalean, bilatu nahi den hitza zer webgunetan eta zer testuingurutan agertu den ikusi ahal da.

'Nola itzuli da?' atalean, corpus elebiduna kontsulta daiteke. Hala, bilaketak euskaraz nahiz gaztelaniaz egin daitezke, eta bietako adibideak erakutsiko ditu webguneak kasu guztietan. Kontsultatu den hitzaren itzulpenen zerrenda agertuko da lehenik, eta hizkuntzetako adibideak azpian, testuingurua bistan dela.

'Zer hitzekin konbinatzen da?' atalari dagokionez, euskarazko hitz jakin bat zer beste hitzekin batera erabiltzen den ikusteko erabil daiteke.

Bestalde, konparazio bilaketak ere egin daitezke, hots, bi hitzen erabileraren arteko konparazioa egin daiteke. Hala kontsulta daitezke, adibidez, Interneten euskaraz bi hitz hauetako zein agertzen den gehien: 'boluntario' ala 'bolondres'.

Gainera, 'Corpus gehiago' atalaren bidez, Interneten eskura dauden hainbat corpusetako emaitzak aldi berean kontsultatzeko aukera ematen du 'Dabilena' webguneak.

Atariaren helburua da Interneten erabiltzen den euskara aztertzeko beharrezkoak diren testuak (web corpusak) automatikoki biltzea eta, hizkuntza teknologien arloko tresnen bidez prozesatu ondoren, kontsultagai jartzea.

Bederatzi urte iragan dira Elhuyarrek euskarazko web corpusak egiteari ekin zionetik, eta corpusak biltzeko eta ustiatzeko teknologia garatzen jarraitu du geroztik. Gainera, euskarazko testuen bolumena nabarmen handitu da Interneten, eta testu motak ere dibertsifikatuz joan dira. Horiek horrela, corpus handiagoak, funtzionalitate berriak eta kontsulta sistema berritzaileak gehitu dira 'Dabilena' atarian.