Tiomsú Corpais don Taighde Foclóireachta: Corpas Foclóireachta na Gaeilge (CFG2020)

Published in TEANGA, the Journal of the Irish Association for Applied Linguistics, 2021

Recommended citation: Mícheál J. Ó Meachair, Brian Ó Raghallaigh, Úna Bhreathnach, Gearóid Ó Cleircín, and Kevin Scannell. Tiomsú Corpais don Taighde Foclóireachta: Corpas Foclóireachta na Gaeilge (CFG2020). TEANGA, the Journal of the Irish Association for Applied Linguistics, 28:278–305, 2021. https://kevinscannell.com/files/dcu2021.pdf

DOI: doi:10.35903/teanga.v28i.726

Abstract: Leagtar amach sa pháipéar seo na céimeanna a leanadh le Corpas Foclóireachta na Gaeilge 2020 (CFG2020), corpas aonteangach 77.3 milliún focal, a thiomsú. Mínítear comhthéacs an tionscadail agus na riachtanais a spreag na cinntí a tógadh lena linn. Déantar cur síos ansin ar chéim an tiomsaithe agus ar na céimeanna próiseála. Tugtar spléachadh ar inneachar an chorpais, ar an acmhainn a cruthaíodh lena chuardach, agus ar an gcineál anailíse agus taighde a cumasaíodh leis seo. Tiomsaíodh CFG2020 ar an tuiscint gur réamhchéim é ar thionscadal níos leithne corpais, is ar an gcúis sin a dhéantar moltaí i dtaca lena fheabhsú agus lena mhéadú.