Claonadh Inscne, Líonraí Néaracha, agus an Ghaeilge

Published in Léann Teanga: An Reiviú, 2020

Recommended citation: Kevin P. Scannell. Claonadh Inscne, Líonraí Néaracha, agus an Ghaeilge. Léann Teanga: An Reiviú, 8:159–170, 2020. https://kevinscannell.com/files/reiviu.pdf

Abstract: Sa pháipéar seo, díreoidh mé ar chlaonadh inscne i gcorpas mór Gaeilge agus an tionchar a imríonn sé ar theicneolaíochtaí teanga. I dtús báire, déanaim anailís corpasbhunaithe ar athruithe tosaigh firinscneacha vs. baininscneacha i bhfrásaí “ina X” nuair is gairm nó post é X, mar shampla “ina b(h)unmhúinteoir” nó “ina (h)ollamh”. Ansin, taispeánaim go bhfuil claontaí inscne le feiceáil sa leabú focal a úsáidtear go minic i bpróiseas réamhthraenála ar líonraí néaracha níos casta. Chun na críche seo, úsáidim an córas word2vec chun leabú 200-toiseach a thraenáil bunaithe ar chorpas mór Gaeilge, roghnaím fospás aontoiseach a léiríonn difríochtaí inscne go héifeachtach, ansin déanaim teilgean ó na veicteoirí a bhaineann le gairmeacha ar an bhfospás seo. Faightear amach go bhfuil gairmeacha “firinscneacha” (de réir steiréitíopaí traidisiúnta) ar nós “ginearál” nó “sagart” teilgthe ar an taobh firinscneach den fhospás seo, agus mar an gcéanna le gairmeacha “baininscneacha” (mar dhea) ar nós “mainicín”, “gruagaire”, agus “altra” ar an taobh baininscneach. Faoi dheireadh, léirím an drochthionchar a imríonn na claontaí inscne seo ar líonra néarach a thuarann athruithe tosaigh sa Ghaeilge, agus déanaim iarracht na héifeachtaí seo a mhaolú trí athruithe sa phróiseas traenála.