From 4487f71021ee48361e920a94edddfc0402e75f79 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Karen=20Langg=C3=A5rd?= Date: Fri, 28 Feb 2025 11:56:10 +0100 Subject: [PATCH] x --- src/cg3/dependency.cg3 | 16 ++++++++++++++++ src/cg3/disambiguator.cg3 | 7 ++++++- src/cg3/functions.cg3 | 11 ++++++++++- 3 files changed, 32 insertions(+), 2 deletions(-) diff --git a/src/cg3/dependency.cg3 b/src/cg3/dependency.cg3 index 5ac3d8972..c2027d985 100644 --- a/src/cg3/dependency.cg3 +++ b/src/cg3/dependency.cg3 @@ -1263,6 +1263,10 @@ SETPARENT:M_Juxta122 @>N + DAG IF (NEGATE 0 Abl LINK *1 Trm + Num OR ("tunge" Trm))#Timmisartumut billetsit *ullumimiit januaarip ulluisa 17-iata tungaanut utertinneqarsinnaalerput. TO (1 MAANED LINK *1A Num + POSSESSUM BARRIER (*) - ("ulloq")); #*Ippassaq februaarip ulluisa 19-ianni Nukaaraq Eugenius namminersortutut sulinerminut atatillugu allalluni marlunnik apeqquteqarpoq: +SETPARENT:M_Juxta123 @i-ADVL> + MAANED + Abs IF (-1 Num LINK -1 N + $$KASUS + OBLIQUE) +(NOT p (*)) +TO (1 N + $$KASUS + OBLIQUE + TUQ); #Nassiukkukkit arbejdsgruppe aperissavara allannguutinik tigusaqanngikkutta NAA-nut akuerisassanngorlugit ataatsimiinnissaannut 20.*marts ingerlanneqartussamut nunap assinga allattuiffigisarput ingerlateqqikkumaarlugu. + #### Hybrider SETPARENT:00001A3 @i-ADVL> + Hyb/1-2 @@ -5480,6 +5484,12 @@ SETPARENT:M0023F1 @VOK + (/"asa"\ Gram/TV\ TAQ\ Der/vn\ N\ Abs/l) + 1SgPoss OR ( TO (@0 (*)) ;# "Asasakka napparsimmavinni nakorsat peqqissaasullu, ilarpassuasi sulilluartuupput, ulapitsitaavusili. +SETPARENT:M0023F2 @VOK + Prop + Abs IF (-1 BOS OR KOMMA OR ("-") OR (""") LINK NOT -1 Abs) (1 KOMMA LINK NOT *1 Abs BARRIER (*) - OBLIQUE - KOMMA) +(NEGATE 1 KOMMA LINK *1 Abs BARRIER (*) - OBLIQUE)# *Kommuneqarfik Sermersooq, Nuutoqqami eqqaassutissamut akisussaasuusoq, innuttaasunik eqqaassutissap peerneqarnissaanut tassaniiginnarnissaanulluunniit taasititsivoq. +(NOT p (*)) +TO (@0 (*)) +;#"*Danmark, tamaanga killeqarpoq!" taama qulequtserlugu akerliussutsimik takutitsineq + #Reglerne sat op på ny. Gav ca. 30 forbedringer i regressionen #vælg enten M0029 eller M0029ABCDEF, alt efter om dep skal gå til næste navn eller direkte til efternavnet #KW27062024 #SETPARENT:M0029 @PROP> + Fornavn - KKUT + Abs OR @PROP> + Gram/Abbr + (/\"<\\p{Lu}.*\>"/r) OR @PROP> + Efternavn + Abs IF #(NOT p (*)) @@ -5941,6 +5951,11 @@ SETPARENT:OrObl0100c @CL- + APPELLATIV + Abs + Sg OR Prop + Abs + Sg OR Pron + Abs (NEGATE *1 3SgO LINK *1 TRANSVERB)#Tassa ulluni makkunani Anettep PANIA Jane tikeraartoraat, taannalu Anettep killilersunngisaannarpaa, uffa ukioqatigigaa. Løser et dependensproblem (NEGATE @1 @POSS> + UNA + &&PN& LINK 1 &&PN& LINK NEGATE *1 V BARRIER KOMMA)#Uangaana PANIGA, uanga taassuma inuunera aalajangigassaraara ... (NEGATE *1 INTRANSVERB + 3Pl BARRIER V LINK *-1 _TARGET_ LINK *-1 CONJ-C BARRIER (*) - @i-ADVL> - OBLIQUE LINK *-1 Abs BARRIER (*) )# Pas på sidste led i paratakse: Sulinermut ataavanngitsumik attaveqartuuneq, ilinniagaqarsimanngitsutut suliffeqarneq imaluunniit ilinniagaqaratik sulisunik angajoqqaaqarNEQ imminut toqunnissamut aarlerinaammik annertusititsisartut misissuinerup takutippaa. +(NEGATE -1 Num LINK -1 N + Trm LINK 2 _TARGET_ + MAANED LINK 1 Trm + TUQ)#Nassiukkukkit arbejdsgruppe aperissavara allannguutinik tigusaqanngikkutta NAA-nut akuerisassanngorlugit ataatsimiinnissaannut 20.*marts ingerlanneqartussamut nunap assinga allattuiffigisarput ingerlateqqikkumaarlugu. TO (*1 Rel + Sg - @POSS> BARRIER CLB OR CONJ-C - Abs LINK *1A TRANSVERB + 3SgO OR Par + 3Pl + 4SgO) ; diff --git a/src/cg3/disambiguator.cg3 b/src/cg3/disambiguator.cg3 index cf85ec9b9..407918c7f 100644 --- a/src/cg3/disambiguator.cg3 +++ b/src/cg3/disambiguator.cg3 @@ -1046,6 +1046,7 @@ SET ADVERBIEL = Adv | Pali | %AdverbielHyb | ADV_INNAQ - POSSESSUM | (/"ataavartoq"\ N\ Ins\ Sg/l) | (/"attuuma"\ Gram/IV\ UTE\ Der/vn\ QAR\ Der/nv\ Gram/IV\ NNGIT\ Der/vv\ Gram/IV\ TUQ\ Der/vn\ N\ Ins/l) | ASSERSUUTIGALUGU | +(/"eqqissi"\ Gram/IV\ SIMA\ Der/vv\ TUQ\ Der/vn\ N\ Ins\ Sg/l) | (/"eqqor"\ Gram/IV\ TUQ\ Der/vn\ N\ Ins\ Sg/l) | ("ersarip") | NUMERAL + RIAR + Cont + INTRANSVERB | @@ -1254,7 +1255,7 @@ LIST OQARPOQ = (/"oqar"\ Gram/IV\ \(Gram/Conj-encl\ \)?\(Sem/.*\ \)?V/l) (/"oqar #ny liste med ord, som ikke kan tage objekter, som ikke er objektssætninger LIST ALTID_ORATIOOBLVERB = (/"nassuer"\ Gram/TV\ UTE\ Der/vn\ GE/l) "nassuerutige" ; -LIST ORATIOOBLVERBnOQAR = "aalajanger" "aalianger" (/"aarleqqut"\ GE/l) (/"aki"\ Gram/IV/l) (/"aki"\ Gram/TV/l) ("allap" USIQ GE) (/"allap"\ Gram/HV\ Gram/IV\ USIQ\ Der/vn\ GE\ Der/nv\ Gram/TV\ TAQ\ Der/vn\ QAR/l) (/"angu"\ Gram/TV\ \(NIAR\ Der/vv\ Gram/TV\ \)?TAQ\ Der/vn\ GE/l) ("apeqqut" GE) ("apeqqut" U) "apere" "apersor" ("assuarliut" GE) "eqqaa" "eqqaama" "eqqartor" (/"eqquma"\ Gram/IV\ VIK\ Der/vn\ GE/l) (/"ersarip"\ Gram/IV\ QQISSAAR\ Der/vv/l) "erseqqissar" ("erseqqip" SAR) "erseqqissaatige" (/"erser"\ Gram/IV/l) +LIST ORATIOOBLVERBnOQAR = "aalajanger" "aalianger" (/"aarleqqut"\ GE/l) (/"aki"\ Gram/IV/l) (/"aki"\ Gram/TV/l) ("allap" VIK GE) ("allap" USIQ GE) (/"allap"\ Gram/HV\ Gram/IV\ USIQ\ Der/vn\ GE\ Der/nv\ Gram/TV\ TAQ\ Der/vn\ QAR/l) (/"angu"\ Gram/TV\ \(NIAR\ Der/vv\ Gram/TV\ \)?TAQ\ Der/vn\ GE/l) ("apeqqut" GE) ("apeqqut" U) "apere" "apersor" ("assuarliut" GE) "eqqaa" "eqqaama" "eqqartor" (/"eqquma"\ Gram/IV\ VIK\ Der/vn\ GE/l) (/"ersarip"\ Gram/IV\ QQISSAAR\ Der/vv/l) "erseqqissar" ("erseqqip" SAR) "erseqqissaatige" (/"erser"\ Gram/IV/l) (/"ilikkar"\ Gram/TV/l) ("ilimanar") (/"ilimasaarut"\ \(\(i\)?Sem/predict\ \)?GE/l) "ilimage" "ilimasup" "ilimatsaap" (/"ilinniar"\ Gram/IV\ TIP\ Der/vv\ Gram/TV\ NIQAR\ Der/vv\ Gram/IV/l) ("ili" SIMA TIP HTR) (/"ilisima"\ Gram/IV\ TIP/l) (/"ilisima"\ Gram/TV/l) (/"ilisima"\ Gram/IV\ TIP\ Der/vv/l) "ilisimatitsi" "ilisimatitsissut" "ilumoor" "imaap" ("inassut" GE) "inassutige" "innersuup" ("isuma" LIUR) ("isuma" QAR) ("isuma" QATE GIIP) "isummer" "kaammattor" "kajumissaar" "kalerrip" ("kissaap") (/"kissar"\ UTE\ Der/vn\ GE/l) "maluge" "malunnar" "malunnarsi" "marser" (/"mianersor"\ Gram/IV\ QQU/l) "misissor" #skal genovervejes. Masser af uventede konsekvenser @@ -3456,6 +3457,8 @@ REMOVE:soorlu+Adv ("soorlu") + Conj IF (0 ("soorlu")+ Adv LINK NOT *1 V );# Sumi #SELECT:advB ("aamma") + Adv IF (0 ("aamma") + LU OR ("aamma") + LI OR ("aamma") + LUUNNIIT) #- Decembarip aallaqqaataani aammalu decembarip qulingiluaani meeqqanut isiginnaagassiaqarumaarpoq. #; +REMOVE:CONTadvPar ("aamma" Adv) IF (0 ("aamma" Conj) LINK -*1 ORATIOOBLVERBnOQAR LINK *1 CONT OR Par BARRIER V LINK 1 _TARGET_ LINK *1 CONT OR Par BARRIER V); + SELECT:VconjCont Conj + ("aamma") IF (*-1 N + &&IV_SUBJ& LINK *1 V + &&IV_SUBJ&)(*-1 V + &&IV_SUBJ&)( *1 N + Pl LINK *1 CONT + 4Pl) ; #PL 20190410 aamma er en konjunktion mellem en nexus og en Cont-nexus. Kan måske raffineres med unification. Dog ikke med eksisterende Cont&, da her vikar for Cau og derfor med 3. subjekt #kw05012023 Rettet sådan at aamma står MELLEM verberne. SELECT:conjB ("aamma") + Conj IF (-1* Prop BARRIER (*) - TITEL - PUNCT LINK *1 _TARGET_ LINK *1 Prop BARRIER (*) - TITEL - PUNCT) ; #Aviaq aamma Kunuk @@ -10676,6 +10679,8 @@ REMOVE:5866 ("Danmark") + Sem/Hum IF (0 Sem/Geo) ; # Hvilket praefingeret pronomen? SELECT:Sel0091 ("uv") + Prefix/TA + Pron ; #Den hyppigste, taanna +REMOVE:Remove0092x Via + Pl IF (0 Abs + Pl + POSSESSUM LINK *1 TRANSVERB + V + 3PlO BARRIER V) ;#Aatsaaqqinnaaq ataatsimiinnermi *isumaqatigiissutigut allalaarallarlakka: + # Spatial med eller uden possessor? SELECT:Sel0092 Via - POSSESSUM IF (NEGATE -1 Rel)(NEGATE 0 Prop + KKUT) #sidste NEGATE for ikke at få Via på proprierne (NEGATE 0 ("juulli") + Abs LINK 1 3PlO)#Nunarsuarmi tamarmi immikkut ilisimasallit tamarmik JUULLIKKUT eqqarsarnartoqartingaatsiarpaat. diff --git a/src/cg3/functions.cg3 b/src/cg3/functions.cg3 index f1ed3594a..f86f0e072 100644 --- a/src/cg3/functions.cg3 +++ b/src/cg3/functions.cg3 @@ -905,6 +905,8 @@ MAP:M_Juxta122 @>N TARGET DAG IF (1 MAANED LINK *1 Num + POSSESSUM BARRIER (*) - (NEGATE 0 Abl LINK *1 Trm + Num OR ("tunge" Trm))#Timmisartumut billetsit *ullumimiit januaarip ulluisa 17-iata tungaanut utertinneqarsinnaalerput. ; #*Ippassaq februaarip ulluisa 19-ianni Nukaaraq Eugenius namminersortutut sulinerminut atatillugu allalluni marlunnik apeqquteqarpoq: +MAP:M_Juxta123 @i-ADVL> TARGET MAANED + Abs IF (-1 Num LINK -1 N + $$KASUS + OBLIQUE) (1 N + $$KASUS + OBLIQUE + TUQ); #Nassiukkukkit arbejdsgruppe aperissavara allannguutinik tigusaqanngikkutta NAA-nut akuerisassanngorlugit ataatsimiinnissaannut 20.*marts ingerlanneqartussamut nunap assinga allattuiffigisarput ingerlateqqikkumaarlugu. + @@ -4067,6 +4069,10 @@ MAP:M0023F1 @VOK TARGET (/"asa"\ Gram/TV\ TAQ\ Der/vn\ N\ Abs/l) + 1SgPoss OR (/ (NEGATE *0 V BARRIER KOMMA) ;# "Asasakka napparsimmavinni nakorsat peqqissaasullu, ilarpassuasi sulilluartuupput, ulapitsitaavusili. +MAP:M0023F2 @VOK TARGET Prop + Abs IF (-1 BOS OR KOMMA OR ("-") OR (""") LINK NOT -1 Abs) (1 KOMMA LINK NOT *1 Abs BARRIER (*) - OBLIQUE - KOMMA) +(NEGATE 1 KOMMA LINK *1 Abs BARRIER (*) - OBLIQUE)# *Kommuneqarfik Sermersooq, Nuutoqqami eqqaassutissamut akisussaasuusoq, innuttaasunik eqqaassutissap peerneqarnissaanut tassaniiginnarnissaanulluunniit taasititsivoq. +;#"*Danmark, tamaanga killeqarpoq!" taama qulequtserlugu akerliussutsimik takutitsineq + #Reglerne sat op på ny. Gav ca. 30 forbedringer i regressionen #vælg enten M0029 eller M0029ABCDEF, alt efter om dep skal gå til næste navn eller direkte til efternavnet #KW27062024 #MAP:M0029 @PROP> TARGET Fornavn - KKUT + Abs OR Gram/Abbr + (/\"<\\p{Lu}.*\>"/r) OR Efternavn + Abs IF (1 Fornavn OR Gram/Abbr + (/\"<\\p{Lu}.*\>"/r) OR Efternavn) #(NEGATE 1 Fornavn LINK *1 Efternavn + CONJ-LU BARRIER (*) - Fornavn - Gram/Abbr - Efternavn) #ALEQA HAMMONDILLI Pele Brobergillu nunarput qaaqquneqanngippallaarsoraat. @@ -4400,6 +4406,8 @@ MAP:OrObl0100b @CL- TARGET APPELLATIV + Abs + Sg OR Prop + Abs + Sg OR Pron + Abs + (NEGATE *1 3SgO LINK *1 TRANSVERB)#Tassa ulluni makkunani Anettep PANIA Jane tikeraartoraat, taannalu Anettep killilersunngisaannarpaa, uffa ukioqatigigaa. Løser et dependensproblem (NEGATE @1 @POSS> + UNA + &&PN& LINK 1 &&PN& LINK NEGATE *1 V BARRIER KOMMA)#Uangaana PANIGA, uanga taassuma inuunera aalajangigassaraara ... (NEGATE *1 INTRANSVERB + 3Pl BARRIER V LINK *-1 _TARGET_ LINK *-1 CONJ-C BARRIER (*) - @i-ADVL> - OBLIQUE LINK *-1 Abs BARRIER (*) )# Pas på sidste led i paratakse: Sulinermut ataavanngitsumik attaveqartuuneq, ilinniagaqarsimanngitsutut suliffeqarneq imaluunniit ilinniagaqaratik sulisunik angajoqqaaqarNEQ imminut toqunnissamut aarlerinaammik annertusititsisartut misissuinerup takutippaa. +(NEGATE -1 Num LINK -1 N + Trm LINK 2 _TARGET_ + MAANED LINK 1 Trm + TUQ)#Nassiukkukkit arbejdsgruppe aperissavara allannguutinik tigusaqanngikkutta NAA-nut akuerisassanngorlugit ataatsimiinnissaannut 20.*marts ingerlanneqartussamut nunap assinga allattuiffigisarput ingerlateqqikkumaarlugu. ; MAP:M0439 @OBJ> TARGET APPELLATIV + Abs + Sg OR Prop + Abs + Sg OR Gram/Dem + Pron + Abs + Sg IF (1 Part LINK 1 TRANSVERB + 3SgO OR Par + 3Pl + 4SgO) #Subj Obj partikel TRANSVERB typen @@ -6673,7 +6682,7 @@ MAP:M0615D @MIK-OBJ> TARGET Ins - ADVERBIEL IF (1 HTR + V) #HS Analysep Sermitsi MAP:M0615Dx @N< TARGET Num + Ins + $$NUMERUS IF (-1 Sem/Unit + Abs LINK -1 N + Ins + $$NUMERUS LINK NOT -1 Ins + $$NUMERUS) ;##qaleralinnik kilo 200-nik pisiarinnippoq.#qaleralinnik kilo 200-nik pisiarinnippoq. -MAP:M0615E @MIK-OBJ> TARGET Ins IF (*1 HTR + V BARRIER (*) - Ins) #lisimatusarfimmi inuiaqatigiilerinermi ilisimatooq, Rasmus Leander, naliliivoq, isumasiuineq IA-p SIUTTUUFFIGISAANIK naalakkersuisoqatigiiliornissanik pingasunik periarfissiisoq. +MAP:M0615E @MIK-OBJ> TARGET Ins - ADVERBIEL IF (*1 HTR + V BARRIER (*) - Ins) #lisimatusarfimmi inuiaqatigiilerinermi ilisimatooq, Rasmus Leander, naliliivoq, isumasiuineq IA-p SIUTTUUFFIGISAANIK naalakkersuisoqatigiiliornissanik pingasunik periarfissiisoq. (NEGATE -1 Ins + $$NUMERUS LINK 1 _TARGET_ + $$NUMERUS) (NEGATE 0 NON_HUMAN LINK 1 humanobjverb)#Tassami Kalaallit Nunaanni Brugseni atuaqatigiinnut, siunissami atuarfiup qanoq ittuunissaanik siunnersuutitsialaqartunut 100.000 KORUUNINIK unammisitsivoq. (NEGATE *-1 @MIK-OBJ> BARRIER (*) - Num - NUMHOVED)#Danskit naalakkersuisui ilaatigut illersornissaqarfimmi sulinermut Kangerlussuarmi ilinniarfissamut timmisartuaqqanillu ungasianiit aquttakkanik pisinissamut atugassanik 1,5 milliardit KORUUNINIK aningaasaleeqqammerput.