diff --git a/src/migmose/parsing.py b/src/migmose/parsing.py index 4dc2866..5d34710 100644 --- a/src/migmose/parsing.py +++ b/src/migmose/parsing.py @@ -76,10 +76,6 @@ def get_latest_file(file_list: list[Path]) -> Path: Returns: Path: The path of the latest file. Returns None if no valid date is found. """ - # Initialize variables to keep track of the latest file and date - if len(file_list) == 1: - logger.info("Using the only file: {}", file_list[0]) - return file_list[0] try: # Define the keywords to filter relevant files keywords = ["konsolidiertelesefassungmitfehlerkorrekturen", "außerordentlicheveröffentlichung"] @@ -160,8 +156,9 @@ def parse_raw_nachrichtenstrukturzeile(input_path: Path) -> list[str]: _pattern = re.compile( - r"MIG(?:Strom|Gas)?-?informatorischeLesefassung?(?P(?P\d+)\.(?P\d+)(?P[a-z]?))" - r"(?:_|KonsolidierteLesefassung|-AußerordentlicheVeröffentlichung)", + r"MIG(?:Strom|Gas)?(?:-informatorischeLesefassung)?" + r"(?P(?:S|G)?(?P\d+)\.(?P\d+)(?P[a-z]?))" + r"(?:_|KonsolidierteLesefassung|-AußerordentlicheVeröffentlichung)?", re.IGNORECASE, ) diff --git a/unittests/__snapshots__/test_parsing.ambr b/unittests/__snapshots__/test_parsing.ambr index 42f5164..beb4c1e 100644 --- a/unittests/__snapshots__/test_parsing.ambr +++ b/unittests/__snapshots__/test_parsing.ambr @@ -25,17 +25,17 @@ # --- # name: TestParsing.test_extract_document_version[UTILMDG] tuple( - '', - None, - None, - '', + 'G1.0a', + 1, + 0, + 'a', ) # --- # name: TestParsing.test_extract_document_version[UTILMDS] tuple( - '', - None, - None, + 'S1.1', + 1, + 1, '', ) # --- diff --git a/unittests/test_parsing.py b/unittests/test_parsing.py index 38b66f0..c221ec5 100644 --- a/unittests/test_parsing.py +++ b/unittests/test_parsing.py @@ -100,7 +100,7 @@ def test_parse_raw_nachrichtenstrukturzeile(self): pytest.param( Path( "edi_energy_de/FV2310/IFTSTAMIG-informatorischeLesefassung-AußerordentlicheVeröffentlichung_20231022_20231001.docx" - ), + ), # will return nothing as there is no version number id="IFTSTA", ), pytest.param(