- Bedankjes 1
Verlies van spaties in notities bij gedcom import
- Jan
- Auteur
- Offline
Lees minder
Lees meer
Verlies van spaties in notities bij gedcom import
21 sep 2023 19:39
Bij het importeren van een gedcom bestand gaan sporadisch spaties verloren uit notities.
Een aldfaer notitie, geëxporteerd naar gedcom, ziet eruit als een NOTE tag gevolgd door een aantal CONC en CONT tags. Hier volgt een voorbeeld:
0 @Nnnn@ NOTE
1 CONC Josephina wordt geboren als onwettige dochter van Anna Ludovica Janssens. Op 14 sep
1 CONC tember 1907 trouwt Anna te Putte met Alphonsius Josephus Peeters (1907 akte 247). In
1 CONC _de huwelijksakte erkennen de echtgenoten Josephina als hun wettige dochter.
1 CONT Josephina overlijdt op het einde van WOII als slachtoffer van de V-bommen.
Let op de spatie voor “de huwelijksakte” in de 3e CONC regel. (belangrijk: ik heb de spatie door een underscore moeten vervangen omdat dit forum niet in staat is 2 opeenvolgende spaties te tonen - lees a.u.b. spatie ipv underscore). Als we deze gedcom importeren in een aldf bestand, dan krijgen we het volgende resultaat:
Josephina wordt geboren als onwettige dochter van Anna Ludovica Janssens. Op 14 september 1907 trouwt Anna te Putte met Alphonsius Josephus Peeters (1907 akte 147). Inde huwelijksakte erkennen de echtgenoten Josephina als hun wettige dochter.
Josephina overlijdt op het einde van WOII als slachtoffer van de V-bommen.
Merk op: Inde huwelijksakte. De spatie tussen “in” en “de” is weggevallen.
Mijn voorbeeld ziet er natuurlijk geïdealiseerd en kunstmatig uit. In werkelijkheid zijn de CONC en CONT regels die aldfaer genereert bij een gedcom export een heel stuk langer. Maar ik heb het probleem eerst vastgesteld bij normaal alledaags gebruik met meer realistische gedcoms. Ik kan het reproduceren in deze elementaire test:
Voorbeeld van een notitie tekst die het probleem reproduceert:
Vermeld als getuige & broer van de bruid in de huwelijksakten van Anna Catharina en van Anna Maria. Enkele stambomen op geneanet vermelden geen Adrianus onder de kinderen van Petrus Joannes, misschien omdat hij in Kapellen geboren is en niet in Putte of Hoevenen.
Als je deze tekst in een notitie hebt, dan krijg je na een export/import rondje “… en nietin Putte …”. De spatie tussen “niet” en “in” is verdwenen. Ik heb het gedcom bestand bekeken met een hex editor, op zoek naar eventuele speciale tekens of andere eigenaardigheden in de tekst van de notitie, maar er waren er geen.
Aldfaer versie: 10.1
Windows 11 22H2
Een aldfaer notitie, geëxporteerd naar gedcom, ziet eruit als een NOTE tag gevolgd door een aantal CONC en CONT tags. Hier volgt een voorbeeld:
0 @Nnnn@ NOTE
1 CONC Josephina wordt geboren als onwettige dochter van Anna Ludovica Janssens. Op 14 sep
1 CONC tember 1907 trouwt Anna te Putte met Alphonsius Josephus Peeters (1907 akte 247). In
1 CONC _de huwelijksakte erkennen de echtgenoten Josephina als hun wettige dochter.
1 CONT Josephina overlijdt op het einde van WOII als slachtoffer van de V-bommen.
Let op de spatie voor “de huwelijksakte” in de 3e CONC regel. (belangrijk: ik heb de spatie door een underscore moeten vervangen omdat dit forum niet in staat is 2 opeenvolgende spaties te tonen - lees a.u.b. spatie ipv underscore). Als we deze gedcom importeren in een aldf bestand, dan krijgen we het volgende resultaat:
Josephina wordt geboren als onwettige dochter van Anna Ludovica Janssens. Op 14 september 1907 trouwt Anna te Putte met Alphonsius Josephus Peeters (1907 akte 147). Inde huwelijksakte erkennen de echtgenoten Josephina als hun wettige dochter.
Josephina overlijdt op het einde van WOII als slachtoffer van de V-bommen.
Merk op: Inde huwelijksakte. De spatie tussen “in” en “de” is weggevallen.
Mijn voorbeeld ziet er natuurlijk geïdealiseerd en kunstmatig uit. In werkelijkheid zijn de CONC en CONT regels die aldfaer genereert bij een gedcom export een heel stuk langer. Maar ik heb het probleem eerst vastgesteld bij normaal alledaags gebruik met meer realistische gedcoms. Ik kan het reproduceren in deze elementaire test:
- Ik maak een nieuw, leeg aldf bestand aan.
- Ik voeg één persoon toe, met een notitie waarvan ik van tevoren weet dat een export er gaat uitzien als mijn voorbeeld (met een CONC regel die met een spatie begint). Een geschikte tekst staat hieronder.
- Ik doe een export.
- Ik creëer een tweede nieuwe aldf en importeer de gedcom. Resultaat: verlies van spaties.
Voorbeeld van een notitie tekst die het probleem reproduceert:
Vermeld als getuige & broer van de bruid in de huwelijksakten van Anna Catharina en van Anna Maria. Enkele stambomen op geneanet vermelden geen Adrianus onder de kinderen van Petrus Joannes, misschien omdat hij in Kapellen geboren is en niet in Putte of Hoevenen.
Als je deze tekst in een notitie hebt, dan krijg je na een export/import rondje “… en nietin Putte …”. De spatie tussen “niet” en “in” is verdwenen. Ik heb het gedcom bestand bekeken met een hex editor, op zoek naar eventuele speciale tekens of andere eigenaardigheden in de tekst van de notitie, maar er waren er geen.
Aldfaer versie: 10.1
Windows 11 22H2
- Ruud de Ruiter
-
- Offline
Re: Verlies van spaties in notities bij gedcom import
05 okt 2023 18:53
In uw bericht geeft u aan:
1 CONC _de huwelijksakte
In het aangehangen bericht geeft u aan
1 CONC de huwelijksakte
Wat is er nu werkelijk gebruikt ?
1 CONC _de huwelijksakte
In het aangehangen bericht geeft u aan
1 CONC de huwelijksakte
Wat is er nu werkelijk gebruikt ?
- Hans Stoter
- Offline
Lees minder
Lees meer
- Berichten: 396
- Bedankjes 51
Re: Verlies van spaties in notities bij gedcom import
05 okt 2023 19:17
Verhaal klopt.
De dubbele (of meervoudige) spatie aan het begin van een regel wordt bij import niet herkend. Als aan voorgaande regel een spatie wordt toegevoegd verloopt de import wel goed.
De dubbele (of meervoudige) spatie aan het begin van een regel wordt bij import niet herkend. Als aan voorgaande regel een spatie wordt toegevoegd verloopt de import wel goed.
- Jan
- Auteur
- Offline
Lees minder
Lees meer
- Bedankjes 1
Re: Verlies van spaties in notities bij gedcom import
05 okt 2023 23:55 - 06 okt 2023 00:21
Antwoord aan Ruud de Ruiter: Ik heb geen van beide "gebruikt". Ik beschrijf alleen hoe een notitie eruitziet in een gedcom file.
Bij een gedcom export moet aldfaer zo nodig lange notities opsplitsen in een aantal CONC regels. Daarbij kan het gebeuren dat het eerste teken van een CONC regel een spatie is. Zoals ik in mijn oorspronkelijk bericht uitleg, heb ik een underline moeten gebruiken omdat dit forum geen 2 opeenvolgende spaties kan tonen. Lees a.u.b. spatie ipv underscore, zo verzocht ik de lezer.
Om de zaak nogmaals te herformuleren: bij opsplitsen van lange notities kunnen CONC regels ontstaan die beginnen met een spatie. So far so good - voor zover mij bekend is dat ok binnen de gedcom standaard. Aldfaer heeft echter een probleem (lees: bug) bij een gedcom import. Aldfaer negeert spaties aan het begin van een CONC regel.
Bij een recente gedcom import van 3000 personen had ik een 60-tal notities waarin dit fenomeen optrad (woorden aan elkaar geplakt). Er was niets bijzonders aan mijn gedcom bestand, het was een gedcom export uit een onverdacht / onvervalst aldfaer bestand. Probeer even de elementaire test die ik in mijn oorspronkelijk bericht beschrijf. Meer dan 5 minuten heb je niet nodig om het probleem te reproduceren.
Bij een gedcom export moet aldfaer zo nodig lange notities opsplitsen in een aantal CONC regels. Daarbij kan het gebeuren dat het eerste teken van een CONC regel een spatie is. Zoals ik in mijn oorspronkelijk bericht uitleg, heb ik een underline moeten gebruiken omdat dit forum geen 2 opeenvolgende spaties kan tonen. Lees a.u.b. spatie ipv underscore, zo verzocht ik de lezer.
Om de zaak nogmaals te herformuleren: bij opsplitsen van lange notities kunnen CONC regels ontstaan die beginnen met een spatie. So far so good - voor zover mij bekend is dat ok binnen de gedcom standaard. Aldfaer heeft echter een probleem (lees: bug) bij een gedcom import. Aldfaer negeert spaties aan het begin van een CONC regel.
Bij een recente gedcom import van 3000 personen had ik een 60-tal notities waarin dit fenomeen optrad (woorden aan elkaar geplakt). Er was niets bijzonders aan mijn gedcom bestand, het was een gedcom export uit een onverdacht / onvervalst aldfaer bestand. Probeer even de elementaire test die ik in mijn oorspronkelijk bericht beschrijf. Meer dan 5 minuten heb je niet nodig om het probleem te reproduceren.
Laatst bewerkt 06 okt 2023 00:21 door Jan.
- Jan
- Auteur
- Offline
Lees minder
Lees meer
- Bedankjes 1
Re: Verlies van spaties in notities bij gedcom import
06 okt 2023 01:30
Antwoord aan Hans Stoter: dank voor het bevestigen van mijn verhaal.
Ik wil echter een mogelijk misverstand uit de weg ruimen. Ik denk niet dat u het zo bedoelt, maar andere deelnemers zouden kunnen besluiten dat het aan de gebruiker is om zo nodig het gedcom bestand handmatig aan te passen, Nee, het negeren van spaties aan het begin van de regel is niet zomaar een gril of eigenaardigheid in aldfaer. Ik kan het moeilijk wat anders noemen dan een bug...
Ik wil echter een mogelijk misverstand uit de weg ruimen. Ik denk niet dat u het zo bedoelt, maar andere deelnemers zouden kunnen besluiten dat het aan de gebruiker is om zo nodig het gedcom bestand handmatig aan te passen, Nee, het negeren van spaties aan het begin van de regel is niet zomaar een gril of eigenaardigheid in aldfaer. Ik kan het moeilijk wat anders noemen dan een bug...
- Hans Stoter
- Offline
Lees minder
Lees meer
- Berichten: 396
- Bedankjes 51
Re: Verlies van spaties in notities bij gedcom import
06 okt 2023 14:04
Ter informatie: Ik krijg 74 dubbele spaties in een gedcombestand van ruim 17000 personen.
- Jan
- Auteur
- Offline
Lees minder
Lees meer
- Bedankjes 1
Re: Verlies van spaties in notities bij gedcom import
06 okt 2023 14:32
Alles hangt er natuurlijk van af hoeveel notities je hebt en hoe lang die zijn...
- Hans Stoter
- Offline
Lees minder
Lees meer
- Berichten: 396
- Bedankjes 51
Re: Verlies van spaties in notities bij gedcom import
06 okt 2023 15:05
Ín een ander stamboomprogramma wordt de dubbele spatie aan het begin van een regel wel juist afgehandeld. Daarmee lijkt het fenomeen inderdaad een bug in Aldfaer.
- Jan
- Auteur
- Offline
Lees minder
Lees meer
- Bedankjes 1
Re: Verlies van spaties in notities bij gedcom import
07 okt 2023 12:25
Kleine uitbreiding van het verhaal: wat geldt voor CONC, geldt ook voor CONT. In beide gevallen negeert aldfaer spaties aan het begin van de "payload" (dwz de rest van de gedcom regel na de tag + 1 spatie). In het geval van CONC is dat de oorzaak van het effect dat ik eerder beschreef (wegvallen van spaties tussen woorden - à la "en nietin Putte"). In het geval van CONT is de oorzaak dezelfde maar het effect is anders: wegvallen van spaties aan het begin van notitie-tekstregels. Een verschil tussen de 2 effecten is dat het eerste sporadisch is en het tweede systematisch.
Het wegvallen van spaties aan het begin van tekstregels vind ik ook niet zomaar niets. In mijn notities maak ik vaak simpele lijstjes of opsommingen en dan laat ik enkele spaties aan het begin van elke regel van de opsomming. Van een gedcom import verwacht ik dat notities zuiver overgedragen worden en dat is nu niet het geval vanwege beide vernoemde effecten.
Het wegvallen van spaties aan het begin van tekstregels vind ik ook niet zomaar niets. In mijn notities maak ik vaak simpele lijstjes of opsommingen en dan laat ik enkele spaties aan het begin van elke regel van de opsomming. Van een gedcom import verwacht ik dat notities zuiver overgedragen worden en dat is nu niet het geval vanwege beide vernoemde effecten.
- Hans Stoter
- Offline
Lees minder
Lees meer
- Berichten: 396
- Bedankjes 51
Re: Verlies van spaties in notities bij gedcom import
07 okt 2023 14:51
Fenomeen CONC doet zich bij mij in 74 van ca 27.000 CONC-regels voor.
Fenomeen CONT doet zich bij mij in 280 van ca 495.000 CONT-regels voor.
Fenomeen CONT doet zich bij mij in 280 van ca 495.000 CONT-regels voor.
- Guy De Ceulaer
- Offline
Lees minder
Lees meer
- Berichten: 50
- Bedankjes 0
Re: Verlies van spaties in notities bij gedcom import
18 jan 2024 11:27
Erger nog. Ik schrijf akten soms uit als notitie en gebruik daar gretig de mogelijkheid om HTML codes te gebruiken om namen te laten uitkomen.
Een <font color="red"> werd door deze bug 14 maal omgezet in <fontcolor="red"> waar HTML niets meer kan mee doen en sommig programma's foutberichten genereren.
De honderden andere spaties tussen woorden die zo verloren zijn gegaan, kan ik helaas niet gemakkelijk meer terugvinden zonder alles nauwkeurig te herlezen bij de meer dan 12000 personen. Soms, als ik de fout ergens opmerkte, heb ik de spatie terug toegevoegd, maar ik besef nu dat die spatie op dezelfde manier terug kan verloren gaan bij een volgende export/import operatie.
Dit vraagt toch om een snelle oplossing.
Een <font color="red"> werd door deze bug 14 maal omgezet in <fontcolor="red"> waar HTML niets meer kan mee doen en sommig programma's foutberichten genereren.
De honderden andere spaties tussen woorden die zo verloren zijn gegaan, kan ik helaas niet gemakkelijk meer terugvinden zonder alles nauwkeurig te herlezen bij de meer dan 12000 personen. Soms, als ik de fout ergens opmerkte, heb ik de spatie terug toegevoegd, maar ik besef nu dat die spatie op dezelfde manier terug kan verloren gaan bij een volgende export/import operatie.
Dit vraagt toch om een snelle oplossing.