Dieter Bachmann Geschrieben August 21, 2006 Geschrieben August 21, 2006 Ich habe eine Frage zur korrekten Behandlung von 'vorkomponierten' (precomposed) Glyphen: Hintergrund: Das leidige Problem kombinierender Diakritika, die von gängigen Textverarbeitungsprogrammen auch noch im Jahre 2006 sehr mangelhaft dargestellt werden, notorisch z.B. etwa Sachen wie k+ ̑ ("combining inverted breve" U+0311), oder 'stacked diacritics' wie u + ̄+ ́ (u mit Makron und Akut). In der Vergangenheit umging ich den ganzen Problemkomplex, indem ich TeX verwendete. Nun möchte ich aber solche Zeichen endlich auch in gängigen WYSIWYG Textverarbeitungsprogrammen wie OpenOffice setzen können, und habe damit begonnen, die benötigten Kombinationen im Zeichensatz vorzudefinieren. Das sieht dann etwa so aus (FontForge): StartChar: umacronacute Encoding: 65566 -1 2348 [...] Ligature: 0 0 'liga' u uni0304 uni0301 EndChar Dies beim Beispiel einer Kombination ohne Unicode-Codepoint. Bei einer von Unicode berücksichtigten Kombination füge ich einfach die "Ligature" Zeile in den bestehenden Eintrag ein, etwa e mit Makron und Akut (U+1E17): StartChar: uni1E17 Encoding: 7703 7703 1036 [...] Ligature: 0 0 'liga' e uni0304 uni0301 EndChar Diese Lösung funktioniert, d.h. OpenOffice zeigt bei den betreffenden Zeichenfolgen korrekt die vordefinierte Glyphe. Das ist ja immerhin schon etwas. Meine Frage betrifft nun aber Philosophie und Syntax meiner "Ligature:" Zeile, besonders den 'liga'-tag: 'liga' steht für "Standard Ligature", also Sachen wie fi, ffl usw. Ein Buchstabe mit Diakritikon ist nun aber mal keine Ligatur im engeren Sinne. D.h. ich fürchte, die oben umrissene Lösung führt nicht zu einem korrekt beschriebenen Zeichensatz. Wie würde man korrekt einen 'precomposed character' kennzeichnen? Und vor allem, wieso wird das bei gängigen Schriftarten nicht gemacht (mit anderen Worten, wieso ist die à-Glyphe (für U+00E0), wenn sie nun mal schon vorhanden ist, in landläufigen Schriftarten nicht gleichzeitig als Glyphe für die 'canonically equivalent' Kombination a + ̀ (U+0061 U+0300) kodiert? Ich bin dankbar für alle Hinweise, auch auf andere Möglichkeiten, das Problem zu lösen. Ich war erstaunt, wie wenig Material sich dazu online auftreiben liess, ich hätte erwartet, dass der traurige Zustand der "combining diacritics" allen typographisch Interessierten seit Jahren ein Dorn im Auge sein muss, aber in der Vergangenheit herrschten offenbar (Unicode-fremde) ad-hoc Lösungen vor.
Dieter Bachmann Geschrieben August 21, 2006 Themen-Ersteller Geschrieben August 21, 2006 PS, vertieftes Gegoogle scheint zu suggerieren, dass in OpenType die feature tags 'mark' und 'mkmk' für Diakritika-Plazierung zuständig wären, also etwa Ligature: 0 0 'mark' e uni0301 für e mit Akut, und bei 'stacked diacritics' wohl Ligature: 0 0 'mkmk' uni0304 uni0301 für eine (codepoint-lose) Glyphe "macronacute" und dann Ligature: 0 0 'mark' e macronacute für e mit Makron und Akut. Das habe ich mir gerade eben zusammengereimt, ich habe keine Ahnung ob ich das richtig sehe. Die Frage ist also, 1) stimmt das so? 2) wenn ja, betrifft das nur OpenType Schriften ('liga' führt notabene auch bei Generierung von .ttf Dateien zum Erfolg) 3) laut Dokumentation sind die tags für nicht-Lateinische Schriften (z.B. Arabisch) vorgesehen. Können sie auch korrekt für Lateinisch eingesetzt werden? 4) wenn ja, gibt es irgendwelche Software, die das auch unterstützt? (es nützt ja nichts, einen korrekten Zeichensatz zu generieren, der dann nirgends eingesetzt werden kann) -- ich habe die Idee gerade mit OpenOffice (NeoOffice) getestet, mit negativem Resultat. Ich bin leider überhaupt kein Experte in diesen Fragen, und bin nur aus Not zu solcher Experimentiererei gezwungen :?
Ralf Herrmann Geschrieben August 22, 2006 Geschrieben August 22, 2006 Wenn hier keiner helfen kann, empfehle ich dir die OpenType Mailing-Liste. Hier diskutieren die Entwickler von Microsoft, Adobe und alle namhaften Schriftentwickler über alle technischen Fragen zu OpenType. Da kann man dir auf jeden Fall weiterhelfen: Subscribe: [email protected] Unsubscribe: [email protected] Set list to inactive: [email protected] Set list to active: [email protected] Message mode: [email protected] Digest mode: [email protected]
Dieter Bachmann Geschrieben August 28, 2006 Themen-Ersteller Geschrieben August 28, 2006 Danke -- bei weiterer Suche bin ich auf die OpenType GPOS Tabelle und die dazugehörige "anchor points" Funktionalität von FontForge gestossen. D.h. ich sehe ziemlich klar, wie die von mir beschriebenen Probleme von OpenType gelöst werden. Man kann also mit Blick auf die Zukunft bereits damit beginnen, solche Fonts zu kreieren. Leider gibt es kaum Textverarbeitungsprogramme, die diese Funktionen dann auch unterstützen. Word kann man vergessen, und OpenOffice ist auch recht rudimentär, es gibt gerade mal Mellel, das aber sonst zuwenig mächtig ist um als 'vollwertiger' Wordprocessor zu gelten. Wie die Lösung in Zukunft aussehen wird (in 2 oder 3 Jahren?) ist also klar, und ich vermute meine pragmatische Lösung ist der einzige im Moment gangbare Weg. Ich lasse das hier mal so stehen, zur Information für Leute, die sich dieselben Fragen stellen.
Empfohlene Beiträge
Erstelle ein Benutzerkonto oder melde dich an, um zu kommentieren
Du musst ein Benutzerkonto haben, um einen Kommentar verfassen zu können
Benutzerkonto erstellen
Neues Benutzerkonto für unsere Community erstellen. Es ist einfach!
Neues Benutzerkonto erstellenEinloggen
Du hast bereits ein Benutzerkonto? Melde dich hier an.
Jetzt anmelden