CRudolph Geschrieben November 3, 2010 Geschrieben November 3, 2010 Gerade bin ich über eine GREP-Eigenart gestolpert, die mir etwas Kopfzerbrechen bereitet. In genetischen Texten werden Genbezeichnungen immer kursiv gesetzt. Das läßt sich natürlich ganz wunderbar über GREP auf verschiedene Art und Weise automatisieren. Nun bin ich gerade über ein Beispiel gestolpert, bei welchem überhaupt nur drei Genbezeichnungen im Text vorkommen. Ich war daher zu faul um eine allgemeingültige Syntax zu schreiben sondern habe einfach die Gene als solche eingetragen. Ich mache dies normalerweise über ».rnhA.«, weil ich in meinen Texten z.B. Klammern, welche Gene einschließen, oder auch folgende Satzzeichen ebenfalls kursivieren möchte. Das bereitet mir allerdings folgendes Problem: definiere ich mir ».geneA.|.geneB.« dann wird das einzelne Auftreten der Bezeichnungen perfekt erkannt, nicht aber die Kombination. »... deletion of geneA leads to upregulation of geneB ...« wird also fehlerlos formatiert, »... in geneA geneB double mutants is lethal ...« hingegen nicht; nur »geneA« wird kursiviert. Ich kann schon irgendwie nachvollziehen, daß eben das Leerzeichen nach »geneA« noch mit zum vorigen GREP-Ausdruck gezählt wird und damit ».geneB.« als solches nicht erkannt wird. So habe ich es mir jedenfalls zusammengereimt. Mir ist aber nicht klar, wie ich dieses Problem elegant umschiffen kann. Manuell macht es jedenfalls keinen Spaß, weil solche Kombinationen häufiger vorkommen. Ich kann das auch über eine abstraktere Syntax erledigen, wie in meinem (im Moment inaktivierten) Blog-Eintrag ausgeführt. Trotzdem muß sich das doch irgendwie auch anders erledigen lassen? Hat jemand von Euch eine Idee? :? Grüße, Christian
Mach Geschrieben November 4, 2010 Geschrieben November 4, 2010 Zumindest in der Grep-Suche von TextWrangler funktioniert Folgendes: .(geneA.|geneB.)+
Wolf Eigner Geschrieben November 4, 2010 Geschrieben November 4, 2010 Die Zeichen, die mit kursiviert werden dürfen/müssen, sollte man besser spezifizieren, etwa so: [("]?gene[A|B][)",.-]? Also: Vor dem Ausdruck öffnende Klammer oder Anführungszeichen, danach schließende Klammer, Anführung, Komma, Punkt, Divis … – jeweils null oder ein Mal. Schönen Gruß aus München. W.E.
CRudolph Geschrieben November 5, 2010 Themen-Ersteller Geschrieben November 5, 2010 @Mach: nette Lösung! Das einzige Problem ist, daß es eben leider auch in anderen Kombinationen, also z.B. mit geneA und geneC funktionieren muß. Aus diesem Grund ist die Spezifizierung der Zeichen, die kursiviert werden sollen bzw. müssen mit dem folgenden Wiederholungszeichen in diesem speziellen Kontext geeigneter. Vielen Dank für Eure Antworten, Christian
Cajon Geschrieben November 5, 2010 Geschrieben November 5, 2010 Wenn du [A|B] durch \u austauschst müssten alle Großbuchstaben berücksichtigt werden.
Empfohlene Beiträge
Erstelle ein Benutzerkonto oder melde dich an, um zu kommentieren
Du musst ein Benutzerkonto haben, um einen Kommentar verfassen zu können
Benutzerkonto erstellen
Neues Benutzerkonto für unsere Community erstellen. Es ist einfach!
Neues Benutzerkonto erstellenEinloggen
Du hast bereits ein Benutzerkonto? Melde dich hier an.
Jetzt anmelden