Existe uma maneira de fazer formatação rich text com regexes?

2

Estou tentando editar um texto grande de domínio público para publicação. Uma das coisas que tenho que fazer é tornar o cabeçalho de cada parágrafo em negrito . Como o cabeçalho sempre começa com um open-paren e termina com um período, parece que uma expressão regular aceleraria as coisas se eu conseguisse encontrar um editor de rich text que o suportasse. Alguma idéia?

PS Estou trabalhando no linux agora, então o software linux seria preferido.

Atualização: de acordo com a solicitação do Rob, estou postando uma amostra do texto. É hebraico, mas eu posso colocar em algum lorum ipset se você quiser.

י השוחה והמעופף ומן הנראה שבכלל השוחה שרץ המים ובכלל המעופף שרץ העוף. (כד) ויאמר אלהים תוצא הארץ ונר. (כבר) קדם לנו טעם מאמרו בתוצא הארץ: ומאמרו נפש חיה אין טעמו שנפש חיה נוצרה מן הארץ שהרי הנוצר מן הארץ ושאר היסודות הוא חומר ואילו הנפש אפילו נפש החיה מהשפעת העולם העליון הרוחני כמבואר במדעים האמתיים לכן טעם המאמר "תוצא הארץ חיה שיש לה נפש "ואמנם סמך הכתוב "נפש" אצל "חיה" וחיבר שניהם במאמר תוצא הארץ [נפש חיה] לשני טעמים לפי הנראה לי אחד מהם שנפשו של החי שאינו מדבר משוקעת בחומר שקיעה רבה ומפני זה אין השארה לנפשו בעת הפרידה (מן הגוף) כמו שרמז לזה שלמה ע״ה במאמרו ונפש הבהמה ה י ר ד ת היא למטה והטעם השני שלא קדם בתחילת הבריאה חומר החי להיפרט ולצאת קודם מציא ות הנפש בו אלא בבת אחת הוציא האל יתעלה מן הארץ בריות בעלי נפשות וכאילו הארץ הוציאה אותן הנפשות כמו שהוציאה את החומר שלהן: ומאמרו למינה רמז לריבוי מיני החי ופירוט האישים של כל מין ממנו בצורת מינו אשר פירט לו בוראו: ומאמרו בהמה ורמש וחיתו ארץ למינה חילוק החי של היבשה שנתהווה מן הארץ לשלושה חלקים אלה שהרי הסוג העליון של החי שהוגבל באשר הוא גוף משתמש בחושים מתחלק לשלושה חלק

Observe que nem todos os parênteses são títulos de parágrafos. Somente aqueles seguidos por uma string terminando em um período, não dois pontos.

    
por Yitzchak 15.03.2012 / 17:54

1 resposta

0

Existe uma maneira ... Você primeiro aplica "negrito" a algumas palavras do seu texto. Então você pode abrir seu .rtf com um editor não rico, dizer notepad (ou emacs) e ver o "código" por trás do seu documento. É bem legível para humanos. Se você procurar a string que acabou de negrito, descobrirá como negrito qualquer parte do texto. Infelizmente eu não posso realmente dizer o que é (exceto que isso envolva \ b), como eu notei que o formato muda se você criou seu documento com word ou wordpad, ou qualquer outro editor, eu acho, então a única maneira de ter certeza seria seja para você dar uma amostra dele (de preferência com algum texto em negrito e alguns não em negrito).

A criação da pesquisa e substituição de expressões regulares deve ser fácil.

    
por 30.08.2012 / 09:10