Concordance : RegEx, InStr, Like

Parent Previous Next



Séquence - Similarité - Expressions régulières


Trois méthodes sont possibles.  La méthode « Instr » (par séquence) est positionnée par défaut. Vous pouvez changer la méthode depuis le menu Options, onglet Concordance.




InStr = Recherche par séquence. Compatible Unicode. Fonctionnalité par défaut, qui retourne tous les versets où le mot ou la chaîne de caractères figure, quel que soit l'ordre de saisie.


Exemples :


image Dieu

Retourne image et Dieu ET/OU Dieu et image, quelle que soit la position du mot dans le verset.


Filtres : pour l'ensemble des versions, les guillemets permettent d'effectuer une séquence exacte. Terminer un mot ou une séquence par le signe * équivaut à l’utilisation des guillemets. Pour les versions grecques il est possible de lancer une recherche lemmatique (toutes les formes d’un mot) en faisant précéder votre recherche du signe + . Il est aussi possible de lancer une recherche de dérivés : dans ce cas, il suffit de faire précéder votre recherche du signe *. Pour l’hébreu et le grec, la concordance accepte aussi bien les formes transcrite (en betacode) que la saisie Unicode.

parole de Dieu

Retourne tous les versets où les mots parole, et de, et Dieu, figurent, quel que ce soit l’ordre des mots. Les termes paroles ou dieux sont susceptibles d’être retournés.

parole de Dieu*

Retourne les versets où la séquence « parole de Dieu » figure exactement.

« parole de Dieu »

Retourne les versets où la séquence « parole de Dieu » figure exactement.

+μορφη

Retourne tous les versets où n’importe quelle forme de μορφή figure (recherche lemmatique)

+μορφην

Retourne tous les versets où n’importe quelle forme de μορφή figure (recherche lemmatique) : autrement dit, les formes fléchies sont acceptées.

*μορφη

Retourne tous les versets où n’importe quelle forme de l’ensemble des dérivés connus de μορφή figure.


Recherche par séquence




Like = Recherche par similarité. Non compatible Unicode. Non compatible Unicode. Plus appropriée pour un mot seul avec filtres, ou un ensemble d'alternatives (mot1 OU mot2 OU mot3, etc). Les filtres sont : ? tout caractère unique. *, Zéro ou plusieurs caractères. # Tout chiffre (0-9) [charlist] Tout caractère présent dans charlist. [!charlist] Tout caractère absent de charlist.


Exemples :


hom?e        

Retourne « homme »

prost[ie]*

Retourne « prosterner », « prostituée », etc.

gr*s

Retourne gros, gras, grands…

gr?s

Retourne gros, gris, gras…


Recherche par similarité




                RegEx = Recherche par expression régulière. Non compatible Unicode. Saisissez un ou plusieurs mots (mot1 ET mot2 ET mot3, etc).



Cette méthode présente une double approche :


1. Par défaut, Bible Parser applique aux mots saisis un pattern, autrement dit une expression régulière spécifique. Celle-ci consiste à chercher les mots saisis (et leur pluriel quand il suppose une lettre), dans le même ordre, mais pas nécessairement côte à côte (intervalle 100 mots maximum), quelle que soit la casse. C'est un pattern marginal mais qui peut rendre déjà de bons services en raison des jokers possibles.


2. La méthode prend tout son intérêt dans la seconde approche : vous pouvez élaborer votre propre pattern. Pour cela, saisissez ?? puis votre pattern. Voir plus bas pour les sites Internet documentant les expressions régulières.



Recherche par expressions régulières




Jokers


.

Tout caractère

^

La chaîne qui suit doit figurer en début de phrase.

$

La chaîne qui suit doit figurer en fin de phrase.

|

Les mots séparés par la barre verticale sont recherchés alternativement. Condition booléenne: OU

?

0 fois ou 1 fois

*

0 fois ou plus

+

1 fois ou plus

-

Intervalle de caractères

()

Groupement

{}

Permet d'indiquer le nombre de répétitions souhaitées d'un pattern, ou un intervalle

[]

Ensemble de caractères

[^]

Tout sauf un ensemble de caractères

\

Caractère d'échappement


Raccourcis


\A

Résultat en début de chaîne

\b

Retourne un mot complet et non la partie d'un mot

\B

Retourne un mot complet et non la partie d'un mot, si le résultat n'est pas en début ou fin de mot

\d

Retourne toute décimale - équivalent à [0-9]

\D

Retourne tout caractère non décimal - équivalent à [^0-9]

\s

Retourne tout caractère blanc (espace) - équivalent à [ \t\n\r\f\v]

\S

Retourne tout caractère non blanc - équivalent à [^ \t\n\r\f\v]

\w

Retourne tout caractère alphanumérique - équivalent [a-zA-Z0-9_]

\W

Retourne tout caractère non alphanumérique - équivalent à [^a-zA-Z0-9_]

\Z

Résultat en fin de chaîne

\\

Retourne \


Prêts-à-l'emploi

\w+

Tout mot

\W+

Tout espace

\W+(?:\w+\W+){1,x}?

Dans une expression plus vaste, ce segment indique un écart entre deux mots, d'au moins un 1 mot, et d'au plus x mots.

{1,x}?

Indique un intervalle d'au moins un mot, et d'au plus x mots.

mot_1 (?=mot_2)

Retourne le mot_1 seulement quand il est suivi du mot_2 (attention, la ponctuation peut interférer :  mot_1\W?(?=mot_2) )

mot_1 (?!mot_2)

Retourne le mot_1 seulement s'il n'est pas suivi du mot_2



Exemples



image Dieu

Retourne image et Dieu dans cet ordre, à 100 mots l’un de l’autre maximum

commen* nou.elle

Retourne comment, commencer, commencement et nouvelle, etc. à 100 mots l’un de l’autre au maximum

gr[ao]s        

Retourne gros ou gras

gr.s

Retourne gros, gras, gris, grès

forme.|image.        

Retourne forme, formes (mais non forment) ou image, images.

époux[xs]

Retourne époux ou épouse


               

       

??\bgr.s\b

Retourne un mot entier contenant gr.s avec tout caractère en lieu et place du "."

??animaux|reptiles|oiseaux

Retourne tous les versets où l'un des mots figure, ou l'un des mots en combinaison avec l'un des autres mots, ou les deux

??\b(Aaron|Moïse)\b \b(parla|dit)\b

Retourne tous les versets où Aaron ou Moïse précède parla ou dit

??\bJésus\W+(?:\w+\W+){1,6}?Christ\b

Retourne tous les versets où Jésus est suivi de Christ, dans un intervalle de 1 à 6 mots (ex. retourne : Jésus est le Christ ; mais pas : Jésus Christ, i.e. intervalle = 0)

??\bJésus\W+(?:\w+\W+){0,1}?Christ\b

Retourne tous les versets où Jésus est suivi immédiatement de Christ

??\b(berger|pasteur)(?:\W+\w+){1,3}?\W+(brebis|troupeau)\b

Retourne tous les versets où berger ou pasteur est suivi, dans un intervalle de 1 à 3 mots de brebis ou troupeau

??\b(Père|Fils|Esprit)(?:\W+\w+){1,6}?\W+(Père|Fils|Esprit)\b(?:\W+\w+){1,6}?\W+(Père|Fils|Esprit)\b

Retourne tous les versets où l'un des mots Père, Fils ou Esprit est suivi deux fois de la même séquence alternative, dans un intervalle de 1 à 6 mots

??^Au commencement

Retourne tous les versets où l'expression "Au commencement" figure en début de verset

??terre.$

Retourne tous les versets où le mot "terre" figure en fin de verset

??o{2}

Retourne tous les versets contenant la chaîne "oo"

\b\w{14}\b

Retourne tous les versets où un mot de 14 caractères figure

??\bdroit(ure)?\b

Retourne tous les versets où figurent exactement droit ou droiture

(\b[a-zA-Z]\w+\s\d+)(:\d+)+([-–]\d+)?([,;](\s)?(\d+:)?\d+([-–]\d+)?)?|(I{1,3})*([0-9]* {0,2}[A-Z]{1}\w+[,.;:]? {0,4}[xvilcXVILC\d]+[.,;:]( {0,2}[\d-,]{1,7})+)([,.;:] {0,4}[xvilcXVILC]*[.,;:]( {0,2}[\d-,]{1,7})+)*

Trouve un verset ou plusieurs versets dans une chaîne, au format : [numéro livre] livre chapitre : verset + option : virgule et chapitre : verset

([0-9]* {0,2}[a-zA-ZäàéèëêïôöûüÉÈ]{1})*\w+[a-zA-ZäàéèëêïôöûüÉÈ]\s?(\d{1,2})?(:\d{1,2})

Idem que précédemment, moins élaborée mais très fonctionnelle, couvre la plupart des cas

??\b([A-Z]+)\s+\1\b

Retourne tous les versets présentant une succession de deux mots identiques

               


Documentation

http://www.regular-expressions.info/

http://regexr.com/ et http://www.regexpal.com/

https://msdn.microsoft.com/fr-fr/library/az24scfc(v=vs.110).aspx

http://lgmorand.developpez.com/dotnet/regex/

http://www.regexlib.com/

http://www.fon.hum.uva.nl/praat/manual/Regular_expressions_1__Special_characters.html

http://www.zytrax.com/tech/web/regex.htm

http://lgmorand.developpez.com/dotnet/regex/

http://www.regexlib.com


Bibliographie : Fourmond, Friedl, Goyvaerts, Stubblebine, Goyvaerts et Levithan


Pour la recherche lemmatique en grec, notez que d’autres chemins sont disponibles :

1.    Depuis le texte, clic droit, Trouver…  → Lemme : …




2.      Barre de Lancement Rapide → Concordance Lemmatique



3.      Barre de Lancement Rapide → commande + suivie du lemme