Extraire les correspondances regex du texte

Isoler des fragments de texte via des motifs PCRE. Scraper des logs, normaliser les donnees et copier les correspondances dans une liste structuree.

Texte en entree

Collez le texte que vous voulez analyser avec une expression reguliere.

Modele regex

Enter the regular expression to search for. Example: #[A-Z]\d+

Extraire toutes les correspondances

Ignorer la casse

Mode multiligne

Correspondances extraites :

Veuillez configurer les paramètres et exécuter l'action.

À propos de Extraire les correspondances regex du texte

Extract Regex Matches from Text analyse le texte avec une expression régulière et renvoie chaque fragment correspondant sur une nouvelle ligne. Il est utile pour extraire des identifiants, des hashtags, des e-mails, des numéros ou tout autre motif de texte répété à partir d'un contenu plus volumineux.

Fonctionnement

Utilisez loutil en trois etapes simples :

Coller le texte - Ajoutez le texte intégral contenant les données que vous souhaitez extraire.
Entrez une expression régulière - Tapez un modèle d'expression régulière tel que #[A-Z]\d+ ou [A-Za-z]+@[A-Za-z]+\.com.
Extraire les correspondances - Cliquez sur Extraire les correspondances pour lister chaque fragment qui correspond à votre modèle.

Exemples de base

Extraire les numéros de billets

entrée :
Commande #A12, #B34 et #C56 prete.

Motif :
#[A-Z] \d+

sortie :
#A12
#B34
#C56

Extraire les adresses e-mail

entrée :
Contactez hello@example.com ou sales@example.com aujourd'hui.

Modèle :
[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za -z]{2,}

sortie :
hello@example.com
sales@example.com

Premier match uniquement

entrée :
Pièce 203, pièce 415, pièce 512

Modèle :
\d+
Extraire toutes les correspondances : Désactivé

sortie :
203

Scénarios d'utilisation réelle

Audit de facturation - Extraction de SIRET et TVA - Les services comptables utilisent cet outil pour isoler les numéros de SIRET ou de TVA intracommunautaire à partir de documents bruts. Un motif regex bien défini permet de valider la présence de ces identifiants légaux sur des centaines de lignes de texte.
Analyse de journaux système - Sécurité IT - Les ingénieurs DevOps extraient des codes d'erreur spécifiques ou des adresses IPv4/IPv6 à partir de fichiers logs volumineux pour identifier les tentatives d'intrusion ou les pannes répétitives sans avoir à parcourir le texte manuellement.
Marketing Digital - Nettoyage de bases de données - Utile pour extraire des noms d'utilisateur, des hashtags ou des adresses e-mail à partir de flux de données non structurés provenant de réseaux sociaux ou de formulaires de contact, facilitant ainsi la segmentation des leads.
SEO et marketing – Récolte de métadonnées - Les spécialistes du marketing numérique peuvent extraire des paramètres d'URL, des hashtags ou des identifiants de réseaux sociaux spécifiques à partir de HTML brut ou de flux de réseaux sociaux exportés. Ceci est essentiel pour l’analyse concurrentielle et l’organisation de listes de diffusion à partir de données textuelles brutes.

Questions Fréquentes

Comment extraire toutes les occurrences d'un mot ?

Activez l'option 'Extraire toutes les correspondances'. Si cette option est désactivée, l'outil s'arrêtera après avoir trouvé le premier résultat correspondant à votre motif.

À quoi sert le mode multiligne ?

Le mode multiligne permet aux ancres de début (^) et de fin ($) de s'appliquer à chaque ligne individuelle du texte. C'est indispensable pour traiter des données formatées ligne par ligne.

L'outil différencie-t-il les majuscules des minuscules ?

Par défaut, oui. Cependant, vous pouvez cocher 'Ignorer la casse' pour que l'outil traite 'TEXTE' et 'texte' de la même manière lors de la recherche.

L'outil gérera-t-il les données sensibles à la casse ?

Par défaut, l'expression régulière est sensible à la casse. Si vous souhaitez rechercher à la fois « Erreur » et « Erreur », vous pouvez activer l'option « Ignorer la casse » pour traiter les lettres majuscules et minuscules comme identiques.

Outils de texte

Autres outils que vous pourriez aimer

Ecrire le texte en cursive

Mappez les caractères latins vers les glyphes cursifs Unicode. Le script préserve la ponctuation et les chiffres pour une compatibilité multiplateforme.

Visualiser la structure du texte

Segmentez la syntaxe en schemas SVG. Map l'espace, les jetons et la ponctuation sur des calques distincts. Analysez la topographie textuelle avec precision.

Deplier les lignes de texte

Normalisez les flux de texte en convertissant les sauts de ligne rigides. Le moteur de parsing preserve la logique des paragraphes par detection.

Annuler l effet Zalgo

Analysez les chaines corrompues pour supprimer les marques diacritiques excessives. Retrouvez un texte lisible via une normalisation RFC rigoureuse.

Trier les symboles dans le texte

Réorganisez les caractères par ligne ou paragraphe. Appliquez une logique de casse et des listes d'exclusion pour purifier vos structures de données.

Faire pivoter le texte

Effectuez une rotation cyclique des caractères. Mappez les décalages pour reformater les structures multilignes. Normalisez vos données avec précision.

Texte ROT47

Appliquez une rotation de 47 positions sur le jeu de caracteres ASCII. Mappez les caracteres 33 a 126 pour une obfuscation de donnees totalement reversible.

Texte ROT13

Appliquez la rotation de 13 caracteres sur l'alphabet latin. Conservez la casse et la ponctuation lors de l'obfuscation de donnees textuelles.

Reecrire le texte

Nettoyez vos donnees via des regles de mappage et un filtrage par mots entiers. Appliquez une double passe pour reformatage et suppression d'espaces.

Remplacer des mots par des chiffres

Mappez des nombres textuels en valeurs numeriques. Appliquez des filtres de casse et de mots entiers pour assainir vos chaines de caracteres SQL ou JSON.

Remplacer les voyelles du texte

Appliquez des règles de substitution personnalisées aux voyelles. Gère la casse et les passes multiples pour normaliser ou masquer les données texte.

Remplacer les espaces du texte

Mappez les tabulations et sauts de ligne vers des symboles personnalises. Validez vos chaines en supprimant les clusters de blancs redundants.

Remplacer les lettres du texte

Transformez vos chaînes via des règles de mapping précises. Gère la sensibilité à la casse et le double traitement récursif pour une intégrité maximale.

Remplacer les consonnes du texte

Appliquez des regles de substitution precises aux consonnes. Le moteur traite les chaines via un mappage sensible a la casse pour un formatage strict.

Remplacer les sauts de ligne du texte

Formatez des donnees brutes en mappant les sauts de ligne vers des separateurs personnalises. Eliminez les doublons et sanitisez chaque chaine.

Remplacer les chiffres par des mots

Convertit les sequences numeriques en format cardinal. Ciblez les nombres isoles pour la preparation TTS ou la sanitisation de donnees.

Remplacer les virgules du texte

Reformatez vos données en remplaçant les virgules par des délimiteurs. Préserve les séparateurs numériques et nettoie les clusters pour des exports valides.

Supprimer des lettres du texte

Filtrez les caractères spécifiques et normalisez vos chaînes. Ce moteur traite la casse et supprime les espaces doubles pour une intégrité textuelle.

Supprimer la police du texte

Assainissez les glyphes Unicode décoratifs en caractères latins. Normalisez les scripts pour l'accessibilité et l'indexation des bases de données.

Supprimer les guillemets des mots

Purgez les délimiteurs de texte au début et à la fin des mots. Traitement récursif multi-niveaux pour normaliser vos imports de données volumineux.