Ajouter lettres aléatoires
Insérez des caractères aléatoires pour simuler des erreurs de saisie. Paramétrez la position et le pool de lettres pour valider vos parseurs et regex.
Veuillez configurer les paramètres et exécuter l'action.
À propos de Random Letter Adder
Random Letter Adder vous permet d'ajouter des lettres aléatoires dans les mots de votre texte. Vous pouvez contrôler le pool de caractères, le nombre maximal par mot, la probabilité par mot et les positions d'insertion. Utile pour l'obfuscation, les tests et la génération de texte bruité.
Fonctionnalités
L'outil Random Letter Adder offre les fonctionnalités suivantes :
- Custom Letter Pool - Choisissez exactement quels caractères peuvent être insérés.
- Lettres max par mot - Limitez le nombre de lettres aléatoires pouvant être ajoutées à chaque mot.
- Insert Chance - Contrôlez la fréquence à laquelle les mots sont modifiés à l'aide d'un pourcentage.
- Positions multiples - Insérez des lettres avant, à l'intérieur ou après chaque mot.
- Choix de position aléatoire - Lorsque plusieurs positions sont sélectionnées, une est choisie au hasard pour chaque lettre insérée.
- formatting Preservation - Conserve les espaces, la ponctuation et les sauts de ligne intacts.
Exemples
-
Lettres aléatoires de base
entrée : Bonjour tout le monde Lettres : abc Lettres max par mot : 2 Chance d'insertion : 100 % Positions : Au milieu du mot sortie (exemple) : Heacllo woarcld
-
Avant et Après
entrée : Cas de test Lettres : XYZ Lettres max par mot : 1 Chance d'insertion : 50 % Positions : Avant le mot, Après le mot sortie (exemple) : XTest caseY
Scénarios d'utilisation réelle
- Tests de robustesse OCR - Simulation de bruit numérique - Les ingénieurs QA utilisent cet outil pour simuler des erreurs de reconnaissance optique de caractères (OCR). En ajoutant des lettres aléatoires, ils évaluent la capacité de leurs algorithmes à traiter des documents scannés de mauvaise qualité ou corrompus.
- Augmentation de données TAL - Entraînement de modèles IA - Dans le cadre du Traitement Automatique des Langues (TAL), l'ajout de bruit permet de créer des jeux de données synthétiques. Cela aide les modèles d'IA à mieux gérer les fautes de frappe réelles lors de l'analyse de messages provenant de réseaux sociaux ou de chats.
- Obscurcissement de texte - Protection contre le scraping - Pour freiner la collecte automatisée de données par des bots, les administrateurs insèrent des caractères aléatoires dans des chaînes spécifiques. Cela rend l'extraction de données via des expressions régulières (regex) beaucoup plus complexe pour les scripts malveillants.
Questions Fréquentes
Le pool de lettres supporte-t-il les caractères accentués français ?
Absolument. Vous pouvez définir un pool personnalisé incluant 'é, à, ç, è' ou tout autre caractère spécial pour que les insertions correspondent à la langue de votre texte source.
Le formatage de mon texte original est-il conservé ?
Oui. L'outil traite uniquement le contenu des mots. Les sauts de ligne, les tabulations et les espaces entre les mots restent inchangés pour maintenir la mise en page globale.
Comment est déterminé l'emplacement de l'insertion au milieu d'un mot ?
L'outil sélectionne aléatoirement une position entre la première et la dernière lettre du mot. Cela permet une distribution naturelle des caractères ajoutés au sein de la structure lexicale.
Qu'est-ce que le 'Risque d'insertion' ?
Il s'agit de la probabilité (en pourcentage) qu'un mot soit modifié. À 100%, chaque mot recevra des caractères ; à 10%, seule une petite partie du texte sera impactée.