Unfake Text

Sanitise les chaînes obfusquées en mappant les homoglyphes cyrilliques et grecs vers le latin. Normalise la pleine largeur et les specs Unicode RFC.

Texte d'entrée ?

Saisissez ou collez le texte à reconvertir en texte normal.

Options de conversion

Choisissez quels types de caractères falsifiés doivent être reconvertis.

Convertir les homoglyphes (lookalikes cyrilliques/grecs) en latin Convertir les caractères pleine largeur en largeur normale

Résultat (texte normalisé) :

Veuillez configurer les paramètres et exécuter l'action.

À propos de Unfake Text

Unfake Text permet de reconvertir un texte trompeur en texte normal en remplaçant des homoglyphes connus et en normalisant les caractères pleine largeur.

Fonctionnalités

Cet outil propose les fonctionnalités suivantes :

Homoglyph Cleanup - Convertit les lettres sosies cyrilliques/grecques courantes en latin.
Normalisation pleine largeur - Convertit les caractères pleine chasse en largeur normale.
Préserve la mise en page - Conserve les espaces et les sauts de ligne inchangés.

Exemples

Faux sosies cyrilliques

entrée :
Réinitialisation du mot de passe maintenant

Convertir les homoglyphes : activé
Convertir pleine largeur : désactivé

sortie :
Réinitialisation du mot de passe maintenant

Un faux texte pleine largeur

entrée :
Ｈｅｌｌｏ，　ｗｏｒｌｄ！

Convertir les homoglyphes : Désactivé
Convertir pleine largeur : Sur

sortie :
Bonjour tout le monde !

Défaux les deux

entrée :
ＶΕRΙFY ＡCCΟUNT

Convertir les homoglyphes : activé
Convertir pleine largeur : activé

sortie :
VÉRIFIER LE COMPTE

Scénarios d'utilisation réelle

Détection de tentatives de phishing par homographes - Les spécialistes en cybersécurité utilisent cet outil pour analyser des URL suspectes. En convertissant les caractères homographes (comme un 'a' cyrillique imitant un 'a' latin), l'outil révèle la véritable nature des domaines utilisés pour l'hameçonnage de données bancaires.
Contournement des filtres de modération - Sur les réseaux sociaux, certains utilisateurs emploient des polices 'fantaisie' pour éviter la détection de mots-clés interdits. Cet outil normalise ces textes en caractères latins standards, permettant aux modérateurs de traiter efficacement le contenu signalé.
Nettoyage de bases de données exportées - Lors de l'importation de données provenant de systèmes utilisant des claviers asiatiques, les caractères 'pleine chasse' (full-width) peuvent bloquer les recherches. L'outil les transforme en caractères de largeur normale pour garantir la cohérence des index de recherche.
Préparation de données pour l'intelligence artificielle - Pour entraîner des modèles LLM ou nettoyer des datasets, il est crucial d'éliminer le bruit visuel Unicode. La normalisation garantit une tokenisation uniforme, évitant ainsi des erreurs d'interprétation par les algorithmes de Machine Learning.

Questions Fréquentes

Comment l'outil traite-t-il les alphabets mixtes ?

L'algorithme identifie spécifiquement les points de code Unicode appartenant à d'autres alphabets (Cyrillique, Grec) qui imitent le Latin, et les remplace chirurgicalement sans altérer le reste du texte.

Est-ce que tous les caractères suspects sont détectés ?

L'outil couvre les variantes les plus fréquentes utilisées dans la cyber-fraude et les caractères à double largeur. Il est conçu pour les glyphes visuellement identiques dans les polices système courantes.

L'outil modifie-t-il la mise en page ?

Absolument pas. Seuls les caractères eux-mêmes sont convertis. Les espaces, sauts de ligne et la ponctuation standard sont préservés pour maintenir l'intégrité du document.

Pourquoi certains textes semblent corrects mais bloquent les systèmes ?

L'œil humain ne voit pas la différence, mais la machine voit deux codes différents. Un 'o' latin n'est pas un 'ο' grec. L'outil harmonise ces codes pour qu'ils passent les validations techniques.

Outils de texte

Autres outils que vous pourriez aimer

Ecrire le texte en cursive

Mappez les caractères latins vers les glyphes cursifs Unicode. Le script préserve la ponctuation et les chiffres pour une compatibilité multiplateforme.

Visualiser la structure du texte

Segmentez la syntaxe en schemas SVG. Map l'espace, les jetons et la ponctuation sur des calques distincts. Analysez la topographie textuelle avec precision.

Deplier les lignes de texte

Normalisez les flux de texte en convertissant les sauts de ligne rigides. Le moteur de parsing preserve la logique des paragraphes par detection.

Annuler l effet Zalgo

Analysez les chaines corrompues pour supprimer les marques diacritiques excessives. Retrouvez un texte lisible via une normalisation RFC rigoureuse.

Trier les symboles dans le texte

Réorganisez les caractères par ligne ou paragraphe. Appliquez une logique de casse et des listes d'exclusion pour purifier vos structures de données.

Faire pivoter le texte

Effectuez une rotation cyclique des caractères. Mappez les décalages pour reformater les structures multilignes. Normalisez vos données avec précision.

Texte ROT47

Appliquez une rotation de 47 positions sur le jeu de caracteres ASCII. Mappez les caracteres 33 a 126 pour une obfuscation de donnees totalement reversible.

Texte ROT13

Appliquez la rotation de 13 caracteres sur l'alphabet latin. Conservez la casse et la ponctuation lors de l'obfuscation de donnees textuelles.

Reecrire le texte

Nettoyez vos donnees via des regles de mappage et un filtrage par mots entiers. Appliquez une double passe pour reformatage et suppression d'espaces.

Remplacer des mots par des chiffres

Mappez des nombres textuels en valeurs numeriques. Appliquez des filtres de casse et de mots entiers pour assainir vos chaines de caracteres SQL ou JSON.

Remplacer les voyelles du texte

Appliquez des règles de substitution personnalisées aux voyelles. Gère la casse et les passes multiples pour normaliser ou masquer les données texte.

Remplacer les espaces du texte

Mappez les tabulations et sauts de ligne vers des symboles personnalises. Validez vos chaines en supprimant les clusters de blancs redundants.

Remplacer les lettres du texte

Transformez vos chaînes via des règles de mapping précises. Gère la sensibilité à la casse et le double traitement récursif pour une intégrité maximale.

Remplacer les consonnes du texte

Appliquez des regles de substitution precises aux consonnes. Le moteur traite les chaines via un mappage sensible a la casse pour un formatage strict.

Remplacer les sauts de ligne du texte

Formatez des donnees brutes en mappant les sauts de ligne vers des separateurs personnalises. Eliminez les doublons et sanitisez chaque chaine.

Remplacer les chiffres par des mots

Convertit les sequences numeriques en format cardinal. Ciblez les nombres isoles pour la preparation TTS ou la sanitisation de donnees.

Remplacer les virgules du texte

Reformatez vos données en remplaçant les virgules par des délimiteurs. Préserve les séparateurs numériques et nettoie les clusters pour des exports valides.

Supprimer des lettres du texte

Filtrez les caractères spécifiques et normalisez vos chaînes. Ce moteur traite la casse et supprime les espaces doubles pour une intégrité textuelle.

Supprimer la police du texte

Assainissez les glyphes Unicode décoratifs en caractères latins. Normalisez les scripts pour l'accessibilité et l'indexation des bases de données.

Supprimer les guillemets des mots

Purgez les délimiteurs de texte au début et à la fin des mots. Traitement récursif multi-niveaux pour normaliser vos imports de données volumineux.