Comment supprimer des lignes en fonction des doublons dans une colonne sous Excel ?
Dans Excel, la suppression des lignes en double est une tâche simple grâce à la fonctionnalité Supprimer les doublons de l'onglet Données. Cependant, le processus de suppression de lignes entières basé sur des valeurs en double dans une seule colonne peut ne pas être immédiatement évident. Cet article présente plusieurs méthodes simples pour aborder efficacement ce scénario, garantissant que vos données restent précises et concises. La suppression des lignes en fonction des doublons dans une colonne spécifique peut être cruciale lors de la préparation des données pour les rapports, analyses ou lorsque vous devez conserver uniquement des enregistrements uniques selon un certain critère. Les méthodes suivantes vont des fonctions intégrées d'Excel aux formules et options VBA, ainsi que des solutions fournies par Kutools pour Excel, permettant aux utilisateurs de sélectionner l'approche la plus appropriée pour leur contexte et leurs besoins de flux de travail. Chaque approche offre des avantages uniques basés sur la complexité de votre tâche, le volume de données et votre maîtrise personnelle des outils Excel.
- Supprimer des lignes en fonction des doublons dans une colonne avec la fonctionnalité Supprimer les doublons
- Supprimer des lignes en fonction des doublons dans une colonne avec Kutools pour Excel
- Utiliser du code VBA pour supprimer des lignes contenant des valeurs en double dans une colonne spécifique
- Utiliser des formules et des colonnes auxiliaires pour identifier et supprimer les doublons dans une colonne
- Supprimer des lignes en fonction des doublons dans une colonne et combiner/sommer/moyenner/compter les valeurs des lignes supprimées
Supprimer des lignes en fonction des doublons dans une colonne avec la fonctionnalité Supprimer les doublons
Cette approche se concentre sur l'utilisation de la fonctionnalité Supprimer les doublons d'Excel pour supprimer facilement des lignes entières contenant des entrées en double dans une colonne spécifique. Il s'agit de l'une des solutions les plus rapides et fonctionne mieux lorsque vos données sont déjà organisées et que vous souhaitez supprimer toutes les occurrences répétées sauf une.
- Sélectionnez la plage où vous allez supprimer des lignes en fonction des doublons dans une colonne, puis cliquez sur Données > Supprimer les doublons.
- Dans la fenêtre contextuelle Supprimer les doublons boîte de dialogue, cochez uniquement la case correspondant à la colonne qui contient les valeurs en double que vous souhaitez utiliser comme base pour supprimer des lignes entières, puis cliquez sur le bouton OK .
Remarque : Vérifiez deux fois votre sélection de colonnes. Seules les colonnes cochées seront évaluées pour les doublons. Si vous cochez accidentellement des colonnes supplémentaires, il se peut que vous ne supprimiez pas tous les doublons souhaités.
- Une boîte de dialogue ultérieure affichera le nombre de valeurs en double trouvées et supprimées. Cliquez sur OK pour terminer et fermer la boîte de dialogue. Ce message fournit un retour sur le nombre de lignes en double supprimées et le nombre de lignes uniques restantes à titre de référence.
Avantages : Rapide pour les tâches simples, aucune extension ni formule nécessaire, conserve la première occurrence de chaque doublon.
Inconvénients : Supprime toutes les colonnes des lignes supprimées, n'offre aucune flexibilité pour « revoir » les doublons signalés avant suppression.
Supprimer des lignes en fonction des doublons dans une colonne avec Kutools pour Excel
Avec l'utilitaire Sélectionner les cellules en double et uniques de Kutools pour Excel, vous pouvez également supprimer des lignes basées sur toutes les valeurs en double dans une colonne, tout en conservant uniquement les lignes avec des valeurs uniques. De plus, cet utilitaire offre la flexibilité de choisir entre supprimer les lignes contenant des doublons sauf leurs premières occurrences, ou de supprimer toutes les lignes en double y compris les premières occurrences. Cette méthode convient particulièrement aux utilisateurs qui doivent gérer rapidement les doublons avec plus de contrôle par rapport aux fonctionnalités natives d'Excel.
- Sélectionnez la colonne contenant les valeurs en double que vous souhaitez utiliser comme base pour la suppression des lignes, puis cliquez sur Kutools > Sélectionner > Sélectionner les cellules en double et uniques.
Astuce : Il est recommandé de sélectionner uniquement la colonne pour laquelle vous souhaitez vérifier les doublons afin d'éviter des suppressions involontaires dans des données non liées.
- Dans la fenêtre contextuelle Sélectionner les cellules en double et uniques boîte de dialogue, veuillez cocher l'option Doublons (sauf 1er) ou Tous les doublons (y compris 1er) selon vos besoins dans la section Règle . Ensuite, cochez l'option Sélectionner la ligne entière , puis cliquez sur le bouton Ok .
Explication des paramètres :
• Doublons (sauf 1er) : Conserve la première occurrence. Toutes les autres lignes en double sont sélectionnées pour suppression.
• Tous les doublons (y compris 1er) : Sélectionne chaque ligne où la colonne contient des valeurs en double, y compris la première occurrence. - Une boîte de dialogue apparaît indiquant le nombre de lignes sélectionnées en fonction des valeurs en double dans la colonne choisie. Cliquez sur le bouton OK pour la fermer.
- Cliquez Accueil > Supprimer > Supprimer les lignes de feuille pour supprimer les lignes sélectionnées contenant des valeurs en double. À ce stade, vous avez supprimé toutes les lignes en fonction des valeurs en double dans la colonne spécifiée.
Astuce : Pensez à sauvegarder une copie de votre fichier avant suppression. Les lignes supprimées ne peuvent pas être restaurées avec Annuler après des opérations majeures supplémentaires ou la sauvegarde/fermeture du fichier.
Données d'origine :
Résultats après suppression des doublons :
Si vous sélectionnez l'option Doublons (sauf 1er) :
Si vous sélectionnez Tous les doublons (y compris 1er) :
Avantages : Sélection flexible et aperçu, peut supprimer tous ou seulement certains doublons, préserve le contrôle.
Inconvénients : Installation requise.
Supprimer des lignes en fonction des doublons dans une colonne en utilisant du code VBA
Cette méthode utilise une macro VBA pour parcourir automatiquement la plage de données sélectionnée et supprimer des lignes entières lorsqu'il trouve des valeurs en double dans une colonne spécifique. Cette solution est particulièrement utile pour traiter de grands ensembles de données ou des tâches de nettoyage répétitives, et offre plus d'automatisation que les approches manuelles. Avant d'exécuter du code VBA, faites toujours une sauvegarde de votre classeur, car les modifications apportées par les macros ne peuvent pas être facilement annulées.
- Cliquez sur Développeur > Visual Basic pour ouvrir la fenêtre de l'Microsoft Visual Basic pour Applications éditeur. Si vous ne voyez pas l'onglet Développeur, vous pouvez l'activer via Fichier > Options > Personnaliser le ruban.
- Dans l'éditeur VBA, cliquez sur Insertion > Module pour créer un nouveau module de code, puis collez le code suivant dans la fenêtre du module :
Sub DeleteRowsWithDuplicateInColumn()
Dim rng As Range
Dim i As Long, j As Long
Dim lastRow As Long
Dim colNum As Long
Dim ws As Worksheet
Dim dict As Object
On Error Resume Next
Set ws = ActiveSheet
Set rng = Application.InputBox("Select your data range (including column headers)", "KutoolsforExcel", ws.UsedRange.Address, Type:=8)
If rng Is Nothing Then Exit Sub
colNum = Application.InputBox("Enter the column number to check for duplicates (e.g.,2 for column B):", "KutoolsforExcel", 1, Type:=1)
Set dict = CreateObject("Scripting.Dictionary")
lastRow = rng.Rows.Count
For i = lastRow To 2 Step -1
If dict.Exists(rng.Cells(i, colNum).Value) Then
rng.Rows(i).EntireRow.Delete
Else
dict.Add rng.Cells(i, colNum).Value, 1
End If
Next i
End Sub
3. Après avoir entré le code, cliquez sur le bouton pour exécuter le code. Lorsque vous êtes invité, sélectionnez votre plage de données (y compris les en-têtes), puis entrez le numéro de la colonne où vous souhaitez rechercher des doublons (par exemple, entrez 2 pour la colonne B).
La macro parcourra automatiquement les données de bas en haut, supprimant toutes les lignes où une valeur en double est trouvée dans la colonne spécifiée, tout en conservant la première occurrence de chaque valeur unique.
Identifier et supprimer les lignes avec des doublons en utilisant des formules Excel et des colonnes auxiliaires
Si vous préférez une solution basée sur des formules, vous pouvez utiliser des colonnes auxiliaires pour marquer les valeurs en double, puis supprimer les lignes marquées manuellement. Cette méthode est idéale lorsque vous souhaitez revoir visuellement quelles lignes sont des doublons avant de les supprimer et offre plus de transparence, bien que certaines étapes soient manuelles.
1. Ajoutez une nouvelle colonne auxiliaire à votre tableau de données (par exemple, dans la colonne D) et entrez les formules suivantes dans une cellule vide à côté de vos données, par exemple D2 :
=COUNTIF($A$2:$A2,A2)>1
2. Copiez ou remplissez cette formule dans la colonne auxiliaire pour toutes les lignes pertinentes. Un résultat de VRAI marque un doublon, tandis que FAUX indique une première occurrence.
3. Appliquez la fonction Filtre à votre plage de données, y compris la colonne auxiliaire. Filtrez ensuite la colonne auxiliaire pour les valeurs VRAI — ces dernières représentent les lignes en double au-delà de la première occurrence.
4. Sélectionnez les lignes filtrées et utilisez Accueil > Supprimer > Supprimer les lignes de feuille pour les retirer de votre tableau. Supprimez ou masquez la colonne auxiliaire ensuite si souhaité.
5. Après avoir supprimé les lignes en double, cliquez sur Filtre pour annuler le filtre et afficher les données masquées.
Marquer toutes les valeurs en double, y compris leur première occurrence : Utilisez cette formule dans votre colonne auxiliaire :
=COUNTIF($A$2:$A$24,A2)>1
Après avoir rempli vers le bas, tous les enregistrements où la valeur apparaît plus d'une fois dans la plage spécifiée renverront VRAI, peu importe leur position. Filtrer et supprimer comme ci-dessus supprimera toutes les lignes contenant des valeurs en double, ne laissant que les éléments uniques.
Inconvénients : Étapes manuelles nécessaires pour la suppression, moins efficace pour des jeux de données très volumineux.
Supprimer des lignes en fonction des doublons dans une colonne et combiner/sommer/moyenner/compter les valeurs des lignes supprimées
Si vous cherchez à supprimer des lignes entières en fonction des valeurs en double dans une colonne spécifique et souhaitez préserver les données issues de ces doublons, essayez d'utiliser l'utilitaire Fusion avancée des lignes de Kutools pour Excel. L'outil vous permet de supprimer efficacement des lignes avec des entrées en double dans une colonne choisie et simultanément d'effectuer des opérations telles que combiner, sommer, moyenner ou compter les données des lignes supprimées dans d'autres colonnes, préservant ainsi l'intégrité et l'utilité de votre jeu de données. Cette approche convient particulièrement lorsque votre processus métier nécessite l'agrégation de données connexes après la suppression des doublons, comme la consolidation des enregistrements de vente ou des journaux de transactions.
- Sélectionnez la plage où vous souhaitez supprimer des lignes en fonction des doublons dans une colonne, puis cliquez sur Kutools > Fusionner et Diviser > Fusion avancée des lignes.
- Dans la fenêtre contextuelle Fusion avancée des lignes boîte de dialogue, comme exemple, nous allons supprimer des lignes basées sur des valeurs en double dans la colonne "Fruit". De plus, nous combinerons les informations de prix dans la colonne "Prix" et nous additionnerons le montant total pour chaque type de fruit dans la colonne "Montant". Suivez ces étapes pour exécuter le processus :
- Dans la section Liste des colonnes de la boîte de dialogue, localisez et sélectionnez la colonne "Fruit", qui contient les valeurs en double que vous souhaitez utiliser pour supprimer des lignes, puis choisissez Clé principale dans la liste déroulante Opération.
- Sélectionnez la colonne "Prix" où nous combinerons toutes les valeurs associées aux doublons dans la colonne spécifiée. Choisissez ensuite un séparateur dans la liste déroulante Opération sous la section Combiner.
- Sélectionnez la colonne "Montant" où des calculs (somme, moyenne, comptage, etc.) seront appliqués aux valeurs basées sur les doublons dans la colonne spécifiée. Puis choisissez l'option Somme dans la liste déroulante Opération dans le groupe Calculer.
- Cliquez sur le bouton OK. Toutes les lignes ont maintenant été supprimées en fonction des doublons dans la colonne spécifiée, tandis que d'autres colonnes ont été combinées ou calculées simultanément.
Démo : supprimer des lignes en fonction des doublons dans une colonne sous Excel
Articles connexes :
Compter les valeurs en double dans une colonne sous Excel
Supprimer les lignes en double et conserver uniquement les valeurs les plus élevées sous Excel
Masquer les lignes en cas de doublon sous Excel
Meilleurs outils de productivité Office
Dynamisez vos compétences Excel avec Kutools pour Excel et découvrez une efficacité inégalée. Kutools pour Excel propose plus de300 fonctionnalités avancées pour booster votre productivité et gagner du temps. Cliquez ici pour obtenir la fonctionnalité la plus essentielle pour vous...
Office Tab apporte une interface à onglets à Office, et facilite grandement votre travail
- Activez la modification et la lecture par onglets dans Word, Excel, PowerPoint, Publisher, Access, Visio et Project.
- Ouvrez et créez plusieurs documents dans de nouveaux onglets de la même fenêtre, au lieu d’ouvrir de nouvelles fenêtres.
- Augmentez votre productivité de50% et réduisez des centaines de clics de souris chaque jour!