Una gran parte del análisis de datos implica la limpieza de los mismos. Los datos bien depurados son aquellos que están libres de registros incompletos, irrelevantes y redundantes.
Para eliminar la redundancia, tiene que deshacerse de los duplicados, de modo que le quede un conjunto de registros de datos únicos. De esta forma, tendrá menos desorden con el que lidiar y minimizará los errores.
La buena noticia es que las hojas de Google le proporcionan algunas formas sencillas que le permiten encontrar rápidamente valores únicos en sus datos .
Glosario
Cómo encontrar valores únicos en las hojas de Google
En este tutorial, le mostraré dos métodos sencillos que puede utilizar para encontrar rápidamente valores únicos a partir de datos de una sola columna o de varias columnas
Utilizando la herramienta incorporada de Google Sheets ‘ Eliminar duplicados ‘.
Supongamos que tenemos el siguiente conjunto de datos del que queremos eliminar los registros duplicados:
>Nota que las filas 2 y 5, así como las filas 6 y 7 tienen registros repetidos.
>Vamos a ver cómo utilizar los dos métodos mencionados para eliminar estos registros duplicados del conjunto de datos.
En este tutorial, le muestro cómo encontrar valores únicos cuando tiene varias columnas. Puede utilizar los mismos métodos en caso de que tenga los datos en una sola columna también.
Encontrar valores únicos utilizando la herramienta «Eliminar duplicados»
Google Sheets ofrece una opción de menú dedicada precisamente a esta tarea: eliminar duplicados para encontrar valores únicos. Con este método, puede eliminar los duplicados con sólo tres clics.
Estos son los pasos que debe seguir:
- Seleccione el rango de datos sobre el que desea trabajar. En nuestro ejemplo, seleccionamos las columnas A y B arrastrando el ratón apuntando sobre sus cabeceras.
- En «Columnas a analizar», tiene la opción de seleccionar si quiere que la herramienta considere todas las columnas seleccionadas o unas pocas. En este momento, como queremos deshacernos de los registros en los que tanto el nombre como el apellido son iguales, lo dejaremos como ‘Seleccionar todo’.
- Verá un cuadro de mensaje que le indicará cuántas filas duplicadas se han eliminado y cuántas filas únicas se han conservado.
- En la celda D1, escriba la siguiente fórmula
=UNIQUE(A:B) o =UNIQUE(A1:B10).
- Pulse la tecla de retorno.
>Desde el menú Datos, seleccione la opción ‘Eliminar duplicados’.
>Esto abrirá el cuadro de diálogo ‘Eliminar duplicados’.
Si su selección también contiene las cabeceras de las columnas, marque la casilla junto a la opción ‘Los datos tienen cabecera’.
>Haga clic en el botón Eliminar duplicados.
>
Ahora debería encontrar las filas 5 y 7 eliminadas. Esto se debe a que, cuando la herramienta «Eliminar duplicados» encuentra valores que se repiten, sólo conserva la primera aparición del valor, eliminando todas las demás.
>En caso de que quiera eliminar todas las filas que contengan duplicados del Primer nombre, entonces puede simplemente desmarcar la casilla junto a la Columna B en el cuadro de diálogo «Eliminar duplicados» (paso 5).
>En ese caso, tendría tres filas duplicadas eliminadas, ya que la fila que contiene el nombre de Pablo Rodríguez también se considera un duplicado.
>El conjunto de datos resultante sería entonces el siguiente
> Búsqueda de valores únicos mediante la función UNIQUE
La herramienta «Eliminar duplicados» funciona en el conjunto de datos original. Por tanto, cuando elimina los duplicados, modifica los datos originales. Sin embargo, si desea conservar el conjunto de datos original, sería mejor utilizar la función UNIQUE.
Sintaxis de la función UNIQUE
La sintaxis de la función UNIQUE es:
UNICO(rango)Aquí, rango es el rango de datos del que se quieren extraer entradas únicas.
El rango puede incluir un rango de nombres de columnas o un rango de referencias de celdas. La función mostrará el resultado a partir de la celda en la que haya introducido la fórmula.
Uso de la función única para encontrar valores únicos en las hojas de cálculo de Google
Trabajemos con el mismo conjunto de datos para entender cómo se aplica la función UNIQUE.
Para que pueda ver fácilmente las diferencias entre los datos originales y los resultantes, vamos a mostrar el resultado en la misma hoja (en un rango de celdas vecino). Sin embargo, puede incluso introducir la fórmula ÚNICA en una nueva hoja y mostrar allí los registros únicos.
Estos son los pasos que debe seguir si desea utilizar la función ÚNICA para eliminar los duplicados del conjunto de datos anterior:
>Ahora debería ver que el conjunto de registros únicos ocupa el rango de la celda D1 a la E8.
Tenga en cuenta que la función UNIQUE le permite eliminar los duplicados de forma dinámica, por lo que cualquier cambio que realice en el conjunto de datos original se actualiza automáticamente en la salida de la función.
Además, tenga en cuenta que no puede realizar ningún cambio en la salida. Si lo intenta, se producirá un error REF.
De hecho, la principal diferencia entre los dos métodos explicados en este tutorial es que la herramienta "Eliminar duplicados" trabaja sobre el rango de datos original y lo modifica.
La función UNIQUE, en cambio, muestra los datos únicos en un nuevo rango de datos, manteniendo así los datos originales sin cambios.
Si desea conservar los resultados de la función ÚNICA (para poder realizar operaciones posteriores sobre ella), entonces debe convertir el resultado de la fórmula en valores estáticos.
Para ello, debe seleccionar las celdas que contienen el resultado y copiarlas. A continuación, utilice el atajo de teclado CTRL+SHIFT+V (en un PC) o CMD+SHIFT+V (en un Mac), para pegar los valores de las celdas copiadas.
En este tutorial, le mostramos dos formas de encontrar valores únicos en Google Sheets eliminando los duplicados. El primer método utiliza la funcionalidad "Eliminar duplicados" incorporada en Google Sheets. Puede utilizar esta técnica para eliminar los duplicados y reemplazar los datos originales sólo con registros únicos.
El segundo método utiliza un método ÚNICO. Este método es ideal si no quiere hacer ningún cambio en los datos originales. Ambos métodos funcionan muy bien y hacen el trabajo rápidamente.
Esperamos que este tutorial le haya sido útil.