Foro Empleos Academia Blog
Recursos
  • Ejemplos de dashboards
  • DatData Games
  • Alumnos destacados
  • Torneos pasados
Search Icon Iniciar sesión Inscribirme
Back arrow

Power BI

hace 2 años

Aprendizajes de la sección “Profile the data” del módulo “Prepare the data”

dlom

¿Qué aprendiste en la sección “Profile the data”? ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI? ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
0 Votos
67
Respuestas
Respuestas

HUGODEUDOR791

hace 2 años

Buenos días con todos, La sección “Get data from different sources” me permitió conocer más herramientas de PowerBI para poder analizar nuestra data de entrada. Servirá para tener métricas de nuestra información a primera mano de las tablas de datos. Me servirá para tener familiaridad con los nuevos términos.
0 Votos

IsidreBague646

hace 2 años

Hola a todos,
  • Una forma rápida de revisar la existencia de “Outliers” en los datos.
  • distintas maneras de conocer la calidad de los datos
  • Me permitirá reducir el tiempo dedicado a la revisión de los datos.
  • en cuanto al examen, todo lo visto seguro que ayudará a entender las preguntas que se planteen y encontrar la respuesta adecuada.
Planteo una duda : En las tablas “Sales y Budget” aparecen las columnas con el icono correspondiente a un “record” , pero los valores los trata como “Value”. Entiendo que deberían ser “record” o “List”. ¿Por qué “value”? Por ejemplo, en el resto de tablas hay columnas que contienen tablas anidadas, por eso, aparecen como “Tables”. “Sales y Budget” contienen “records” y así deberían aparecer, en vez de “values”. Lo planteo por si tiene algún significado que se deba tener en cuenta. Gracias. Nos vemos el martes.
0 Votos

ArgenisChaffardet727

hace 2 años

Buenos días, La sección de Outliers estuvo muy bien, me gustó mucho el Column Properties, aporta mucha información y así no te enteras de errores en tus datos cuando armas el modelo y ves que no funciona (ya he estado ahí). Saludos
0 Votos

SantiagoNavarrete218

hace 2 años

Mis Outliers los verifico con sentencias SQL pero me parecio excelente como los indetificamos desde Power BI con la visualización de Scatter Chart. Lo que aprendí es sobre donde debo cambiar (Column profling based on entire data set) para tener todos los datos en Power Query. Claro es importante saber el tamaño de los registros que existe en la tabla. Saludos, Santiago
0 Votos

MinervaMartinez823

hace 2 años

Esta sección nos permitirá poder ver desde un inicio la calidad de nuestros datos y de esta manera el resultado pueda ser mas preciso. De esta manera podemos depurarla o prepararla aun mejor para llevar a cabo nuestros análisis. SALUDOS A TODOS
0 Votos

CarlosFigueroa597

hace 2 años

  • ¿Qué aprendiste en la sección “Profile the data”? Resp. Herramientas para normalizar los datos fáciles de usar, de rápida visualización que ahorran mucho tiempo y son esenciales para disponer de tablas de datos limpias y confiables para trabajar.
  • ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI? Resp. Considero que lo importante es la rigurosidad del trabajo previo de normalización y revisión de los datos para no llegar después a conclusiones erróneas.
  • ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación? No puedes hacer un trabajo de calidad si los datos vienen con problemas de base, deberían haber preguntas relacionadas con estos conceptos porque son muy importantes.
0 Votos

RodrigoCuevas723

hace 2 años

Buen día. ¿Qué aprendiste en la sección “Profile the data”? Lo importante de detectar anomalías en los datos ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI? Buenas practicas y utilizar mas las herramientas que trae por default power bi para preparar los datos ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación? Definitivamente lo explicado en esta sección servirá para el examen ya que ayuda a comprender cómo preparar la calidad de los datos. Saludos…
0 Votos

kevinmunozu374

hace 2 años

¿Qué aprendiste en la sección “Profile the data”?
  • Métodos para validar que los datos de las tablas vienen limpios e identificar outliers.
  • Utilizar el editor de consultas para evaluar la calidad de los datos con los que trabajaré.
  • Por último interrogar las propiedades de las columnas de las tablas con las que se quiere trabajar.
¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
  • En primer lugar hacer una validación de tus datos, ayudará a que tengas certeza en que los resultados que presentarás son válidos.
  • Evaluar la calidad de los datos también me servirá mucho para tener una previsualización de si hay existencia de datos con error, vacíos o válidos y también ver cuantos valores son distintos y/o únicos.
  • Junto con lo anterior también tomar en cuenta que si hay campos que no necesitaré o que no son relevantes para el desarrollo de mis dashboard, mientras mayor datos únicos tengan estos campos, más pesado será el archivo.
¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
  • Yo creo que una de las cosas que el examen será muy exigente, es en que demostremos que podemos ser capaces de tener pensamiento crítico al momento de recibir archivos con los que debemos trabajar, cuestionarnos si realmente están o no correctos sus datos, tomando en cuenta que si este primer paso no lo realizamos, traerá consecuencias graves al momento de presentar resultados.
0 Votos

DavidTalavera786

hace 2 años

Buenas Noches El tema de Outliers interesante. Ver como analizar la calidad de datos, con las tres opciones que brinda Power Query. Una pregunta, el tener habilitada esas opciones implica algo en el rendimiento del proyecto, es decir, lo puede hacer mas grande o lento? Saludos
0 Votos

IsidreBague646

hace 2 años

Hola David, Tal como yo lo veo, el hecho de tener activas cualquiera de las tres opciones de visualización (o las tres a la vez), no va a afectar al rendimiento del modelo ni a su tamaño. Ten en cuenta que cuando estás en Power Query Editor, lo que ves es el resultado del código M que se ejecuta detrás y no es hasta que decides clicar en “Close & Apply” que se cargan las tablas (las que tienen “Enabled Load” activado) al modelo. Por tanto, una vez estés en el canvas, cuando refresques el modelo, el hecho de que las tres opciones que comentas estén o no activadas no tendrán ninguna incidencia en su rendimiento. Esto es así, tanto en el refresco de los datos de origen, como en las visualizaciones que vayas incorporando al informe. Otra cosa es como afecte dentro del Power Query Editor estando abierto. Cada una de las opciones requiere un análisis de los datos y sí afectará al tiempo requerido, de la misma manera que si solicitas que este análisis lo limite a las mil primeras filas o la tabla entera. Dicho esto, una vez cerrado el Power Query Editor, ya no debería tener ninguna incidencia ni en el refresco, ni el rendimiento, ni en el tamaño del pbix. Espero haber aclarado la duda. Un saludo.
0 Votos

dlom

hace 2 años

Hola @David. La explicación de @Isidre está muy completa y acertada. Gracias a ambos.
0 Votos

JoseOsses541

hace 2 años

Buen día a todos. Me pareció muy buena la forma de describir las diferencias entre cada una de las vistas para ver las propiedades de los datos de las columnas de cada tabla. También me resultó interesante el ejemplo de utilizar un gráfico para evaluar inicialmente los rangos de los datos, el cual tomaré para aplicar en mis proyectos futuros.
0 Votos

fjavierl88434

hace 2 años

Buenas tardes, No había profundizado en que solo muestra las primeras 1,000 líneas, me quedó la duda si son las primeras 1,000 líneas literal de la base o trae un aleatorio de 1,000 líneas, me imaginé una base de datos con 1 millón de registros y que justo las últimas líneas tengan datos erróneos o faltantes, por lo regular me he topado con archivos que justo en el final están los errores. De ahí todas las funcionalidades del power query muy buenas. Saludos,
0 Votos

dlom

hace 2 años

Hola @Javl88 , Sí, son las primeras 1,000 filas. Saludos,
0 Votos

josemiguelburrull392

hace 2 años

Determinar la calidad de los datos cargados y su distribución. Identificar outliers, valores minimos, maximos, promedios y desviaciones. Por último ver cantidad de valores distintos y unicos, lo que redunda en el tamaño del modelo y la tasa de compresión del mismo.
0 Votos

AndresMendez463

hace 2 años

Aprendi como se visualiza cuantos errores tiene las columnas y cuandos datos estan vacios, la verdad pense que la version que estaba trabajando estaba desactualizada por que no no veia las distribucion ni el semaforo en los titulos de las columnas. Me servira para identificar rapidamente errores o tendencias en las columnas sin necesidad de hacer un reporte o una visualizacion. Espero que en el examen entregen datos con problemas o tendencias y al usar estas herramientas se podran responder de manera muy rapida.
0 Votos

llopezg2810805

hace 2 años

  • Aprendí sobre los Outliers y como empezar a analizar para ver si existe alguna incongruencia en los datos
  • El tema de las propiedades de las tablas y columnas super importante, ya que al tener una vista previa de como están los datos, podemos identificar algunos errores de forma mas rápida
*Otra cosa que fue totalmente nuevo, fueron las vistas de tablas y values que se generan cuando están relaciones, primera vez que lo vi, muy interesante. Definitivamente este modulo es muy importante para revisar la calidad de los datos y así poder evitar inconsistencias futuras de este tipo
0 Votos

AbigailEspinosa283

hace 2 años

Hola a todos ¿Qué aprendiste en la sección “Profile the data”? Outliers, fue un tema nuevo para mí, ahora se que son y me será más fácil identificarlos y darles una correcta interpretación . ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI? Tema muy importante pues de estos depende la calidad de los desarrollos y que la confiabilidad de los datos presentados sea completa. ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación? Ya sea como teoría o práctica, el entender como se representa la información y cómo identificar y solucionar adecuadamente los errores, facilita en gran manera la solución de un problema
0 Votos

dlom

hace 2 años

Estos posts van a ser una guía de estudio ENORME gracias a ustedes que están compartiendo lo que van viendo en cada sección: @Abigail , @Jorge_Bastidas , @llopez , @andresjmendezp , @jburrull , @Javl88 , @josses , @Isidre , @David , @KevinRoger , @rcuevas , @Carlos_Figueroa , @minervamar , @sfnavarrete , @chaffardet , @Hurodebe . ¡Gracias!
0 Votos

CESARCHUNGA368

hace 2 años

¿Qué aprendiste en la sección “Profile the data”? Aprendí que en cualquier BD puedo encontrar anomalías y se pueden originar porque se capturó mal un dato o porque hay un comportamiento erróneo en los datos. Lo experiencia como analista de datos me va dar la habilidad de detectar rápidamente las anomalías que se pueden presentar y que solución se puede dar. Es importante mencionar que un analista de datos no es solo la persona de sistemas sino que puede ser cualquier usuario sea financiero, logístico, de gestión humana entre otros. ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI? Me servirá a tener mas seguridad cuando trabaje con BD estadísticamente grandes para la herramienta y saberlos controlar de la mejor manera. ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación? Me servirá muchísimo; considero que mas importantes la teoría que la práctica para poder entender lo que uno está haciendo.
0 Votos

JoseLuis422

hace 2 años

Sección muy interesante la cual ya había aprendido en tus otros cursos y que me sirve para interiorizar algo más la importancia del análisis que hacemos antes de empezar a realizar nuestras visualizaciones. Importante detectar anomalías y posibles errores lo antes posible.
0 Votos

HectorGarcia323

hace 2 años

Buenos días, Sección importante para saber hacer un previó análisis de los datos antes de hacer el dashboard definitivo, también muy interesante el apartado de Vista previa de datos ya que te permite conocer datos muy interesantes con apenas unos clicks. Un saludo.
0 Votos

JulioZarate401

hace 2 años

Buenas tardes, compartiendo lo aprendido:
  1. tenemos la opción en la pestaña VER de verificar la Data, en: A- Calidad de columna: Valido/Error/Vacío B- Distribución de Columna: Distintos / Únicos C- Perfil de columna: Estadísticas como: Recuento, Error, Vacío, distintos, Únicos, NAN, cero, Min, Max, Promedio, Desviación Estándar.
Saludos cordiales, Julio Zarate
0 Votos

Anade232

hace 2 años

Hola a todos! En la sección de “Profile the data” aprendí principalmente sobre la necesidad de establecer un método propio de revisión de los datos para identificar datos anómalos o outliers. Me resultó muy práctico la posibilidad de usar diagramas de dispersión para analizar este tema. Veo la necesidad de comenzar a establecer mi propio método que me sea más útil pero sobretodo que me permita mejorar el análisis de la calidad de los datos de los proyectos que realice. Muchas gracias! Saludos!
0 Votos

ValentinaRamirez778

hace 2 años

Hola a todos En esta sección se reitera la importancia de analizar la estructura de los datos, revisar posibles inconsistencias o outliers; posteriormente esto nos permitirá realizar una limpieza a nuestros datos y que el modelo que desarrollemos se pueda relacionar correctamente y se desarrollen medidas y visualizaciones sin inconvenientes. Saludos.
0 Votos

NahuelRomera169

hace 2 años

Hola a todos, Previamente a utilizar Power BI tuve que realizar un trabajo de análisis de datos con Excel sobre muchas tablas de censos de diversos países. Con lo aprendido aquí veo que hubiese podido simplificar enormemente la carga de trabajo al utilizar por ejemplo el column profile, column properties que brinda los valores y distribuciones estadísticas de manera muy sencilla. El método mostrado para la detección de outliers también me resultó útil y pude aplicarlo a diferentes set de datos que contenían la información de registros climáticos en los cuales había valores erróneos por falla de lectura del dispositivo arduino utilizado para la captura de datos. Me resultó apropiado hacer hincapié en que se debe tener cuidado a la hora de cambiar el tipo de dato de una columna al momento de relacionarla con otra tabla. También rescato lo visto en columnas especiales ya que no sabía por qué aparecían y algunas mostraban el valor “tabla” y otros “valor” Saludos
0 Votos

FiorellaMosquera406

hace 2 años

Esta sección me ha permitido ahorrar tiempo en la validación de la calidad de datos, que anteriormente lo realizaba en la parte de reportes y al cuadrar los resultados. Este paso permitirá coordinar con el equipo de producción que revisa el proceso de carga al servidor, quienes tendrán que revisar el ETL. Esto me permitirá avanzar tareas de pruebas de carga de datos del modelo. Respecto a la certificación tengo una duda, porque hay una pregunta cuya solución para mi sería otra. Les comparto. para mi la solución sería B y C, pero en la respuesta indica que es C y D.  
2021-01-22 21_56_50-DA-100 Exam – Free Actual Q&As, Page 2 _ ExamTopics
 
  Saludos,
0 Votos

JulioCesar385

hace 2 años

Hola a todos, La Sección Perfil de los datos, permitió mi conocimiento de partes esenciales del editor de consultas, poder identificar en donde se pueden modificar las características de los tipos de datos, poder evaluar el estado de la carga de las columnas con las estadísticas de la información, indicándome la calidad de los datos, conocer de manera agrupada la cantidad de datos únicos o repetidos y conocer que puedo aplicar estas opciones a todos los datos o solo los primeros 1000 registros. De paso a la certificación estos temas me apoyaran porque seguramente saldrán preguntas, en la realidad este tema Perfil del dato, podría resumirse en, la calidad de los datos, y es que es algo de mucho impacto en que los resultados de las visualizaciones y funciones DAX, sean correctos. saludos, Julio C
0 Votos

JoseRoberto584

hace 2 años

Poder visualizar de manera rapida las caracteristicas y en cierto modo la calidad de los datos es de gran ayuda
0 Votos

AntonioHidalgo603

hace 2 años

de gran interes para mi y su inmediata aplicacion es lo que he aprendido sobre los share datasets y la utilizacion de Direct Query para conectar a bases de Datos
0 Votos

GisellePantoja310

hace 2 años

  • ¿Qué aprendiste en la sección “Profile the data”? Puedo ver facilmente como vienen los datos, puedo saber de antemano si será necesario intervenir y buscar detalles de los outliners
  • ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI? Agilizar el tiempo que podría tomar la limpieza de los datos
  • ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación? conocimiento del uso de la herramienta y lo poderoso que puede ser el query editor
0 Votos

LUISCHOMBO157

hace 2 años

¿Qué aprendiste en la sección “Profile the data”? A identificar las anomalías que pueda tener la BD y poder validar con ayuda de diversas funciones que problemas presenta la información. ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI? Me impulsa a establecer un método estandarizado para el análisis de la data previo a la carga en Power BI. ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación? Considero que es necesario para poder superar el examen entender la importancia de que la BD se encuentre lo más limpia posible y generar indicadores más cercanos a la realidad.
0 Votos

BERNABEPENA480

hace 2 años

¿Qué aprendiste en la sección “Profile the data”? Aprendí a analizar la estructura de las tablas de datos de una base de datos sql server. Vimos una matriz desde donde se puede inferir las relaciones que existen en las tablas mediante el nombre y el tipo de datos. Aprendí a analizar el perfil de los datos. Esto puede lograrse mediante una gráfica de dispersión que muestre los valores distantes o fuera de rango normal y los valores atípicos. También otra fuente de análisis son las opciones del view en el query editor. En esta opción existen tres opciones de analisis. Una permite ver la distribución de los datos donde nos muestra los valores únicos y distintos. “Column distribution” Otra opción es el “Column quality” que nos muestra la cantidad de datos con errores, cantidad de celdas vacías y la cantidad de celdas válidas. La tercera es la opción de “Column profile”. Aquí podemos ver las estadísticas de los datos. El valor máximo, el mínimo, los ceros, el promedio, la desviación estándar, ect. Estos análisis vienen por defecto para los primeros 1000 registros, pero se puede ampliar a todo el dataset. ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI? Para mi es de suma importancia este análisis de los datos. Trabajo mucho con Excel y con fuentes basadas en reportes de varios sistemas. Ahora tengo mas claro las herramientas para estudiar y resolver los errores en los datos de mis fuentes. ¿ Cómo te servirá esto que aprendiste al presentar el examen de certificación? Podría responder con mas propiedad a las preguntas relacionadas al perfil de los datos “ DATA PROFILE”.
0 Votos

MarcosGallegos439

hace 2 años

Buenas tardes, con todos. Primero comentar que parece buenísimmo el curso y estoy muy contento de estar aquí con usted. Este tema me resultó muy interesantes, ya que sin necesidad de crear metricas ni fórmulas, se puede analizar la calidad de los datos y detectar cualquier iregularidad en los mismos. En lo personal nunca habia usado estas opciones. De ahora en adelante ya no será así.
0 Votos

DeliaVentura161

hace 2 años

Esta sección “Profile the data” me proveyó de otras opciones para validación de datos rápida. Ahora usaré ese tipo de gráficos con esa intensión. Además las preguntas me ayudan a enfocarme en respuestás concretas. ¡Gracias!
0 Votos

RubenPayan125

hace 2 años

Dan consejos y son certeros en el tema a explicar, sobre todo comprensibles, ahora conozco más a fondo la utilidad de est a herramienta al momento de validar los datos. Lo único que note que al editar la fuente de datos en excel ( agregando un nuevo valor ) y actualizando , el grafico de distribución en Column Profile no me lo mostraba hasta que filtre los datos en la columna. De allí mencionar que los test al final de cada sesión te ayudan a darte idea del examen y que no todo lo que esta seleccionado quiere decir que la pregunta haga referencia a ese campo.
0 Votos

GinoPena153

hace 2 años

De la sección “Profile the data” puedo rescatar el análisis de las posibles anomalías que podemos que pueden aparecer dentro de los registros importados desde nuestra fuente de información. Súper útil!
0 Votos

RubenPayan125

hace 2 años

Adicional he visto en preguntas del examen de certificación que tratan temas de transformación con múltiples archivos desde sharepoint online, filtrando por el path, sería bueno que agregaran unos videos haciendo referencia a a eso y a como trabajar con los archivos JSON que también vienen incluidos en el examen para tener una mejor orientación y sobre todo para los futuros alumnos.
0 Votos

RafaelSantiago356

hace 2 años

Hola a todos :grin: Lo que mas me gusto de esta sección fue el uso del grafico de dispersion para poder identificar las anomalías. Es una forma rápida y fácil de analizar las posibles discrepancias que pudieran presentarse en la data.
0 Votos

GianfrancoFernandez956

hace 2 años

Identificar "data anomalies" En esta sección aprendí a qué debemos establecer un método propio para identificar los datos "outliers" o datos que se salen del rango común. Una manera de hacerlo es a través de un gráfico de dispersión. Una vez encontrado estos datos outliers, es trabajo del analista validarlos. Examinar las "data structures" Cuando los datos son extraídos de una base de datos SQL, estos pueden incluir columnas con valores de "table" o "value". Table: tabla anidada por fila; value: muestra un registro por fila. Interrogar las "column properties" Power query permite el análisis de los datos por columna a través de las siguientes vistas: Column quality: Valida los errores, vacíos y correctos. Column distribution: Muestra la cantidad de valores de tipo distinct y unique. Distinct: cantidad de valores diferentes; unique: cantidad de valores únicos (no se repiten). Interrogar las "data statistics" Power query permite hacer un análisis estadístico por columna a través de la vista: Column profile: Muestra datos estadísticos como: Valor mínimo, valor máximo, promedio, desviación estándar y un gráfico de distribución.
0 Votos

FrancisCid987

hace 2 años

Hola! Con las informaciones adquiridas aprendi a como analizar mejor las informaciones..
0 Votos

SalvadorEspejel491

hace 2 años

Que tal a todos, ¿Qué aprendiste en la sección “Profile the data”? Como muchos saben, han vivido y hemos aprendido (a veces a la mala), una tarea que se va dejando de lado o que no se le da la importancia necesaria es al análisis exploratorio de los datos, como vimos en esta sección existen distintas maneras para hacer una validación de los datos, como se comenta el escenario perfecto sería no tener que preocuparnos por este tema y pasar directo a analizar el tema en cuestión, sin embargo, sabemos que en la vida real esto no es así y muchas fuentes de información necesitan de una depuración y/o transformación antes de empezar a analizar, por lo cual, conocer como esta conformado tu conjunto de datos es fundamental, ¿Qué columnas hay? ¿Qué tipo de datos existen? ¿Hay valores nulos? ¿Tenemos variables categóricas, numéricas, ambas? ¿Debemos de conocer datos estadísticos de alguna variable? ¿Nos aporta valor? Por poner algunos ejemplos y que como mencionó un compañero parafraseando un poco, mejor tratarlos al inicio que darnos de topes cuando el modelo no se ejecute de la manera esperada. ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI? Como mencione en mi respuesta anterior un EDA (Análisis Exploratorio de Datos / Exploratory Data Analysis) es un paso que no debemos saltarnos ya que esta fase nos va a ayudar a entender el comportamiento de los datos, y no solo eso sino en el proceso de obtención de datos identificar si es adecuado o necesita de un ajuste (si es que esta en nuestro poder hacer algo al respecto). Así como ver si existen relaciones entre variables, determinar si consideramos valores outliers, manejo de nulos , etc. ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación? Al entender y saber como utilizar las herramientas con las que cuenta POWER BI, nos ayuda a realizar tareas con una menor complejidad y optimizar el tiempo al máximo.
0 Votos

ManuelPavez718

hace 2 años

Aprendí que los datos pueden tener anomalías y que debemos crear nuestro propio método para identificarlos. Y aprendí a evaluar e interrogar las estadísticas de los datos.
0 Votos

JoseAntonio314

hace 2 años

Una descripción muy buena de las diferentes vistas de las características de las columnas. Me parece muy importante comenzar a fijar métodos de detección de valores atípicos.
0 Votos

DennysSalazar800

hace 2 años

Saludos. En la sección Profile the data he concluído lo siguiente: Las herramientas de generación de perfiles nos brindan una gran ayuda para ver el panorama de los datos. El observar la cantidad de valores únicos y distintos, así como de válidos, errores y vacíos como también un análisis estadístico acompañado de un gráfico de frecuencais con sus distribuciones facilitan el trabajo para nuestro análisis. En base a los resultados podemos mejorar el conjunto de datos tanto para presentarlos como para disminuir el tamaño del mismo al eliminar valores innecesarios así como otras operaciones.
0 Votos

InesJojoa984

hace 2 años

dlom dijo
¿Qué aprendiste en la sección “Profile the data”? ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI? ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
Con este tema pude fortalecer mis conocimientos, los cuales me servirán para identificar más rápido los errores en mis datos y analizar más rápido la información, espero también ser apoyo más adelante, pronto, para esta comunidad. Hacia la certificación afianza más el tema para dar respuestas más acertadas.
0 Votos

CarlosAlvarado590

hace 2 años

¿Qué aprendiste en la sección “Profile the data”? Power BI me da la oportunidad de conocer mejor los datos que tengo desde power Query y asi perfilar los datos y analizarlos. ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI? Puedo verificar de una manera rapida la cantidad de nulos de una columna, la distribucion de la misma y tomar desiciones respecto a la transformacion o no para la limpieza de ellos. ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación? me ayudara a indentificar las secciones que correspondan a perfilar los datos
0 Votos

HectorVicente687

hace 1 año

En la sección “Profile the data” he aprendido lo siguiente:   -La importancia de detectar anomalías en los datos y como tratarlos posteriormente. -La utilización de la opcion "Column profile" para ser capaz de descubrir cuales son los distintos valores estadísticos que tienen nuestras columnas. -Como la opción "Column distribution" nos permite identificar la cantidad de veces que se repiten valores en las columnas. -La multitud de maneras diferentes para evaluar la calidad de mis datos.
0 Votos

JohnMartinez545

hace 1 año

Profile the Data nos entrega un resumen util y bastante poderoso para determinar rapidamente la calidad y la entegridad de los datos de la tabla. Es fundamental detectar rapidamente valores atipicos de una manera visualmente global y comparativa con otras tablas.      
0 Votos

EdmineCueva459

hace 1 año

dlom dijo
¿Qué aprendiste en la sección “Profile the data”?
Profile Data sirve para dar un vistazo a las características principales de los datos, muestra de los 1,000 primeros, de tal forma que podemos intuir si son de la calidad que necesitamos o podemos tomar algunas acciones de limpieza de los mismos.
0 Votos

JuanIgnacio515

hace 1 año

En esta sección me pareció muy interesante la opcion que te brinda Power Query para detectar la calidad de tu data. Con funcionalidades que no conocía como: el Colum Profile y el Column Distribution. Anteriormente, solo empleaba el Data Quality, así que esto es un salto de calidad en mi análisis de Data Quality.
0 Votos

NicolasMachin259

hace 1 año

No conocia el profile column del powerquery. Para una primera instancia en ciencia de datos esta opción es genial ya que obtienes resumen de tus datos e histograma para detectar anomalias. Me gustaria saber a nivel de visualización que se puede usar para representar eso mismo en x columna o si , si o si hay que crear medidas e ir agregando las etiquetas con cada uno de ellas. En la práctica usaba la formula describe e info en python y ahi me migraba un dataframe en excel que lo importaba en power bi....
0 Votos

RobertoSheldon590

hace 1 año

¿Qué aprendiste en la sección “Profile the data”? La importancia de ver la calidad del datos desde el inicio. No sabía que estaba la opción de que la estadística incluyera todos los datos. ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI? Tomar como primer paso y con más cuidado el tema de la calidad de los datos. ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación? Es uno de los elementos que se deben conocer para el exámen.
0 Votos

FabianVillegas643

hace 1 año

Creo que lo mejor es que puedo ver mas de los 1000 primeros datos!!
0 Votos

AlejandroPerez258

hace 1 año

Qué aprendiste en la sección “Profile the data”? Herramientas para normalizar los datos, identificar las causas de los errores, el comportamiento de los datos dentro de cada una de las columnas de información. ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI? Asegurando desde un inicio que la información con la que se empezará a realizar operaciones y demás esté lista, libre de errores. ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación? Si la información / datos a los que nos conectamos no son de calidad, el trabajo que realizamos tampoco lo será. Debemos prepararlos y conocerlos.
0 Votos

KarinaMedina360

hace 1 año

Aprendí herramientas para el analisis de la calidad de los datos y la estimación de las estadísticas que dan informacion sobre le comportamiento de cada variable o columna. La visual e informacion que se obtiene de los datos con estas herramientas permite al desarrollador hacer una limpieza y transformación de los datos de forma optima. Los conocimientos adquiridos en esta sección estan relacionados directamente con el tema del examen de certificación "Preparar los datos", específicamente "Limpiar los datos" para realizar la evaluación de estos, estimar las estadísticas y propiedades de las columnas. Tambien para la resolución de las incoherencias, valores inesperados, errores, entre otros.
0 Votos

JuanRicardo909

hace 1 año

dlom dijo
¿Qué aprendiste en la sección “Profile the data”? ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI? ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
  • En esta sección aprendí a utilizar las herramientas disponibles en Power Query para analizar la calidad de los datos, la distribución de las columnas y el perfil de las columnas.
Mediante la calidad de los datos podemos determinar el % de valores válidos, % de valores con errores y % de valores vacíos. Con la Distribución de Columnas podemos observar la cantidad de veces que se repiten los valores en nuestras columnas. Con el Perfil de columnas podemos obtener diferentes valores estadísticos como valores mínimos, máximos, promedios, etc.
  • Lo aprendido me servirá para mejorar la calidad de nuestros datos y poner mucha atención para determinar en cuáles posteriormente debemos aplicar procesos de ETL.
  • Estos temas y las pruebas realizadas me ayudan a fortalecer los conocimientos necesarios para rendir el examen de certificación.
 
0 Votos

EladioEmmanuel489

hace 1 año

  • ¿Qué aprendiste en la sección “Profile the data”?
Aprendí a analizar la estructuras de las tablas, las anomalías con las que uno puede encontrarse.
  • ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
En realizar un análisis previo de la estructura de las tablas por los posibles errores o anomalías que no permita otorgar los datos certeros que uno quiere exponer en la organización.
  • ¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?
Para poder responder con propiedad las preguntas de todo lo aprendido.
0 Votos

FabianMunoz168

hace 1 año

Muy interesante el tema para poder evaluar y conocer como están siendo cargados los datos y así determinar si es necesario o no transformar ciertos tipos de datos y/o ver datos erroneos.
0 Votos

ClaudioPailahueque578

hace 1 año

Hola a todos, En esta sección no sabía como se visualizaban esas columnas verdes en cada columna y como revisar más a fondo las estadisticas de las columnas. Creo que es muy conveniente saber estos tips para identificar rápidamente cualquier anomalía en los datos. Saludos.
0 Votos

FAUSTOPAGNONE171

hace 11 meses

Buenas, en la sección "Profile the data" aprendí funcionalidades que trae PowerBI y que no conocía. Resultan muy útiles a la hora de comenzar con el armado de un reporte, ya que permiten tener un panorama general de cómo se encuentran los datos a utilizar en el reporte. Estas funcionalidades pueden permitir ahorrar gran cantidad de tiempo haciendo un análisis previo para detectar valores raros, nulos, anómalos en el conjunto de datos.  
0 Votos

AndreaGiuliodori416

hace 10 meses

Hola! He aprendido lo siguiente: Identificar anomalías: estas pueden deberse a mala recopilación o puede ser un fenómeno real. En ambos casos hay que explorar más, para corregirlo o para averiguar la razón. Ayudas: diagramas, tablas para visualizar los outliers Data Structures: Tener cuidado del tipo de datos que se asigna a cada columna y que coincida entre las distintas tablas para que las relaciones no se vean afectadas. Columnas que tienen registros tipo "Tabla" o Value" que conecta con una tabla que se puede expandir o un valor que se puede ver. Propiedades de las columnas :Evaluar los datos. Cuando mayor cantidad de valores únicos haya, mayor será el peso del archivo, debido al método de compresión que tiene PBI. Hay métodos para hacer que un archivo de PBI no pese tanto. Las vistas de column profile, distribution and quality son muy útiles para identificar outliers, NAN o algún otro patrón sin necesidad de hacer visualizaciones. Gracias!
0 Votos

AndreaGiuliodori416

hace 10 meses

Hola, he aprendido lo siguiente: Selección entre Import, Direct Query o Dual: Excel sólo admite Import. Direct Query se puede usar con bbdd, muestras que Import con cualquier fuente de datos. Se usa Direct Query cuando las bbdd son muy grandes o se necesita información en tiempo real. Query folding: Plegado de consultas. Realizar menor número de paso y los pasos que no admiten el plegado de consultas, dejarlos para el final. El plegado de consultas permite que las transformaciones se hagan en el servidor. Parámetros: También en el tema de "Usar parámetros" vimos que los parámetros podíamos utilizarlos para darle más control a nuestros usuarios qué datos íbamos a mostrarles. Se puede hacer templates para que el usuario reciba el PBI y pueda seleccionar un rango de fechas según el parámetro establecido. Use or create PBIDs file: se usa en Data Sources para exportar esa fuente de datos y que los usuarios puedan conectarse al servidor y las tablas sin necesidad de tener credenciales. Pueden entrar, seleccionar las tablas que les interesa, y trabajar haciendo visualizaciones con ellas Query type/Conectores: es la forma en que un se conecta para cargar los datos en PBI. Existen muchas fuentes, las más usadas son SQL o AzureSQL y Excel. Otras más generales son: ODBC o Ole db. Hay una que se llama Folder para cargar varios ficheros a la vez. Un saludo!
0 Votos

GuillermoPerdomo39

hace 7 meses

Hola a todos y todas :-) Me gustan mucho las opciones de perfilado de columnas, distribución y calidad porque permiten conocer características importantes del conjunto de datos con apenas un par de clics.
0 Votos

3clj40zvff

hace 4 meses

Ya manejaba una parte de este tema, pero el Column profile no lo había visto. Me parece valioso hacer un precio análisis de nuestros datos para que la transformación y limpieza sea más rápida.
0 Votos

SantiagoVargas673

hace 2 meses

¿Qué aprendiste en la sección “Profile the data”?
Me gusto mucho la parte de identificar los outiers con los graficos de dispersión, adicionalmente también la otra forma como se pueden ver otras estructuras como se pueden presentar los datos (modelo).

 ¿Cómo te servirá esto que aprendiste en tus desarrollos de Power BI?
Sistematizar la manera en como se identifican los errores y como se identifican también posibles outliers y optimizar el tiempo en esta parte de las trasnformaciones y limpieza.

¿Cómo te servirá esto que aprendiste al presentar el examen de certificación?

Posiblemente a entender mejor el tipo de preguntas e integrar los conocimientos previamente adquiridos. 
0 Votos

Manuelmonsalve82

hace 1 mes

Excelente recurso para aprender "Haciendo", la idea es ir practicando lo enseñado y el perfilamiento de los dato en power query es una importante etapa en el análisis de datos.
0 Votos
Es necesario estar inscrito para dejar tu duda, comentario y/o respuesta

Sobre el alumno

dlom

dlom

Cursos completados

No ha completado ningún curso aún

Más preguntas sobre el tema

Ordenar el Eje Y de un grafico de barras Stacked, que tiene dos variables.

GermanQuintana914

Guia para certificacion de Power Bi en Microsoft

Miro

signos - y ( ) en "DX38🔴 - Modelar Estados Financieros desde cero"

Charcho

Duda sobre una matriz relacionada con subtotales

Charcho

Analizar diferencias mes actual con mes anterior

Charcho

Recursos
  • Foro
  • Inscribirse
  • Blog
  • Ejemplos de dashboards
Cursos
  • Aprende Power BI con Proyectos
  • Análisis de Datos con Power BI y Excel
  • Especialización en Power Query
  • Certificación de Power BI
  • Tu Portafolio de Dashboards
Legales
  • Términos del servicio
  • Política de privacidad
  • Política de cookies
  • Contacto
  • Acerca
Canal de YouTube de datdata Cuenta de Linkedin de datdata Cuenta de Instagram de datdata Página de Facebook de datdata Cuenta de TikTok de datdata
© 2025 © datdata - Todos los derechos reservados