Overview
Brought to you by YData
Dataset statistics
| Number of variables | 3 |
|---|---|
| Number of observations | 384 |
| Missing cells | 0 |
| Missing cells (%) | 0.0% |
| Duplicate rows | 0 |
| Duplicate rows (%) | 0.0% |
| Total size in memory | 9.1 KiB |
| Average record size in memory | 24.3 B |
Variable types
| Text | 2 |
|---|---|
| Categorical | 1 |
id has unique values | Unique |
Reproduction
| Analysis started | 2025-05-19 18:48:56.849740 |
|---|---|
| Analysis finished | 2025-05-19 18:48:57.001717 |
| Duration | 0.15 seconds |
| Software version | ydata-profiling v0.0.dev0 |
| Download configuration | config.json |
Variables
id
Text
Unique 
| Distinct | 384 |
|---|---|
| Distinct (%) | 100.0% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 3.1 KiB |
Length
| Max length | 21 |
|---|---|
| Median length | 21 |
| Mean length | 21 |
| Min length | 21 |
Unique
| Unique | 384 ? |
|---|---|
| Unique (%) | 100.0% |
Sample
| 1st row | bd092dc4-258b4946.mp3 |
|---|---|
| 2nd row | 83a42fd2-5a60a316.mp3 |
| 3rd row | 149f9d27-786ae24b.mp3 |
| 4th row | fd896984-3d60c0dc.mp3 |
| 5th row | 5d87d5fb-34a2beb0.mp3 |
| Value | Count | Frequency (%) |
| 44504e5e-efa13ac2.mp3 | 1 | 0.3% |
| 5561638e-33863859.mp3 | 1 | 0.3% |
| 0670e28d-40ec8c8e.mp3 | 1 | 0.3% |
| b4f0775c-a24a477e.mp3 | 1 | 0.3% |
| 5dedffb4-17454133.mp3 | 1 | 0.3% |
| ef4ff8e3-42137657.mp3 | 1 | 0.3% |
| 4a227eed-3b795374.mp3 | 1 | 0.3% |
| bd5d089e-153538d5.mp3 | 1 | 0.3% |
| a7efadc9-b8f780a1.mp3 | 1 | 0.3% |
| 3cc21a2a-303227eb.mp3 | 1 | 0.3% |
| Other values (374) | 374 |
Most occurring characters
| Value | Count | Frequency (%) |
| 3 | 766 | 9.5% |
| 4 | 409 | 5.1% |
| 2 | 404 | 5.0% |
| 0 | 404 | 5.0% |
| 9 | 395 | 4.9% |
| c | 391 | 4.8% |
| 7 | 390 | 4.8% |
| 5 | 388 | 4.8% |
| 8 | 386 | 4.8% |
| m | 384 | 4.8% |
| Other values (10) | 3747 |
Most occurring categories
| Value | Count | Frequency (%) |
| (unknown) | 8064 |
Most frequent character per category
(unknown)
| Value | Count | Frequency (%) |
| 3 | 766 | 9.5% |
| 4 | 409 | 5.1% |
| 2 | 404 | 5.0% |
| 0 | 404 | 5.0% |
| 9 | 395 | 4.9% |
| c | 391 | 4.8% |
| 7 | 390 | 4.8% |
| 5 | 388 | 4.8% |
| 8 | 386 | 4.8% |
| m | 384 | 4.8% |
| Other values (10) | 3747 |
Most occurring scripts
| Value | Count | Frequency (%) |
| (unknown) | 8064 |
Most frequent character per script
(unknown)
| Value | Count | Frequency (%) |
| 3 | 766 | 9.5% |
| 4 | 409 | 5.1% |
| 2 | 404 | 5.0% |
| 0 | 404 | 5.0% |
| 9 | 395 | 4.9% |
| c | 391 | 4.8% |
| 7 | 390 | 4.8% |
| 5 | 388 | 4.8% |
| 8 | 386 | 4.8% |
| m | 384 | 4.8% |
| Other values (10) | 3747 |
Most occurring blocks
| Value | Count | Frequency (%) |
| (unknown) | 8064 |
Most frequent character per block
(unknown)
| Value | Count | Frequency (%) |
| 3 | 766 | 9.5% |
| 4 | 409 | 5.1% |
| 2 | 404 | 5.0% |
| 0 | 404 | 5.0% |
| 9 | 395 | 4.9% |
| c | 391 | 4.8% |
| 7 | 390 | 4.8% |
| 5 | 388 | 4.8% |
| 8 | 386 | 4.8% |
| m | 384 | 4.8% |
| Other values (10) | 3747 |
label
Categorical
| Distinct | 6 |
|---|---|
| Distinct (%) | 1.6% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 3.1 KiB |
| neutral | |
|---|---|
| disgust | |
| anger | |
| joy | |
| sadness |
Length
| Max length | 7 |
|---|---|
| Median length | 7 |
| Mean length | 6.2317708 |
| Min length | 3 |
Unique
| Unique | 0 ? |
|---|---|
| Unique (%) | 0.0% |
Sample
| 1st row | neutral |
|---|---|
| 2nd row | disgust |
| 3rd row | neutral |
| 4th row | disgust |
| 5th row | disgust |
Common Values
| Value | Count | Frequency (%) |
| neutral | 149 | |
| disgust | 91 | |
| anger | 51 | 13.3% |
| joy | 46 | 12.0% |
| sadness | 44 | 11.5% |
| fear | 3 | 0.8% |
Length
Histogram of lengths of the category
Common Values (Plot)
| Value | Count | Frequency (%) |
| neutral | 149 | |
| disgust | 91 | |
| anger | 51 | 13.3% |
| joy | 46 | 12.0% |
| sadness | 44 | 11.5% |
| fear | 3 | 0.8% |
Most occurring characters
| Value | Count | Frequency (%) |
| s | 314 | |
| a | 247 | |
| e | 247 | |
| n | 244 | |
| u | 240 | |
| t | 240 | |
| r | 203 | |
| l | 149 | |
| g | 142 | |
| d | 135 | |
| Other values (5) | 232 |
Most occurring categories
| Value | Count | Frequency (%) |
| (unknown) | 2393 |
Most frequent character per category
(unknown)
| Value | Count | Frequency (%) |
| s | 314 | |
| a | 247 | |
| e | 247 | |
| n | 244 | |
| u | 240 | |
| t | 240 | |
| r | 203 | |
| l | 149 | |
| g | 142 | |
| d | 135 | |
| Other values (5) | 232 |
Most occurring scripts
| Value | Count | Frequency (%) |
| (unknown) | 2393 |
Most frequent character per script
(unknown)
| Value | Count | Frequency (%) |
| s | 314 | |
| a | 247 | |
| e | 247 | |
| n | 244 | |
| u | 240 | |
| t | 240 | |
| r | 203 | |
| l | 149 | |
| g | 142 | |
| d | 135 | |
| Other values (5) | 232 |
Most occurring blocks
| Value | Count | Frequency (%) |
| (unknown) | 2393 |
Most frequent character per block
(unknown)
| Value | Count | Frequency (%) |
| s | 314 | |
| a | 247 | |
| e | 247 | |
| n | 244 | |
| u | 240 | |
| t | 240 | |
| r | 203 | |
| l | 149 | |
| g | 142 | |
| d | 135 | |
| Other values (5) | 232 |
transcription
Text
| Distinct | 383 |
|---|---|
| Distinct (%) | 99.7% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 3.1 KiB |
Length
| Max length | 304 |
|---|---|
| Median length | 202 |
| Mean length | 153.80729 |
| Min length | 2 |
Unique
| Unique | 382 ? |
|---|---|
| Unique (%) | 99.5% |
Sample
| 1st row | El precio de la luz baja, entre otras cosas, porque baja el precio del gas. Está en su nivel más bajo desde verano porque baja también la demanda por las altas temperaturas y porque las reservas de gas |
|---|---|
| 2nd row | Del 25% en el conjunto de la nación, del 40% en el sur, de eso vivía el socialismo, de decir que no éramos un país laborioso, que tenían que venir ellos a rescatar a la gente en sus trabajos. |
| 3rd row | Pues si, tenían grandes altavoces, la música estaba muy alta, al principio pensaban que eran petardos pero no tardaron en darse cuenta. |
| 4th row | Tengo aquí en mis manos un auto de ejecución de una sentencia al que piden al Ayuntamiento de Torremolinos 880.000 euros. |
| 5th row | que en el Partido Popular no solo no se toleran irregularidades, |
| Value | Count | Frequency (%) |
| de | 636 | 6.1% |
| que | 399 | 3.9% |
| la | 344 | 3.3% |
| y | 287 | 2.8% |
| en | 263 | 2.5% |
| a | 258 | 2.5% |
| el | 251 | 2.4% |
| los | 180 | 1.7% |
| no | 144 | 1.4% |
| es | 125 | 1.2% |
| Other values (2927) | 7458 |
Most occurring characters
| Value | Count | Frequency (%) |
| 9962 | ||
| e | 6139 | 10.4% |
| a | 5628 | 9.5% |
| o | 4149 | 7.0% |
| s | 3640 | 6.2% |
| n | 3316 | 5.6% |
| r | 3003 | 5.1% |
| i | 2615 | 4.4% |
| d | 2400 | 4.1% |
| l | 2274 | 3.9% |
| Other values (70) | 15936 |
Most occurring categories
| Value | Count | Frequency (%) |
| (unknown) | 59062 |
Most frequent character per category
(unknown)
| Value | Count | Frequency (%) |
| 9962 | ||
| e | 6139 | 10.4% |
| a | 5628 | 9.5% |
| o | 4149 | 7.0% |
| s | 3640 | 6.2% |
| n | 3316 | 5.6% |
| r | 3003 | 5.1% |
| i | 2615 | 4.4% |
| d | 2400 | 4.1% |
| l | 2274 | 3.9% |
| Other values (70) | 15936 |
Most occurring scripts
| Value | Count | Frequency (%) |
| (unknown) | 59062 |
Most frequent character per script
(unknown)
| Value | Count | Frequency (%) |
| 9962 | ||
| e | 6139 | 10.4% |
| a | 5628 | 9.5% |
| o | 4149 | 7.0% |
| s | 3640 | 6.2% |
| n | 3316 | 5.6% |
| r | 3003 | 5.1% |
| i | 2615 | 4.4% |
| d | 2400 | 4.1% |
| l | 2274 | 3.9% |
| Other values (70) | 15936 |
Most occurring blocks
| Value | Count | Frequency (%) |
| (unknown) | 59062 |
Most frequent character per block
(unknown)
| Value | Count | Frequency (%) |
| 9962 | ||
| e | 6139 | 10.4% |
| a | 5628 | 9.5% |
| o | 4149 | 7.0% |
| s | 3640 | 6.2% |
| n | 3316 | 5.6% |
| r | 3003 | 5.1% |
| i | 2615 | 4.4% |
| d | 2400 | 4.1% |
| l | 2274 | 3.9% |
| Other values (70) | 15936 |
Missing values
A simple visualization of nullity by column.
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.
Sample
| id | label | transcription | |
|---|---|---|---|
| 0 | bd092dc4-258b4946.mp3 | neutral | El precio de la luz baja, entre otras cosas, porque baja el precio del gas. Está en su nivel más bajo desde verano porque baja también la demanda por las altas temperaturas y porque las reservas de gas |
| 1 | 83a42fd2-5a60a316.mp3 | disgust | Del 25% en el conjunto de la nación, del 40% en el sur, de eso vivía el socialismo, de decir que no éramos un país laborioso, que tenían que venir ellos a rescatar a la gente en sus trabajos. |
| 2 | 149f9d27-786ae24b.mp3 | neutral | Pues si, tenían grandes altavoces, la música estaba muy alta, al principio pensaban que eran petardos pero no tardaron en darse cuenta. |
| 3 | fd896984-3d60c0dc.mp3 | disgust | Tengo aquí en mis manos un auto de ejecución de una sentencia al que piden al Ayuntamiento de Torremolinos 880.000 euros. |
| 4 | 5d87d5fb-34a2beb0.mp3 | disgust | que en el Partido Popular no solo no se toleran irregularidades, |
| 5 | 36988223-482facc5.mp3 | neutral | Es el caso de muchos jóvenes en España. Tienen sueldos bajos y dedican un gran porcentaje de esos salarios a pagar el alquiler. |
| 6 | 2d47a3e5-19920ec1.mp3 | disgust | De Gobierno, la autonomía de Cantabria se ha convertido en la sumisión de Cantabria. |
| 7 | 50c58bc0-d46910e0.mp3 | neutral | Este paro del transporte por carretera está teniendo graves consecuencias en distintos sectores llevándoles a muchos de ellos al límite. Lucía Rodríguez |
| 8 | 9b782ffd-35f213f0.mp3 | anger | Lo está diciendo, lo ha dicho el señor Egea. El señor Egea ha dicho que el Partido Popular de Madrid tiene bastante que callar en cuanto a corrupción en esta región. |
| 9 | 74bfa90d-ed94a61c.mp3 | disgust | ¿Por qué no se ha sustituido esa tarjeta de residencia y permiso de residencia efectivo en Melilla por el pasaporte? |
| id | label | transcription | |
|---|---|---|---|
| 374 | 381808b0-35924128.mp3 | neutral | El 20% de la producción china está parada y eso tiene muchas consecuencias. Aquí se dedican a reparar teléfonos y ya nos dicen que faltan algunas piezas. Además, hoy vamos a intentar comprar un teléfono de alta gama. ¿Lo conseguiremos? |
| 375 | b9603c6c-09e41db0.mp3 | neutral | Muy buenos días, gracias por su atención. |
| 376 | 69ddc95e-9959a5a8.mp3 | anger | Y usted haga el favor de mandarle el recado al líder de su banda criminal, el señor Sánchez, y dígale que se vaya de una vez a liderar la internacional socialista |
| 377 | 0a3b8e02-d5989d15.mp3 | anger | 5 nombres y los que faltan, 5 cargos y los que quedan, y más de 500.000 euros gastados y los que vendemos. |
| 378 | 5990f0bf-a2c1fc62.mp3 | neutral | con el equipo y todo el rollo. Pero tenemos que tener cuidado también entre nosotros. Llevamos casi dos meses juntos y es normal la convivencia, pero a veces veo cosas que no me gustan, que os habláis mal y eso si no lo controlamos |
| 379 | 584b40d9-c7bbd246.mp3 | neutral | Otras restricciones también se levantan a medida que mejoran los datos de la pandemia. Lucía Rodríguez. |
| 380 | e4769654-26e79377.mp3 | disgust | Yo no quiero que me invite a café, simplemente que me responda a las preguntas, porque… |
| 381 | f9d06696-1d262f82.mp3 | joy | que da vergüenza que yo la nombre, pero la voy a nombrar porque es una pieza indispensable en este proyecto. ¿Quién más me queda? Bueno, mis compañeros de reparto. Y compartir mi alegría con mi familia |
| 382 | 160f3c32-f64924bd.mp3 | neutral | España y Portugal han logrado el visto bueno de Bruselas para limitar el precio del gas. El tope será de 50 euros el megawatt hora y conseguirá reducir la factura de la luz en gran medida. |
| 383 | 66cad6df-18723a94.mp3 | neutral | con la herida abierta porque estás mostrando la herida. Un día me dijo un sabio maestro dice, Roncero, nunca enseñes la herida ante el enemigo y no estás mostrando la herida. Por un día voy a dar la rosera a Jota Jordi. Yo si fuera culés, ¿sabes qué diría hoy? Messi, te hemos querido mucho, hemos |