Skip to main content

Reporte de IA de la Semana 9 (28/03/25) - (03/04/25)

Logo FisioFind

FISIO FIND - REPORTE DE IA DE LA SEMANA 9 (28/03/25) - (03/04/25)


Ficha del documento

  • Nombre del Proyecto: FISIO FIND

  • Número de Grupo: Grupo 6

  • Entregable: #SPRINT 3

  • Miembros del grupo:
    Alberto Carmona Sicre, Antonio Macías Ferrera, Benjamín Ignacio Maureira Flores, Francisco Capote García,
    Daniel Alors Romero, Daniel Fernández Caballero, Daniel Ruiz López, Daniel Tortorici Bartús,
    Daniel Vela Camacho, Delfín Santana Rubio, Guadalupe Ridruejo Pineda, Julen Redondo Pacheco,
    Miguel Encina Martínez, Francisco Mateos Villarejo, Pablo Fernández Pérez, Ramón Gavira Sánchez,
    Rafael Pulido Cifuentes.

  • Contribuidores: Daniel Fernández Caballero Daniel Ruiz López (autores)

  • Fecha de Creación: 03/04/2025

  • Versión: v1.0


Histórico de Modificaciones

FechaVersiónRealizada porDescripción de los cambios
03/04/2025v1.0Daniel Fernández Caballero, Daniel Ruiz LópezElaboración de la primera versión del documento.

PROMPTS UTILIZADOS

A continuación se presentan los distintos prompts evaluados junto con sus respectivas puntuaciones, cantidad de prompts y porcentaje de alucinaciones.

  1. Prompt 1

    • Puntuación: 5
    • Prompts: 9
    • Alucinaciones: 0%
  2. Prompt 2

    • Puntuación: 5
    • Prompts: 5
    • Alucinaciones: 0%
  3. Prompt 3

    • Puntuación: 5
    • Prompts: 2
    • Alucinaciones: 0%
  4. Prompt 4

    • Puntuación: 5
    • Prompts: 1
    • Alucinaciones: 0%
  5. Prompt 5

    • Puntuación: 5
    • Prompts: 1
    • Alucinaciones: 0%
  6. Prompt 6

    • Puntuación: 5
    • Prompts: 2
    • Alucinaciones: 0%
  7. Prompt 7

    • Puntuación: 5
    • Prompts: 71
    • Alucinaciones: 1.4%
  8. Prompt 8

    • Puntuación: 5
    • Prompts: 9
    • Alucinaciones: 11%
  9. Prompt 9

    • Puntuación: 4.5
    • Prompts: 3
    • Alucinaciones: 33%
  10. Prompt 10

    • Puntuación: 5
    • Prompts: 20
    • Alucinaciones: 25%
  11. Prompt 11

    • Puntuación: 5
    • Prompts: 13
    • Alucinaciones: 0%

ANÁLISIS ESTADÍSTICO

En esta sección, realizaremos un análisis estadístico completo basado en las puntuaciones, el número de prompts y el porcentaje de alucinaciones de los 11 casos documentados en este reporte. Calcularemos medidas como el promedio, la desviación estándar, la distribución y las correlaciones entre las variables, para luego extraer conclusiones sobre el desempeño de la IA.

Datos iniciales

Los datos a analizar son los siguientes:

  • Puntuaciones: 5, 5, 5, 5, 5, 5, 5, 5, 4.5, 5, 5
  • Número de prompts: 9, 5, 2, 1, 1, 2, 71, 9, 3, 20, 13
  • Alucinaciones (%): 0, 0, 0, 0, 0, 0, 1.4, 11, 33, 25, 0

Estos valores corresponden a los 11 prompts evaluados, cada uno con su respectiva puntuación (escala de 1 a 5), cantidad de prompts utilizados y porcentaje de alucinaciones.


Análisis de las puntuaciones

1. Promedio (Media)

Para calcular el promedio de las puntuaciones, sumamos todos los valores y los dividimos entre el número total de casos, que es 11.

Suma de las puntuaciones:
5 + 5 + 5 + 5 + 5 + 5 + 5 + 5 + 4.5 + 5 + 5 = 54.5

Promedio:
54.5 ÷ 11 ≈ 4.95

El promedio de las puntuaciones es 4.95. Esto indica un desempeño excepcionalmente alto de la IA, muy cercano al máximo de la escala (5), reflejando una calidad percibida casi perfecta en las interacciones.

2. Desviación estándar

La desviación estándar mide cuánto se alejan las puntuaciones del promedio. Primero calculamos la varianza.

Paso 1: Calcular la varianza

Restamos el promedio (4.95) a cada puntuación, elevamos al cuadrado, sumamos y dividimos entre 11:
(5 - 4.95)² = 0.0025
(5 - 4.95)² = 0.0025
(5 - 4.95)² = 0.0025
(5 - 4.95)² = 0.0025
(5 - 4.95)² = 0.0025
(5 - 4.95)² = 0.0025
(5 - 4.95)² = 0.0025
(5 - 4.95)² = 0.0025
(4.5 - 4.95)² = 0.2025
(5 - 4.95)² = 0.0025
(5 - 4.95)² = 0.0025

Suma de las diferencias al cuadrado:
0.0025 + 0.0025 + 0.0025 + 0.0025 + 0.0025 + 0.0025 + 0.0025 + 0.0025 + 0.2025 + 0.0025 + 0.0025 = 0.2275

Varianza:
0.2275 ÷ 11 ≈ 0.0207

Paso 2: Calcular la desviación estándar

Desviación estándar:
√0.0207 ≈ 0.14

La desviación estándar es aproximadamente 0.14, indicando una dispersión extremadamente baja. Las puntuaciones están muy concentradas alrededor del promedio de 4.95, mostrando gran consistencia.

3. Distribución de las puntuaciones

Contamos cuántas veces aparece cada valor:

  • 4.5: 1 vez (9.09%)
  • 5: 10 veces (90.91%)

Observación: La puntuación dominante es 5 (90.91%), con un único caso de 4.5. Esto refleja un desempeño casi uniforme y de alta calidad, con mínima variación.


Análisis del número de prompts

1. Promedio (Media)

Sumamos todos los valores del número de prompts y dividimos entre 11.

Suma de los prompts:
9 + 5 + 2 + 1 + 1 + 2 + 71 + 9 + 3 + 20 + 13 = 136

Promedio:
136 ÷ 11 ≈ 12.36

El promedio del número de prompts es 12.36, sugiriendo que las interacciones tienden a ser relativamente largas en promedio, aunque hay una amplia variación.

2. Desviación estándar

Paso 1: Calcular la varianza

Restamos el promedio (12.36) a cada valor, elevamos al cuadrado, sumamos y dividimos entre 11:
(9 - 12.36)² = 11.2896
(5 - 12.36)² = 54.1696
(2 - 12.36)² = 107.6496
(1 - 12.36)² = 129.0496
(1 - 12.36)² = 129.0496
(2 - 12.36)² = 107.6496
(71 - 12.36)² = 3437.0896
(9 - 12.36)² = 11.2896
(3 - 12.36)² = 87.6096
(20 - 12.36)² = 58.3696
(13 - 12.36)² = 0.4096

Suma:
11.2896 + 54.1696 + 107.6496 + 129.0496 + 129.0496 + 107.6496 + 3437.0896 + 11.2896 + 87.6096 + 58.3696 + 0.4096 = 4133.6344

Varianza:
4133.6344 ÷ 11 ≈ 375.785

Paso 2: Calcular la desviación estándar

Desviación estándar:
√375.785 ≈ 19.38

La desviación estándar es 19.38, mostrando una dispersión muy alta debido al valor extremo de 71 prompts.

3. Rango

  • Mínimo: 1 prompt
  • Máximo: 71 prompts
  • Rango = 71 - 1 = 70

Observación: El rango amplio y la alta desviación estándar reflejan una gran variabilidad en la longitud de las interacciones.


Análisis de las alucinaciones

1. Promedio (Media)

Sumamos los porcentajes de alucinaciones y dividimos entre 11:
0 + 0 + 0 + 0 + 0 + 0 + 1.4 + 11 + 33 + 25 + 0 = 70.4

Promedio:
70.4 ÷ 11 ≈ 6.4

El promedio de alucinaciones es 6.4%, indicando que, en general, las respuestas de la IA son bastante precisas, con un bajo nivel de error promedio.

2. Desviación estándar

Paso 1: Calcular la varianza

Restamos el promedio (6.4) a cada valor, elevamos al cuadrado, sumamos y dividimos entre 11:
(0 - 6.4)² = 40.96
(0 - 6.4)² = 40.96
(0 - 6.4)² = 40.96
(0 - 6.4)² = 40.96
(0 - 6.4)² = 40.96
(0 - 6.4)² = 40.96
(1.4 - 6.4)² = 25
(11 - 6.4)² = 21.16
(33 - 6.4)² = 707.56
(25 - 6.4)² = 345.96
(0 - 6.4)² = 40.96

Suma:
40.96 + 40.96 + 40.96 + 40.96 + 40.96 + 40.96 + 25 + 21.16 + 707.56 + 345.96 + 40.96 = 1346.44

Varianza:
1346.44 ÷ 11 ≈ 122.4

Paso 2: Calcular la desviación estándar

Desviación estándar:
√122.4 ≈ 11.06

La desviación estándar es 11.06, indicando una dispersión moderada, influida por valores altos como 33% y 25%.

3. Distribución de las alucinaciones

  • 0%: 7 veces (63.64%)
  • 1.4%: 1 vez (9.09%)
  • 11%: 1 vez (9.09%)
  • 25%: 1 vez (9.09%)
  • 33%: 1 vez (9.09%)

Observación: La mayoría (63.64%) no tiene alucinaciones, pero hay casos aislados con porcentajes significativos (hasta 33%).


Relación entre variables

1. Puntuaciones y número de prompts

  • ∑x = 54.5, ∑y = 136, ∑xy = 5×9 + 5×5 + ... + 5×13 = 672, ∑x² = 247.25, ∑y² = 4136
  • r = [11 × 672 - 54.5 × 136] ÷ √([11 × 247.25 - 54.5²] × [11 × 4136 - 136²])
  • r = [7392 - 7412] ÷ √([2720.75 - 2970.25] × [45496 - 18496]) ≈ -20 ÷ √(-249.5 × 27000) ≈ 0.008

Resultado: Correlación 0.008 (prácticamente nula). No hay relación significativa entre puntuaciones y prompts.

2. Puntuaciones y alucinaciones

  • ∑x = 54.5, ∑y = 70.4, ∑xy = 5×0 + 5×0 + ... + 5×0 = 242.5, ∑x² = 247.25, ∑y² = 1496.36
  • r = [11 × 242.5 - 54.5 × 70.4] ÷ √([11 × 247.25 - 54.5²] × [11 × 1496.36 - 70.4²]) ≈ -1168.9 ÷ √(-249.5 × 11499.84) ≈ -0.69

Resultado: Correlación -0.69 (negativa moderada-fuerte). Más alucinaciones tienden a reducir las puntuaciones.

3. Número de prompts y alucinaciones

  • ∑x = 136, ∑y = 70.4, ∑xy = 9×0 + 5×0 + ... + 13×0 = 614, ∑x² = 4136, ∑y² = 1496.36
  • r = [11 × 614 - 136 × 70.4] ÷ √([11 × 4136 - 136²] × [11 × 1496.36 - 70.4²]) ≈ -2810.4 ÷ √(27000 × 11499.84) ≈ -0.16

Resultado: Correlación -0.16 (negativa débil). Poca relación entre prompts y alucinaciones.


Tendencias y observaciones

  1. Puntuaciones: Promedio de 4.95 y desviación de 0.14 reflejan un desempeño casi perfecto y muy consistente.
  2. Número de prompts: Promedio de 12.36 y desviación de 19.38 muestran gran variabilidad, con un outlier (71).
  3. Alucinaciones: Promedio de 6.4% y desviación de 11.06 indican alta precisión general, pero con casos puntuales de error.
  4. Relaciones: Las alucinaciones afectan negativamente las puntuaciones (-0.69), mientras que el número de prompts tiene un impacto mínimo (0.008 y -0.16).

Conclusión del análisis estadístico

  • Puntuaciones: Promedio de 4.95 y desviación de 0.14 confirman un desempeño sobresaliente y uniforme.
  • Número de prompts: Promedio de 12.36 y alta desviación (19.38) reflejan interacciones de longitud muy variable.
  • Alucinaciones: Promedio de 6.4% y desviación de 11.06 muestran precisión general, con excepciones notables.
  • Relación: Las alucinaciones son el principal factor que reduce las puntuaciones (-0.69), mientras que la cantidad de prompts no influye significativamente.

Aprobado por

Scrum Master: Antonio Macías Ferrera