Skip to main content

Informe de IA de la Semana 7 (14/03/25) - (20/03/25)

Logo FisioFind

FISIO FIND - INFORME DE IA (14/03/25) - (20/03/25)

Ficha del documento

  • Nombre del Proyecto: FISIO FIND

  • Número de Grupo: Grupo 6

  • Entregable: #SPRINT 1

  • Miembros del grupo:
    Alberto Carmona Sicre, Antonio Macías Ferrera, Benjamín Ignacio Maureira Flores, Francisco Capote García,
    Daniel Alors Romero, Daniel Fernández Caballero, Daniel Ruiz López, Daniel Tortorici Bartús,
    Daniel Vela Camacho, Delfín Santana Rubio, Guadalupe Ridruejo Pineda, Julen Redondo Pacheco,
    Miguel Encina Martínez, Francisco Mateos Villarejo, Pablo Fernández Pérez, Ramón Gavira Sánchez,
    Rafael Pulido Cifuentes.

  • Contribuidores: Daniel Fernández Caballero Daniel Ruiz López (autores)

  • Fecha de Creación: 12/03/2025

  • Versión: v1.0


Histórico de Modificaciones

FechaVersiónRealizada porDescripción de los cambios
12/03/2025v1.0Daniel Fernández Caballero, Daniel Ruiz LópezElaboración de la primera versión del documento.

INTRODUCCIÓN

Para el primer Sprint, tras la revisión intermedia del trabajo, se decidió implementar métricas cuantitativas para evaluar la efectividad de la IA en función de los prompts utilizados. Las métricas establecidas son las siguientes:

  • Calificación de conversaciones (escala de 1 a 5).
  • Cantidad de prompts empleados en cada conversación.
  • Análisis estadístico de estos datos, incluyendo promedio, desviación estándar y tendencias.

Además, debido a la rectificación del equipo respecto a las métricas, se realizará una diferenciación entre los prompts utilizados en la primera y la segunda semana.

En general, todos los integrantes se han ceñido al ia commitment, utilizando a la ia siempre con finalidades éticas y revisando sus resultados para siempre tener una última revisión humana.

PROMPTS UTILIZADOS

A continuación se presentan los distintos prompts evaluados junto con sus respectivas puntuaciones:

  1. Prompt 1

    • Puntuación: 5
    • Prompts: 2
  2. Prompt 2

    • Puntuación: 4
    • Prompts: 3
  3. Prompt 3

    • Puntuación: 4
    • Prompts: 1
  4. Prompt 4

    • Puntuación: 5
    • Prompts: 1
  5. Prompt 5

    • Puntuación: 3
    • Prompts: 1
  6. Prompt 6

    • Puntuación: 4
    • Prompts: 4
  7. Prompt 7

    • Puntuación: 3
    • Prompts: 9

Análisis estadístico

En esta sección, realizaremos un análisis estadístico completo basado en las puntuaciones y el número de prompts de los 7 casos documentados en este reporte. Calcularemos medidas como el promedio, la desviación estándar, la distribución y la correlación entre las variables, para luego extraer conclusiones sobre el desempeño de la IA.

Datos iniciales

Los datos a analizar son los siguientes:

  • Puntuaciones: 5, 4, 4, 5, 3, 4, 3
  • Número de prompts: 2, 3, 1, 1, 1, 4, 9

Análisis de las puntuaciones

1. Promedio (Media)

Suma = 5 + 4 + 4 + 5 + 3 + 4 + 3 = 28
Promedio = 28 / 7 = 4

El promedio de las puntuaciones es 4. Esto indica un desempeño positivo, por encima del punto medio (2.5 en una escala de 0 a 5).


2. Desviación estándar

Diferencias al cuadrado:
(5-4)² = 1
(4-4)² = 0
(4-4)² = 0
(5-4)² = 1
(3-4)² = 1
(4-4)² = 0
(3-4)² = 1

Suma = 1 + 0 + 0 + 1 + 1 + 0 + 1 = 4
Varianza = 4 / 7 ≈ 0.5714
Desviación estándar = √0.5714 ≈ 0.76

La desviación estándar es aproximadamente 0.76, lo que refleja baja dispersión y consistencia entre las puntuaciones.


3. Distribución de las puntuaciones

  • 3: 2 veces (28.57%)
  • 4: 3 veces (42.86%)
  • 5: 2 veces (28.57%)

Observación: No hay puntuaciones por debajo de 3. La mayoría son 4 o 5 (71.43%), lo que sugiere una tendencia positiva generalizada.


Análisis del número de prompts

1. Promedio (Media)

Suma = 2 + 3 + 1 + 1 + 1 + 4 + 9 = 21
Promedio = 21 / 7 = 3

El promedio del número de prompts es 3.


2. Desviación estándar

Diferencias al cuadrado:
(2-3)² = 1
(3-3)² = 0
(1-3)² = 4
(1-3)² = 4
(1-3)² = 4
(4-3)² = 1
(9-3)² = 36

Suma = 1 + 0 + 4 + 4 + 4 + 1 + 36 = 50
Varianza = 50 / 7 ≈ 7.14
Desviación estándar = √7.14 ≈ 2.67

La desviación estándar es 2.67, lo que refleja una dispersión significativa, en especial por el valor de 9.


3. Rango

Rango = Máximo - Mínimo = 9 - 1 = 8

Los prompts van desde 1 hasta 9, mostrando una gran variabilidad.


Relación entre puntuaciones y número de prompts

Se calcula el coeficiente de correlación de Pearson.

Suma de puntuaciones (∑x) = 28
Suma de prompts (∑y) = 21
∑xy = 5×2 + 4×3 + 4×1 + 5×1 + 3×1 + 4×4 + 3×9 = 77
∑x² = 5² + 4² + 4² + 5² + 3² + 4² + 3² = 116
∑y² = 2² + 3² + 1² + 1² + 1² + 4² + 9² = 113
n = 7

r = [7×77 - 28×21] / √[(7×116 - 28²)(7×113 - 21²)]
r = (539 - 588) / √[(812 - 784)(791 - 441)]
r = -49 / √[28 × 350] = -49 / √9800 ≈ -49 / 98.99 ≈ -0.49

El coeficiente de correlación es -0.49.

Interpretación: Correlación negativa moderada. A mayor número de prompts, tiende a disminuir la puntuación.


Tendencias y observaciones

  1. Puntuaciones:

    • Promedio de 4
    • Baja dispersión (0.76)
    • Puntuaciones ≥ 3 en todos los casos
  2. Número de prompts:

    • Promedio de 3
    • Alta dispersión (2.67)
    • Influencia fuerte de un outlier (9)
  3. Relación entre variables:

    • Correlación negativa moderada (-0.49)
    • Prompts más largos tienden a correlacionarse con puntuaciones más bajas

Conclusión del análisis estadístico

  • Puntuaciones: Buen desempeño y consistencia (media 4, desviación 0.76)
  • Prompts: Alta variabilidad (media 3, desviación 2.67)
  • Relación: Más prompts no implica mejor resultado. Hay una tendencia inversa moderada.

Este análisis apoya la importancia de diseñar prompts concisos y efectivos.


Aprobado por

Scrum Master: Antonio Macías Ferrera