fix: correct thresholds in llm analysis bar chart

Strum355 · Strum355 · commit f4f61761a31f · 2025-08-28T15:33:48.000+01:00
diff --git a/src/llmAnalysis.ts b/src/llmAnalysis.ts
@@ -35,7 +35,7 @@ export interface ModelCardResponse {
             higher_is_better: boolean,
             score: number,
             thresholds: {
-                name: string,
+                impact: 'no_measurable' | 'very_low' | 'low' | 'moderate' | 'high' | 'severe',
                 category: number,
                 interpretation: string,
                 upper: number,
diff --git a/src/llmAnalysisReport.hbs b/src/llmAnalysisReport.hbs
@@ -517,9 +517,27 @@
                 font-weight: 600;
             }
 
-            .impact-high {
-                background: #f8d7da;
-                color: #721c24;
+            .impact-no_measurable {
+                background: #c8e6c9;
+                color: #2e7d32;
+                padding: 0.2rem 0.5rem;
+                border-radius: 3px;
+                font-size: 0.8rem;
+                font-weight: 600;
+            }
+
+            .impact-very_low {
+                background: #26a69a;
+                color: #ffffff;
+                padding: 0.2rem 0.5rem;
+                border-radius: 3px;
+                font-size: 0.8rem;
+                font-weight: 600;
+            }
+
+            .impact-low {
+                background: #d1ecf1;
+                color: #0c5460;
                 padding: 0.2rem 0.5rem;
                 border-radius: 3px;
                 font-size: 0.8rem;
@@ -535,9 +553,18 @@
                 font-weight: 600;
             }
 
-            .impact-low {
-                background: #d4edda;
-                color: #155724;
+            .impact-high {
+                background: #ffeaa7;
+                color: #b7550a;
+                padding: 0.2rem 0.5rem;
+                border-radius: 3px;
+                font-size: 0.8rem;
+                font-weight: 600;
+            }
+
+            .impact-severe {
+                background: #f8d7da;
+                color: #721c24;
                 padding: 0.2rem 0.5rem;
                 border-radius: 3px;
                 font-size: 0.8rem;
@@ -615,19 +642,31 @@
                 <div class="legend-items">
                     <div class="legend-item">
                         <div class="legend-color" style="background-color: #F44336;"></div>
-                        <span>High Impact</span>
+                        <span>Severe</span>
+                    </div>
+                    <div class="legend-item">
+                        <div class="legend-color" style="background-color: #FF5722;"></div>
+                        <span>High</span>
                     </div>
                     <div class="legend-item">
                         <div class="legend-color" style="background-color: #FF9800;"></div>
-                        <span>Moderate Impact</span>
+                        <span>Moderate</span>
+                    </div>
+                    <div class="legend-item">
+                        <div class="legend-color" style="background-color: #8BC34A;"></div>
+                        <span>Low</span>
+                    </div>
+                    <div class="legend-item">
+                        <div class="legend-color" style="background-color: #26A69A;"></div>
+                        <span>Very Low</span>
                     </div>
                     <div class="legend-item">
-                        <div class="legend-color" style="background-color: #4CAF50;"></div>
-                        <span>Low Impact</span>
+                        <div class="legend-color" style="background-color: #C8E6C9;"></div>
+                        <span>No Measurable Impact</span>
                     </div>
                     <div class="legend-item">
                         <div class="legend-color" style="background-color: #9E9E9E;"></div>
-                        <span>Unknown Impact</span>
+                        <span>Unknown</span>
                     </div>
                 </div>
             </div>
@@ -736,7 +775,7 @@
                                             <tr id="metric-{{taskName}}-{{name}}">
                                                 <td><span class="metric-name">{{name}}</span></td>
                                                 <td><span class="metric-score">{{score}}</span></td>
-                                                <td><span class="impact-{{impactLevel}}">{{impactLevel}}</span></td>
+                                                <td><span class="impact-{{impactLevel}}">{{impactDisplayName}}</span></td>
                                                 <td><span class="metric-categories">{{categories}}</span></td>
                                                 <td>
                                                     {{#relatedGuardrails.length}}
diff --git a/src/llmAnalysisReportPanel.ts b/src/llmAnalysisReportPanel.ts
@@ -56,33 +56,41 @@ export class LLMAnalysisReportPanel {
     LLMAnalysisReportPanel.currentPanel = new LLMAnalysisReportPanel(column);
   }
 
-  private getImpactLevel(metric: any): string {
+  private getImpactLevel(metric: ModelCardResponse['tasks'][0]['metrics'][0]): string {
     if (!metric.thresholds || metric.thresholds.length === 0) {
       return 'unknown';
     }
 
     const score = metric.score;
     for (const threshold of metric.thresholds) {
       if (score >= threshold.lower && score <= threshold.upper) {
-        // Map threshold categories to impact levels
-        if (threshold.category <= 2) {
-          return 'low';
-        }
-        if (threshold.category <= 4) {
-          return 'moderate';
-        }
-        return 'high';
+        return threshold.impact;
       }
     }
     return 'unknown';
   }
 
   private getImpactColor(impactLevel: string): string {
     switch (impactLevel) {
-      case 'low': return '#4CAF50';      // Green
-      case 'moderate': return '#FF9800';  // Orange
-      case 'high': return '#F44336';      // Red
-      default: return '#9E9E9E';          // Gray
+      case 'no_measurable': return '#C8E6C9';  // Visible light green
+      case 'very_low': return '#26A69A';       // Blue-green
+      case 'low': return '#8BC34A';            // Light green
+      case 'moderate': return '#FF9800';       // Orange
+      case 'high': return '#FF5722';           // Red-orange
+      case 'severe': return '#F44336';         // Red
+      default: return '#9E9E9E';               // Gray
+    }
+  }
+
+  private getImpactDisplayName(impactLevel: string): string {
+    switch (impactLevel) {
+      case 'no_measurable': return 'No Measurable Impact';
+      case 'very_low': return 'Very Low';
+      case 'low': return 'Low';
+      case 'moderate': return 'Moderate';
+      case 'high': return 'High';
+      case 'severe': return 'Severe';
+      default: return 'Unknown';
     }
   }
 
@@ -154,7 +162,17 @@ export class LLMAnalysisReportPanel {
 
     // Sort by required metrics first, then by impact level
     allMetrics.sort((a, b) => {
-      const impactOrder: { [key: string]: number } = { 'high': 0, 'moderate': 1, 'low': 2, 'unknown': 3 };
+      const impactOrder: { [key: string]: number } = {
+        'severe': 0,
+        'high': 1,
+        'moderate': 2,
+        'low': 3,
+        // eslint-disable-next-line @typescript-eslint/naming-convention
+        'very_low': 4,
+        // eslint-disable-next-line @typescript-eslint/naming-convention
+        'no_measurable': 5,
+        'unknown': 6,
+      };
       return impactOrder[a.impactLevel] - impactOrder[b.impactLevel];
     });
 
@@ -199,12 +217,14 @@ export class LLMAnalysisReportPanel {
         const metricKey = `${task.name}:${metric.name}`;
         const relatedGuardrailIds = metricToGuardrails.get(metricKey) || [];
 
+        const impactLevel = this.getImpactLevel(metric);
         return {
           name: metric.name,
           score: metric.score,
           categories: metric.categories,
           higherIsBetter: metric.higher_is_better,
-          impactLevel: this.getImpactLevel(metric),
+          impactLevel: impactLevel,
+          impactDisplayName: this.getImpactDisplayName(impactLevel),
           relatedGuardrails: relatedGuardrailIds
             .filter(id => recommendedGuardrails.some(g => g.id === id))
             .map(id => {
@@ -222,6 +242,7 @@ export class LLMAnalysisReportPanel {
       data: JSON.stringify(allMetrics.map(m => m.metric.score)),
       colors: JSON.stringify(allMetrics.map(m => this.getImpactColor(m.impactLevel))),
       impactLevels: JSON.stringify(allMetrics.map(m => m.impactLevel)),
+      impactDisplayNames: JSON.stringify(allMetrics.map(m => this.getImpactDisplayName(m.impactLevel))),
       tasks: enrichedTasks,
       contextData: {
         modelSource: resp.config.model_source,