confident-ai
diff --git a/‎deepeval/evaluate.py
Lines changed: 7 additions & 2 deletions b/‎deepeval/evaluate.py
Lines changed: 7 additions & 2 deletions
diff --git a/‎deepeval/metrics/answer_relevancy/answer_relevancy.py
Lines changed: 38 additions & 29 deletions b/‎deepeval/metrics/answer_relevancy/answer_relevancy.py
Lines changed: 38 additions & 29 deletions
diff --git a/‎deepeval/metrics/base_metric.py
Lines changed: 34 additions & 9 deletions b/‎deepeval/metrics/base_metric.py
Lines changed: 34 additions & 9 deletions
@@ -23,7 +23,12 @@
     ConversationalApiTestCase,
     MetricMetadata,
 )
-from deepeval.utils import get_is_running_deepeval, set_indicator, capture_contextvars, update_contextvars
+from deepeval.utils import (
+    get_is_running_deepeval,
+    set_indicator,
+    capture_contextvars,
+    update_contextvars,
+)
 from deepeval.test_run.cache import (
     test_run_cache_manager,
     Cache,
@@ -300,7 +305,7 @@ async def a_execute_test_cases(
             await measure_metrics_with_indicator(
                 metrics, test_case, cached_test_case, ignore_errors
             )
-            
+
             for metric in metrics:
                 metric_metadata = create_metric_metadata(metric)
                 if isinstance(test_case, ConversationalTestCase):
 
@@ -2,7 +2,7 @@
 from typing import Optional, List, Union
 from pydantic import BaseModel, Field
 
-from deepeval.utils import get_or_create_event_loop
+from deepeval.utils import get_or_create_event_loop, generate_uuid
 from deepeval.metrics.utils import (
     validate_conversational_test_case,
     trimAndLoadJson,
@@ -41,32 +41,38 @@ def __init__(
         strict_mode: bool = False,
     ):
         super().__init__()
-        self._statements: ContextVar[Optional[List[str]]] = ContextVar(f'{self.__class__.__name__}_statements', default=None)
-        self._verdicts: ContextVar[Optional[List[AnswerRelvancyVerdict]]] = ContextVar(f'{self.__class__.__name__}_verdicts', default=None)
+        self._statements: ContextVar[Optional[List[str]]] = ContextVar(
+            generate_uuid(), default=None
+        )
+        self._verdicts: ContextVar[Optional[List[AnswerRelvancyVerdict]]] = (
+            ContextVar(generate_uuid(), default=None)
+        )
         self.threshold = 1 if strict_mode else threshold
         self.model, self.using_native_model = initialize_model(model)
         self.evaluation_model = self.model.get_model_name()
         self.include_reason = include_reason
         self.async_mode = async_mode
         self.strict_mode = strict_mode
-    
+
     @property
     def statements(self) -> Optional[List[str]]:
         return self._statements.get()
+
     @statements.setter
     def statements(self, value: Optional[List[str]]):
         self._statements.set(value)
-        
+
     @property
     def verdicts(self) -> Optional[List[AnswerRelvancyVerdict]]:
         return self._verdicts.get()
+
     @verdicts.setter
     def verdicts(self, value: Optional[List[AnswerRelvancyVerdict]]):
         self._verdicts.set(value)
 
     def measure(
-        self, 
-        test_case: Union[LLMTestCase, ConversationalTestCase], 
+        self,
+        test_case: Union[LLMTestCase, ConversationalTestCase],
         verbose: bool = True,
     ) -> float:
         if isinstance(test_case, ConversationalTestCase):
@@ -78,11 +84,11 @@ def measure(
             if self.async_mode:
                 loop = get_or_create_event_loop()
                 (
-                    self.statements, 
-                    self.verdicts, 
-                    self.score, 
-                    self.reason, 
-                    self.success
+                    self.statements,
+                    self.verdicts,
+                    self.score,
+                    self.reason,
+                    self.success,
                 ) = loop.run_until_complete(
                     self._measure_async(test_case, verbose)
                 )
@@ -95,27 +101,30 @@ def measure(
                 self.reason = self._generate_reason(test_case.input)
                 self.success = self.score >= self.threshold
                 if verbose:
-                    print(f"statements: {self.statements}\nverdicts: {self.verdicts}\n")                
+                    print(
+                        f"statements: {self.statements}\nverdicts: {self.verdicts}\n"
+                    )
                 return self.score
-    
+
     async def _measure_async(
-            self,
-            test_case: Union[LLMTestCase, ConversationalTestCase],
-            verbose: bool):
+        self,
+        test_case: Union[LLMTestCase, ConversationalTestCase],
+        verbose: bool,
+    ):
         await self.a_measure(test_case, _show_indicator=False, verbose=verbose)
         return (
-            self.statements, 
-            self.verdicts, 
-            self.score, 
-            self.reason, 
-            self.success
-            )
+            self.statements,
+            self.verdicts,
+            self.score,
+            self.reason,
+            self.success,
+        )
 
     async def a_measure(
         self,
         test_case: Union[LLMTestCase, ConversationalTestCase],
         _show_indicator: bool = True,
-        verbose: bool = True
+        verbose: bool = True,
     ) -> float:
         if isinstance(test_case, ConversationalTestCase):
             test_case = validate_conversational_test_case(test_case, self)
@@ -128,14 +137,14 @@ async def a_measure(
             self.statements = await self._a_generate_statements(
                 test_case.actual_output
             )
-            self.verdicts = (
-                await self._a_generate_verdicts(test_case.input)
-            )
+            self.verdicts = await self._a_generate_verdicts(test_case.input)
             self.score = self._calculate_score()
             self.reason = await self._a_generate_reason(test_case.input)
             self.success = self.score >= self.threshold
             if verbose:
-                print(f"statements: {self.statements}\nverdicts: {self.verdicts}\nscore: {self.score}, success: {self.success}\n")
+                print(
+                    f"statements: {self.statements}\nverdicts: {self.verdicts}\nscore: {self.score}, success: {self.success}\n"
+                )
             return self.score
 
     async def _a_generate_reason(self, input: str) -> str:
@@ -275,4 +284,4 @@ def is_successful(self) -> bool:
 
     @property
     def __name__(self):
-        return "Answer Relevancy"
+        return "Answer Relevancy"
@@ -1,8 +1,11 @@
 from abc import abstractmethod
 from contextvars import ContextVar
 from typing import Optional, Dict
+import uuid
 
 from deepeval.test_case import LLMTestCase, ConversationalTestCase
+from deepeval.utils import generate_uuid
+
 
 class BaseMetric:
 
@@ -13,57 +16,74 @@ class BaseMetric:
     evaluation_cost: Optional[float] = None
 
     def __init__(self):
-        self._score: ContextVar[Optional[float]] = ContextVar(f'{self.__class__.__name__}_score', default=None)
-        self._score_breakdown: ContextVar[Optional[Dict]] = ContextVar(f'{self.__class__.__name__}_score_breakdown', default=None)
-        self._reason: ContextVar[Optional[str]] = ContextVar(f'{self.__class__.__name__}_reason', default=None)
-        self._success: ContextVar[Optional[bool]] = ContextVar(f'{self.__class__.__name__}_success', default=None)
-        self._error: ContextVar[Optional[str]] = ContextVar(f'{self.__class__.__name__}_error', default=None)
+        self._score: ContextVar[Optional[float]] = ContextVar(
+            generate_uuid(), default=None
+        )
+        self._score_breakdown: ContextVar[Optional[Dict]] = ContextVar(
+            generate_uuid(), default=None
+        )
+        self._reason: ContextVar[Optional[str]] = ContextVar(
+            generate_uuid(), default=None
+        )
+        self._success: ContextVar[Optional[bool]] = ContextVar(
+            generate_uuid(), default=None
+        )
+        self._error: ContextVar[Optional[str]] = ContextVar(
+            generate_uuid(), default=None
+        )
 
     @property
     def score(self) -> Optional[float]:
         return self._score.get()
+
     @score.setter
     def score(self, value: Optional[float]) -> None:
         self._score.set(value)
 
     @property
     def score_breakdown(self) -> Optional[Dict]:
         return self._score_breakdown.get()
+
     @score_breakdown.setter
     def score_breakdown(self, value: Optional[Dict]) -> None:
         self._score_breakdown.set(value)
 
     @property
     def reason(self) -> Optional[str]:
         return self._reason.get()
+
     @reason.setter
     def reason(self, value: Optional[str]) -> None:
         self._reason.set(value)
 
     @property
     def success(self) -> Optional[bool]:
         return self._success.get()
+
     @success.setter
     def success(self, value: Optional[bool]) -> None:
         self._success.set(value)
 
     @property
     def error(self) -> Optional[str]:
         return self._error.get()
+
     @error.setter
     def error(self, value: Optional[str]) -> None:
         self._error.set(value)
 
     @property
     def error(self) -> Optional[str]:
         return self._error.get()
+
     @error.setter
     def error(self, value: Optional[str]) -> None:
         self._error.set(value)
 
     @property
     def threshold(self) -> float:
         return self._threshold
+
     @threshold.setter
     def threshold(self, value: float):
         self._threshold = value
@@ -95,42 +115,47 @@ class BaseConversationalMetric:
     async_mode: bool = False
 
     def __init__(self):
-        self._score = ContextVar(f'{self.__class__.__name__}_score', default=None)
-        self._score_breakdown = ContextVar(f'{self.__class__.__name__}_score_breakdown', default=None)
-        self._reason = ContextVar(f'{self.__class__.__name__}_reason', default=None)
-        self._error = ContextVar(f'{self.__class__.__name__}_error', default=None)
+        self._score = ContextVar(generate_uuid(), default=None)
+        self._score_breakdown = ContextVar(generate_uuid(), default=None)
+        self._reason = ContextVar(generate_uuid(), default=None)
+        self._error = ContextVar(generate_uuid(), default=None)
 
     @property
     def score(self) -> Optional[float]:
         return self._score.get()
+
     @score.setter
     def score(self, value: Optional[float]) -> None:
         self._score.set(value)
 
     @property
     def score_breakdown(self) -> Optional[Dict]:
         return self._score_breakdown.get()
+
     @score_breakdown.setter
     def score_breakdown(self, value: Optional[Dict]) -> None:
         self._score_breakdown.set(value)
 
     @property
     def reason(self) -> Optional[str]:
         return self._reason.get()
+
     @reason.setter
     def reason(self, value: Optional[str]) -> None:
         self._reason.set(value)
 
     @property
     def error(self) -> Optional[str]:
         return self._error.get()
+
     @error.setter
     def error(self, value: Optional[str]) -> None:
         self._error.set(value)
 
     @property
     def threshold(self) -> float:
         return self._threshold
+
     @threshold.setter
     def threshold(self, value: float):
         self._threshold = value