confident-ai
diff --git a/‎deepeval/metrics/answer_relevancy/answer_relevancy.py
Lines changed: 8 additions & 13 deletions b/‎deepeval/metrics/answer_relevancy/answer_relevancy.py
Lines changed: 8 additions & 13 deletions
diff --git a/‎deepeval/metrics/base_metric.py
Lines changed: 2 additions & 0 deletions b/‎deepeval/metrics/base_metric.py
Lines changed: 2 additions & 0 deletions
diff --git a/‎deepeval/metrics/bias/bias.py
Lines changed: 7 additions & 11 deletions b/‎deepeval/metrics/bias/bias.py
Lines changed: 7 additions & 11 deletions
diff --git a/‎deepeval/metrics/contextual_precision/contextual_precision.py
Lines changed: 6 additions & 9 deletions b/‎deepeval/metrics/contextual_precision/contextual_precision.py
Lines changed: 6 additions & 9 deletions
diff --git a/‎deepeval/metrics/contextual_recall/contextual_recall.py
Lines changed: 6 additions & 9 deletions b/‎deepeval/metrics/contextual_recall/contextual_recall.py
Lines changed: 6 additions & 9 deletions
diff --git a/‎deepeval/metrics/contextual_relevancy/contextual_relevancy.py
Lines changed: 6 additions & 9 deletions b/‎deepeval/metrics/contextual_relevancy/contextual_relevancy.py
Lines changed: 6 additions & 9 deletions
@@ -54,6 +54,7 @@ def __init__(
         include_reason: bool = True,
         async_mode: bool = True,
         strict_mode: bool = False,
+        verbose_mode: bool = False,
     ):
         super().__init__()
         self._statements: ContextVar[Optional[List[str]]] = ContextVar(
@@ -68,11 +69,10 @@ def __init__(
         self.include_reason = include_reason
         self.async_mode = async_mode
         self.strict_mode = strict_mode
+        self.verbose_mode = verbose_mode
 
     def measure(
-        self,
-        test_case: Union[LLMTestCase, ConversationalTestCase],
-        verbose: bool = True,
+        self, test_case: Union[LLMTestCase, ConversationalTestCase]
     ) -> float:
         if isinstance(test_case, ConversationalTestCase):
             test_case = validate_conversational_test_case(test_case, self)
@@ -88,9 +88,7 @@ def measure(
                     self.score,
                     self.reason,
                     self.success,
-                ) = loop.run_until_complete(
-                    self._measure_async(test_case, verbose)
-                )
+                ) = loop.run_until_complete(self._measure_async(test_case))
             else:
                 self.statements: List[str] = self._generate_statements(
                     test_case.actual_output
@@ -101,7 +99,7 @@ def measure(
                 self.score = self._calculate_score()
                 self.reason = self._generate_reason(test_case.input)
                 self.success = self.score >= self.threshold
-                if verbose:
+                if self.verbose_mode:
                     print(
                         f"statements: {self.statements}\nverdicts: {self.verdicts}\n"
                     )
@@ -111,7 +109,6 @@ async def a_measure(
         self,
         test_case: Union[LLMTestCase, ConversationalTestCase],
         _show_indicator: bool = True,
-        verbose: bool = True,
     ) -> float:
         if isinstance(test_case, ConversationalTestCase):
             test_case = validate_conversational_test_case(test_case, self)
@@ -130,18 +127,16 @@ async def a_measure(
             self.score = self._calculate_score()
             self.reason = await self._a_generate_reason(test_case.input)
             self.success = self.score >= self.threshold
-            if verbose:
+            if self.verbose_mode:
                 print(
                     f"statements: {self.statements}\nverdicts: {self.verdicts}\nscore: {self.score}, success: {self.success}\n"
                 )
             return self.score
 
     async def _measure_async(
-        self,
-        test_case: Union[LLMTestCase, ConversationalTestCase],
-        verbose: bool,
+        self, test_case: Union[LLMTestCase, ConversationalTestCase]
     ):
-        await self.a_measure(test_case, _show_indicator=False, verbose=verbose)
+        await self.a_measure(test_case, _show_indicator=False)
         return (
             self.statements,
             self.verdicts,
 
@@ -12,6 +12,7 @@ class BaseMetric:
     evaluation_model: Optional[str] = None
     strict_mode: bool = False
     async_mode: bool = True
+    verbose_mode: bool = False
     include_reason: bool = False
     evaluation_cost: Optional[float] = None
 
@@ -113,6 +114,7 @@ class BaseConversationalMetric:
     # Not changeable for now
     strict_mode: bool = False
     async_mode: bool = False
+    verbose_mode: bool = False
 
     def __init__(self):
         self._score = ContextVar(generate_uuid(), default=None)
 
@@ -56,6 +56,7 @@ def __init__(
         include_reason: bool = True,
         async_mode: bool = True,
         strict_mode: bool = False,
+        verbose_mode: bool = False,
     ):
         super().__init__()
         self._opinions: ContextVar[Optional[List[str]]] = ContextVar(
@@ -70,11 +71,11 @@ def __init__(
         self.include_reason = include_reason
         self.async_mode = async_mode
         self.strict_mode = strict_mode
+        self.verbose_mode = verbose_mode
 
     def measure(
         self,
         test_case: Union[LLMTestCase, ConversationalTestCase],
-        verbose: bool = True,
     ) -> float:
         if isinstance(test_case, ConversationalTestCase):
             test_case = validate_conversational_test_case(test_case, self)
@@ -90,9 +91,7 @@ def measure(
                     self.score,
                     self.reason,
                     self.success,
-                ) = loop.run_until_complete(
-                    self._measure_async(test_case, verbose)
-                )
+                ) = loop.run_until_complete(self._measure_async(test_case))
             else:
                 self.opinions: List[str] = self._generate_opinions(
                     test_case.actual_output
@@ -101,7 +100,7 @@ def measure(
                 self.score = self._calculate_score()
                 self.reason = self._generate_reason()
                 self.success = self.score <= self.threshold
-                if verbose:
+                if self.verbose_mode:
                     print(
                         f"opinions: {self.opinions}\nverdicts: {self.verdicts}\n"
                     )
@@ -111,7 +110,6 @@ async def a_measure(
         self,
         test_case: Union[LLMTestCase, ConversationalTestCase],
         _show_indicator: bool = True,
-        verbose: bool = True,
     ) -> float:
         if isinstance(test_case, ConversationalTestCase):
             test_case = validate_conversational_test_case(test_case, self)
@@ -130,16 +128,14 @@ async def a_measure(
             self.score = self._calculate_score()
             self.reason = await self._a_generate_reason()
             self.success = self.score <= self.threshold
-            if verbose:
+            if self.verbose_mode:
                 print(f"opinions: {self.opinions}\nverdicts: {self.verdicts}\n")
             return self.score
 
     async def _measure_async(
-        self,
-        test_case: Union[LLMTestCase, ConversationalTestCase],
-        verbose: bool,
+        self, test_case: Union[LLMTestCase, ConversationalTestCase]
     ):
-        await self.a_measure(test_case, _show_indicator=False, verbose=verbose)
+        await self.a_measure(test_case, _show_indicator=False)
         return (
             self.opinions,
             self.verdicts,
 
@@ -51,6 +51,7 @@ def __init__(
         include_reason: bool = True,
         async_mode: bool = True,
         strict_mode: bool = False,
+        verbose_mode: bool = False,
     ):
         super().__init__()
         self._verdicts: ContextVar[
@@ -62,11 +63,11 @@ def __init__(
         self.evaluation_model = self.model.get_model_name()
         self.async_mode = async_mode
         self.strict_mode = strict_mode
+        self.verbose_mode = verbose_mode
 
     def measure(
         self,
         test_case: Union[LLMTestCase, ConversationalTestCase],
-        verbose: bool = True,
     ) -> float:
         if isinstance(test_case, ConversationalTestCase):
             test_case = validate_conversational_test_case(test_case, self)
@@ -77,9 +78,7 @@ def measure(
             if self.async_mode:
                 loop = get_or_create_event_loop()
                 (self.verdicts, self.score, self.reason, self.success) = (
-                    loop.run_until_complete(
-                        self._measure_async(test_case, verbose)
-                    )
+                    loop.run_until_complete(self._measure_async(test_case))
                 )
             else:
                 self.verdicts: List[ContextualPrecisionVerdict] = (
@@ -92,15 +91,14 @@ def measure(
                 self.score = self._calculate_score()
                 self.reason = self._generate_reason(test_case.input)
                 self.success = self.score >= self.threshold
-                if verbose:
+                if self.verbose_mode:
                     print(f"verdicts: {self.verdicts}\n")
                 return self.score
 
     async def a_measure(
         self,
         test_case: Union[LLMTestCase, ConversationalTestCase],
         _show_indicator: bool = True,
-        verbose: bool = True,
     ) -> float:
         if isinstance(test_case, ConversationalTestCase):
             test_case = validate_conversational_test_case(test_case, self)
@@ -122,16 +120,15 @@ async def a_measure(
             self.score = self._calculate_score()
             self.reason = await self._a_generate_reason(test_case.input)
             self.success = self.score >= self.threshold
-            if verbose:
+            if self.verbose_mode:
                 print(f"verdicts: {self.verdicts}\n")
             return self.score
 
     async def _measure_async(
         self,
         test_case: Union[LLMTestCase, ConversationalTestCase],
-        verbose: bool,
     ):
-        await self.a_measure(test_case, _show_indicator=False, verbose=verbose)
+        await self.a_measure(test_case, _show_indicator=False)
         return (self.verdicts, self.score, self.reason, self.success)
 
     async def _a_generate_reason(self, input: str):
 
@@ -48,6 +48,7 @@ def __init__(
         include_reason: bool = True,
         async_mode: bool = True,
         strict_mode: bool = False,
+        verbose_mode: bool = False,
     ):
         super().__init__()
         self._verdicts: ContextVar[Optional[List[ContextualRecallVerdict]]] = (
@@ -59,11 +60,11 @@ def __init__(
         self.include_reason = include_reason
         self.async_mode = async_mode
         self.strict_mode = strict_mode
+        self.verbose_mode = verbose_mode
 
     def measure(
         self,
         test_case: Union[LLMTestCase, ConversationalTestCase],
-        verbose: bool = True,
     ) -> float:
         if isinstance(test_case, ConversationalTestCase):
             test_case = validate_conversational_test_case(test_case, self)
@@ -74,9 +75,7 @@ def measure(
             if self.async_mode:
                 loop = get_or_create_event_loop()
                 (self.verdicts, self.score, self.reason, self.success) = (
-                    loop.run_until_complete(
-                        self._measure_async(test_case, verbose)
-                    )
+                    loop.run_until_complete(self._measure_async(test_case))
                 )
             else:
                 self.verdicts: List[ContextualRecallVerdict] = (
@@ -87,15 +86,14 @@ def measure(
                 self.score = self._calculate_score()
                 self.reason = self._generate_reason(test_case.input)
                 self.success = self.score >= self.threshold
-                if verbose:
+                if self.verbose_mode:
                     print(f"verdicts: {self.verdicts}\n")
                 return self.score
 
     async def a_measure(
         self,
         test_case: Union[LLMTestCase, ConversationalTestCase],
         _show_indicator: bool = True,
-        verbose: bool = True,
     ) -> float:
         if isinstance(test_case, ConversationalTestCase):
             test_case = validate_conversational_test_case(test_case, self)
@@ -115,16 +113,15 @@ async def a_measure(
             self.score = self._calculate_score()
             self.reason = await self._a_generate_reason(test_case.input)
             self.success = self.score >= self.threshold
-            if verbose:
+            if self.verbose_mode:
                 print(f"verdicts: {self.verdicts}\n")
             return self.score
 
     async def _measure_async(
         self,
         test_case: Union[LLMTestCase, ConversationalTestCase],
-        verbose: bool,
     ):
-        await self.a_measure(test_case, _show_indicator=False, verbose=verbose)
+        await self.a_measure(test_case, _show_indicator=False)
         return (self.verdicts, self.score, self.reason, self.success)
 
     async def _a_generate_reason(self, expected_output: str):
 
@@ -50,6 +50,7 @@ def __init__(
         include_reason: bool = True,
         async_mode: bool = True,
         strict_mode: bool = False,
+        verbose_mode: bool = False,
     ):
         super().__init__()
         self._verdicts: ContextVar[
@@ -61,11 +62,11 @@ def __init__(
         self.include_reason = include_reason
         self.async_mode = async_mode
         self.strict_mode = strict_mode
+        self.verbose_mode = verbose_mode
 
     def measure(
         self,
         test_case: Union[LLMTestCase, ConversationalTestCase],
-        verbose: bool = True,
     ) -> float:
         if isinstance(test_case, ConversationalTestCase):
             test_case = validate_conversational_test_case(test_case, self)
@@ -76,9 +77,7 @@ def measure(
             if self.async_mode:
                 loop = get_or_create_event_loop()
                 (self.verdicts, self.score, self.reason, self.success) = (
-                    loop.run_until_complete(
-                        self._measure_async(test_case, verbose)
-                    )
+                    loop.run_until_complete(self._measure_async(test_case))
                 )
             else:
                 self.verdicts: List[ContextualRelevancyVerdict] = (
@@ -89,15 +88,14 @@ def measure(
                 self.score = self._calculate_score()
                 self.reason = self._generate_reason(test_case.input)
                 self.success = self.score >= self.threshold
-                if verbose:
+                if self.verbose_mode:
                     print(f"verdicts: {self.verdicts}\n")
                 return self.score
 
     async def a_measure(
         self,
         test_case: Union[LLMTestCase, ConversationalTestCase],
         _show_indicator: bool = True,
-        verbose: bool = True,
     ) -> float:
         if isinstance(test_case, ConversationalTestCase):
             test_case = validate_conversational_test_case(test_case, self)
@@ -117,16 +115,15 @@ async def a_measure(
             self.score = self._calculate_score()
             self.reason = await self._a_generate_reason(test_case.input)
             self.success = self.score >= self.threshold
-            if verbose:
+            if self.verbose_mode:
                 print(f"verdicts: {self.verdicts}\n")
             return self.score
 
     async def _measure_async(
         self,
         test_case: Union[LLMTestCase, ConversationalTestCase],
-        verbose: bool,
     ):
-        await self.a_measure(test_case, _show_indicator=False, verbose=verbose)
+        await self.a_measure(test_case, _show_indicator=False)
         return (self.verdicts, self.score, self.reason, self.success)
 
     async def _a_generate_reason(self, input: str):