[pre-commit.ci] auto fixes from pre-commit.com hooks

for more information, see https://pre-commit.ci
opea-project · Sep 2, 2024 · b07f82c · b07f82c
1 parent ba1b898
commit b07f82c
Show file tree

Hide file tree

Showing 2 changed files with 21 additions and 14 deletions.
diff --git a/evals/evaluation/bigcode_evaluation_harness/accuracy.py b/evals/evaluation/bigcode_evaluation_harness/accuracy.py
@@ -21,6 +21,7 @@
 from bigcode_eval.evaluator import Evaluator
 from bigcode_eval.tasks import ALL_TASKS
 from transformers import AutoModelForCausalLM, AutoModelForSeq2SeqLM, AutoTokenizer
+
 from evals.evaluation.bigcode_evaluation_harness.api_evaluator import APIEvaluator
 
 
@@ -73,7 +74,7 @@ def evaluate(args):
         # here we generate code using an OPEA codegen API
         if accelerator.is_main_process:
             print("OPEA codegen API generation mode")
-        evaluator =  APIEvaluator(accelerator, args.model, None, args)
+        evaluator = APIEvaluator(accelerator, args.model, None, args)
         for task in task_names:
             results[task] = evaluator.evaluate(task)
     else:

diff --git a/evals/evaluation/bigcode_evaluation_harness/api_evaluator.py b/evals/evaluation/bigcode_evaluation_harness/api_evaluator.py
@@ -1,9 +1,11 @@
+# Copyright (C) 2024 Intel Corporation
+# SPDX-License-Identifier: Apache-2.0
+
 import inspect
 import json
 import warnings
 
 import aiohttp
-
 from bigcode_eval import tasks
 from bigcode_eval.evaluator import Evaluator
 
@@ -20,13 +22,16 @@ def generate_text(self, task_name, intermediate_generations=None):
         # adjust n_tasks by args.limit_start to prevent out of bounds issues
         if not self.args.limit:
             n_tasks -= self.args.limit_start
-        references = [task.get_reference(dataset[i]) for i in
-                      range(self.args.limit_start, self.args.limit_start + n_tasks)]
+        references = [
+            task.get_reference(dataset[i]) for i in range(self.args.limit_start, self.args.limit_start + n_tasks)
+        ]
 
         if self.args.check_references:
             if "get_solution" in inspect.signature(task.get_reference).parameters:
-                solutions = [[task.get_reference(dataset[i], get_solution=True)] for i in
-                             range(self.args.limit_start, self.args.limit_start + n_tasks)]
+                solutions = [
+                    [task.get_reference(dataset[i], get_solution=True)]
+                    for i in range(self.args.limit_start, self.args.limit_start + n_tasks)
+                ]
             else:
                 solutions = [[ref] for ref in references]
             return solutions, references
@@ -41,7 +46,6 @@ def generate_text(self, task_name, intermediate_generations=None):
             self.accelerator,
             n_tasks=n_tasks,
             args=self.args,
-
         )
 
         if len(generations[0]) > self.args.n_samples:
@@ -53,11 +57,11 @@ def generate_text(self, task_name, intermediate_generations=None):
 
 
 def parallel_generations_by_api(
-        task,
-        dataset,
-        accelerator,
-        n_tasks,
-        args,
+    task,
+    dataset,
+    accelerator,
+    n_tasks,
+    args,
 ):
     if args.load_generations_path:
         # load generated code
@@ -73,8 +77,10 @@ def parallel_generations_by_api(
         assert "/codegen" in codegen_url, "Only OPEA codegen compatible APIs are supported"
         import asyncio
         import os
-        from tqdm.asyncio import tqdm
+
         import requests
+        from tqdm.asyncio import tqdm
+
         async def get_res(prompt):
             headers = {"Content-Type": "application/json"}
             data = {
@@ -95,6 +101,6 @@ async def get_res(prompt):
         responses = asyncio.run(tqdm.gather(*awaitables))
         generations = []
         for i, (prompt, response) in enumerate(zip(prompts, responses)):
-            texts = [prompt + choice["message"]["content"] for choice in json.loads(response)['choices']]
+            texts = [prompt + choice["message"]["content"] for choice in json.loads(response)["choices"]]
             generations.append([task.postprocess_generation(text, i) for text in texts])
         return generations