huggingface · ArthurZucker · Jan 16, 2024 · Jan 9, 2024 · Jan 9, 2024 · Jan 10, 2024
diff --git a/examples/pytorch/image-classification/run_image_classification.py b/examples/pytorch/image-classification/run_image_classification.py
@@ -255,7 +255,6 @@ def main():
             data_args.dataset_name,
             data_args.dataset_config_name,
             cache_dir=model_args.cache_dir,
-            task="image-classification",
             token=model_args.token,
         )
     else:
@@ -268,9 +267,14 @@ def main():
             "imagefolder",
             data_files=data_files,
             cache_dir=model_args.cache_dir,
-            task="image-classification",
         )
 
+    # Rename image and label columns if needed (e.g. Cifar10)
+    if "img" in dataset["train"].features:
-    if "img" in dataset["train"].features:
+    if "img" in list(dataset.column_names.values())[0]:
-    if "img" in dataset["train"].features:
+    if "img" in next(iter(dataset.column_names.values())):
-    if "img" in dataset["train"].features:
+    if "img" in (dataset["train"].features if "train" in dataset else dataset["validation"].features):
-    if "img" in dataset["train"].features:
+    if "img" in list(dataset.column_names.values())[0]:
-    if "img" in dataset["train"].features:
+    if "img" in next(iter(dataset.column_names.values())):
-    if "img" in dataset["train"].features:
+    if "img" in (dataset["train"].features if "train" in dataset else dataset["validation"].features):
+        dataset = dataset.rename_column("img", "image")
+    if "label" in dataset["train"].features:
+        dataset = dataset.rename_column("label", "labels")
+
     # If we don't have a validation split, split off a percentage of train as validation.
     data_args.train_val_split = None if "validation" in dataset.keys() else data_args.train_val_split
     if isinstance(data_args.train_val_split, float) and data_args.train_val_split > 0.0:

diff --git a/examples/pytorch/image-classification/run_image_classification_no_trainer.py b/examples/pytorch/image-classification/run_image_classification_no_trainer.py
@@ -272,7 +272,7 @@ def main():
     # download the dataset.
     if args.dataset_name is not None:
         # Downloading and loading a dataset from the hub.
-        dataset = load_dataset(args.dataset_name, task="image-classification")
+        dataset = load_dataset(args.dataset_name)
     else:
         data_files = {}
         if args.train_dir is not None:
@@ -283,11 +283,16 @@ def main():
             "imagefolder",
             data_files=data_files,
             cache_dir=args.cache_dir,
-            task="image-classification",
         )
         # See more about loading custom images at
         # https://huggingface.co/docs/datasets/v2.0.0/en/image_process#imagefolder.
 
+    # Rename image and label columns if needed (e.g. Cifar10)
+    if "img" in dataset["train"].features:
+        dataset = dataset.rename_column("img", "image")
+    if "label" in dataset["train"].features:
+        dataset = dataset.rename_column("label", "labels")
+
     # If we don't have a validation split, split off a percentage of train as validation.
     args.train_val_split = None if "validation" in dataset.keys() else args.train_val_split
     if isinstance(args.train_val_split, float) and args.train_val_split > 0.0: