abdev-leaderboard

Running

pquintero commited on Aug 12

Commit

bff3b9b

1 Parent(s): f412a50

rename to cross_validation

Files changed (2) hide show

constants.py CHANGED Viewed

@@ -40,11 +40,13 @@ CV_COLUMN = "hierarchical_cluster_IgG_isotype_stratified_fold"
 # Example files
 EXAMPLE_FILE_DICT = {
     "GDPa1": "data/example-predictions.csv",
-    "GDPa1_CV": "data/example-predictions-cv.csv",
 }
 ANTIBODY_NAMES_DICT = {
     "GDPa1": pd.read_csv(EXAMPLE_FILE_DICT["GDPa1"])["antibody_name"].tolist(),
-    "GDPa1_CV": pd.read_csv(EXAMPLE_FILE_DICT["GDPa1_CV"])["antibody_name"].tolist(),
 }
 # Huggingface API

 # Example files
 EXAMPLE_FILE_DICT = {
     "GDPa1": "data/example-predictions.csv",
+    "GDPa1_cross_validation": "data/example-predictions-cv.csv",
 }
 ANTIBODY_NAMES_DICT = {
     "GDPa1": pd.read_csv(EXAMPLE_FILE_DICT["GDPa1"])["antibody_name"].tolist(),
+    "GDPa1_cross_validation": pd.read_csv(EXAMPLE_FILE_DICT["GDPa1_cross_validation"])[
+        "antibody_name"
+    ].tolist(),
 }
 # Huggingface API

validation.py CHANGED Viewed

@@ -47,7 +47,9 @@ def validate_csv_can_be_read(file_content: str) -> pd.DataFrame:
         raise gr.Error(f"❌ Unexpected error reading CSV file: {str(e)}")
-def validate_cv_submission(df: pd.DataFrame, submission_type: str = "GDPa1_CV") -> None:
     """Validate cross-validation submission"""
     # Must have CV_COLUMN for CV submissions
     if CV_COLUMN not in df.columns:
@@ -102,7 +104,7 @@ def validate_dataframe(df: pd.DataFrame, submission_type: str = "GDPa1") -> None
     df: pd.DataFrame
         The DataFrame to validate.
     submission_type: str
-        Type of submission: "GDPa1" or "GDPa1_CV"
     Raises
     ------
@@ -160,7 +162,7 @@ def validate_dataframe(df: pd.DataFrame, submission_type: str = "GDPa1") -> None
             f"❌ Missing predictions for {len(missing_antibodies)} antibodies: {', '.join(missing_antibodies)}"
         )
     # Submission-type specific validation
-    if submission_type.endswith("_CV"):
         validate_cv_submission(df, submission_type)
     else:  # full_dataset
         validate_full_dataset_submission(df)
@@ -175,7 +177,7 @@ def validate_csv_file(file_content: str, submission_type: str = "GDPa1") -> None
     file_content: str
         The content of the uploaded CSV file.
     submission_type: str
-        Type of submission: "standard" or "cv"
     Raises
     ------

         raise gr.Error(f"❌ Unexpected error reading CSV file: {str(e)}")
+def validate_cv_submission(
+    df: pd.DataFrame, submission_type: str = "GDPa1_cross_validation"
+) -> None:
     """Validate cross-validation submission"""
     # Must have CV_COLUMN for CV submissions
     if CV_COLUMN not in df.columns:
     df: pd.DataFrame
         The DataFrame to validate.
     submission_type: str
+        Type of submission: "GDPa1" or "GDPa1_cross_validation"
     Raises
     ------
             f"❌ Missing predictions for {len(missing_antibodies)} antibodies: {', '.join(missing_antibodies)}"
         )
     # Submission-type specific validation
+    if submission_type.endswith("_cross_validation"):
         validate_cv_submission(df, submission_type)
     else:  # full_dataset
         validate_full_dataset_submission(df)
     file_content: str
         The content of the uploaded CSV file.
     submission_type: str
+        Type of submission: "GDPa1" or "GDPa1_cross_validation"
     Raises
     ------