Good sklearn

binpash · Oct 23, 2024 · 7fa9977 · 7fa9977
1 parent e3268a6
commit 7fa9977
Show file tree

Hide file tree

Showing 5 changed files with 11 additions and 6 deletions.
diff --git a/sklearn/inputs.sh b/sklearn/inputs.sh
@@ -3,5 +3,6 @@
 cd "$(realpath $(dirname "$0"))"
 mkdir -p tmp
 mkdir -p result
+mkdir -p inputs
 
-# Currently just dumped the entire dataset, but ideally we actually download it
+/usr/bin/env python3 -c "from sklearn.datasets import fetch_kddcup99; fetch_kddcup99(data_home=\"inputs\", percent10=False, download_if_missing=True)"
diff --git a/sklearn/run.sh b/sklearn/run.sh
@@ -1,8 +1,11 @@
 #!/bin/bash
 
 PYTHON="python3"
-DIR=$PWD
-SCRIPTS=$DIR/scripts
+OUT=${OUT:-$PWD/result}
+TMP=${TMP:-$PWD/tmp}
+#export tmp to env
+export TMP
+SCRIPTS=${SCRIPTS:-$PWD/scripts}
 
 # Ideally, we'll move on to piping rather than writing to a file
 MODEL=$TMP/model.obj

diff --git a/sklearn/scripts/adjust_coef.py b/sklearn/scripts/adjust_coef.py
@@ -32,5 +32,6 @@
     else:
         model.intercept_ = np.zeros(n_classes)
 
-with open(destination, 'wb') as file:
+filepath = os.path.join(tmp, 'trained_model.obj')
+with open(filepath, 'wb') as file:
     pickle.dump(model, file)
diff --git a/sklearn/setup.sh b/sklearn/setup.sh
@@ -2,7 +2,7 @@
 
 export PASH_SPEC_TOP=${PASH_SPEC_TOP:-$(git rev-parse --show-toplevel --show-superproject-working-tree)}
 
-benchmark_dir="$PASH_SPEC_TOP/report/benchmarks/sklearn"
+benchmark_dir="sklearn"
 
 cd "$(realpath $(dirname "$0"))"
 mkdir -p "$PASH_SPEC_TOP/report/resources/sklearn"

diff --git a/sklearn/verify.py b/sklearn/verify.py
@@ -20,7 +20,7 @@
 control_model.fit(X_train, y_train)
 control_score = control_model.score(X_test, y_test)
 
-with open('result/trained_model.obj', 'rb') as file:
+with open('tmp/trained_model.obj', 'rb') as file:
     experiment_model = pickle.load(file)
 experiment_score = experiment_model.score(X_test, y_test)