fix: 1151 escaping element None case

Fix error of transforming None element name to np.nan
cubewise-code · Dec 4, 2024 · 6c47be6 · 6c47be6
1 parent b4828bc
commit 6c47be6
Show file tree

Hide file tree

Showing 2 changed files with 67 additions and 6 deletions.
diff --git a/TM1py/Utils/Utils.py b/TM1py/Utils/Utils.py
@@ -547,12 +547,12 @@ def build_dataframe_from_csv(raw_csv, sep='~', shaped: bool = False,
     if 'dtype' not in kwargs:
         kwargs['dtype'] = {'Value': None, **{col: str for col in range(999)}}
     try:
-        df = pd.read_csv(StringIO(raw_csv), sep=sep, na_values=["", None], keep_default_na=False, **kwargs)
+        df = pd.read_csv(StringIO(raw_csv), sep=sep, na_values={'Value': ['None']}, keep_default_na=False, **kwargs)
 
     except ValueError:
         # retry with dtype 'str' for results with a mixed value column
         kwargs['dtype'] = {'Value': str, **{col: str for col in range(999)}}
-        df = pd.read_csv(StringIO(raw_csv), sep=sep, na_values=["", None], keep_default_na=False, **kwargs)
+        df = pd.read_csv(StringIO(raw_csv), sep=sep, na_values={'Value': ['None']}, keep_default_na=False, **kwargs)
 
     if fillna_numeric_attributes:
         fill_numeric_bool_list = [attr_type.lower() == 'numeric' for dimension, attributes in
@@ -561,7 +561,7 @@ def build_dataframe_from_csv(raw_csv, sep='~', shaped: bool = False,
         fill_numeric_bool_list += [False]  # for the value column
         df = df.apply(
             lambda col:
-            col.fillna(fillna_numeric_attributes_value) if fill_numeric_bool_list[
+            col.replace(['', 'None'], np.nan).fillna(fillna_numeric_attributes_value) if fill_numeric_bool_list[
                 list(df.columns.values).index(col.name)] else col,
             axis=0)
 
@@ -572,7 +572,7 @@ def build_dataframe_from_csv(raw_csv, sep='~', shaped: bool = False,
         fill_string_bool_list += [False]  # for the value column
         df = df.apply(
             lambda col:
-            col.fillna(fillna_string_attributes_value) if fill_string_bool_list[
+            col.replace(['', 'None'], np.nan).fillna(fillna_string_attributes_value) if fill_string_bool_list[
                 list(df.columns.values).index(col.name)] else col,
             axis=0)
 

diff --git a/Tests/Utils_test.py b/Tests/Utils_test.py
@@ -2,16 +2,22 @@
 import unittest
 from pathlib import Path
 
+try:
+    import numpy as np
+    import pandas as pd
+except ImportError:
+    pass
+
 from TM1py.Services import TM1Service
 from TM1py.Utils import (
     Utils,
     get_dimensions_from_where_clause,
     integerize_version,
     verify_version, get_cube, resembles_mdx, format_url, add_url_parameters, extract_cell_updateable_property,
     CellUpdateableProperty, cell_is_updateable, extract_cell_properties_from_odata_context,
-    map_cell_properties_to_compact_json_response, frame_to_significant_digits, drop_dimension_properties
+    map_cell_properties_to_compact_json_response, frame_to_significant_digits, drop_dimension_properties,
+    build_dataframe_from_csv
 )
-
 from .Utils import skip_if_version_higher_or_equal_than, skip_if_paoc
 
 
@@ -105,6 +111,61 @@ def test_get_dimensions_from_where_clause_happy_case(self):
         dimensions = get_dimensions_from_where_clause(mdx)
         self.assertEqual(["DIM2", "DIM1"], dimensions)
 
+    def test_build_dataframe_from_csv(self):
+        raw_csv = (
+            "d1~d2~Value\r\n"
+            "e1~e1~1.0\r\n"
+            "e1~e2~2.0\r\n"
+            "e2~e1~3.0\r\n"
+            "e2~e2~4.0"
+        )
+        df = build_dataframe_from_csv(raw_csv)
+
+        expected_df = pd.DataFrame({
+            'd1': ["e1", "e1", "e2", "e2"],
+            'd2': ["e1", "e2", "e1", "e2"],
+            'Value': [1.0, 2.0, 3.0, 4.0],
+        })
+
+        pd._testing.assert_frame_equal(expected_df, df, check_column_type=False)
+
+    def test_build_dataframe_from_csv_with_none_element_and_none_value(self):
+        raw_csv = (
+            "d1~d2~Value\r\n"
+            "e1~e1~None\r\n"
+            "e1~e2~2.0\r\n"
+            "None~e1~3.0\r\n"
+            "None~e2~4.0"
+        )
+        df = build_dataframe_from_csv(raw_csv)
+
+        expected_df = pd.DataFrame({
+            'd1': ["e1", "e1", "None", "None"],
+            'd2': ["e1", "e2", "e1", "e2"],
+            'Value': [np.nan, 2.0, 3.0, 4.0],
+        }).astype(object)
+
+        pd._testing.assert_frame_equal(expected_df, df, check_column_type=False, check_dtype=False, check_exact=False)
+
+    def test_build_dataframe_from_csv_with_none_and_empty_string_value(self):
+        raw_csv = (
+            "d1~d2~Value\r\n"
+            "e1~e1~None\r\n"
+            "e1~e2~\"\"\r\n"
+            "None~e1~3.0\r\n"
+            "None~e2~4.0"
+        )
+        df = build_dataframe_from_csv(raw_csv)
+
+        expected_df = pd.DataFrame({
+            'd1': ["e1", "e1", "None", "None"],
+            'd2': ["e1", "e2", "e1", "e2"],
+            'Value': [np.nan, "", "3.0", "4.0"],
+        }).astype(object)
+
+        pd._testing.assert_frame_equal(expected_df, df, check_column_type=False, check_dtype=False, check_exact=False)
+
+
     def test_get_dimensions_from_where_clause_no_where(self):
         mdx = """
         SELECT {[dim3].[e2]} ON COLUMNS, {[dim4].[e5]} ON ROWS FROM [cube]