From 552cf323876a597a7167356b12baf471b809c4ae Mon Sep 17 00:00:00 2001
From: Radek Osmulski <rosmulski@gmail.com>
Date: Tue, 9 May 2023 12:07:46 +1000
Subject: [PATCH] update

---
 ...nd_save_model_for_benchmarking-Copy1.ipynb | 13764 +++++++++++++++-
 1 file changed, 13438 insertions(+), 326 deletions(-)

diff --git a/T4Rec_repro/train_and_save_model_for_benchmarking-Copy1.ipynb b/T4Rec_repro/train_and_save_model_for_benchmarking-Copy1.ipynb
index 74b19fa9d3..c048898d04 100644
--- a/T4Rec_repro/train_and_save_model_for_benchmarking-Copy1.ipynb
+++ b/T4Rec_repro/train_and_save_model_for_benchmarking-Copy1.ipynb
@@ -2,27 +2,1528 @@
  "cells": [
   {
    "cell_type": "code",
-   "execution_count": 1,
+   "execution_count": 2,
    "id": "d062ceda",
    "metadata": {},
-   "outputs": [],
+   "outputs": [
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "From https://github.com/NVIDIA-Merlin/Models\n",
+      " * [new branch]        asvdb_metric_tracking   -> origin/asvdb_metric_tracking\n",
+      " * [new branch]        benchmark-session-based -> origin/benchmark-session-based\n",
+      " * [new branch]        ci/horovod              -> origin/ci/horovod\n",
+      " * [new branch]        codespell_fix           -> origin/codespell_fix\n",
+      "   16fb4149..fcaefc3e  fea-sok-integration-wj  -> origin/fea-sok-integration-wj\n",
+      " * [new branch]        fea-sok-load-dump       -> origin/fea-sok-load-dump\n",
+      " * [new branch]        fix_datetime_issue_add_inference_on_TIS -> origin/fix_datetime_issue_add_inference_on_TIS\n",
+      "   95462360..7d68dc88  gh-pages                -> origin/gh-pages\n",
+      " * [new branch]        implement_review_comments -> origin/implement_review_comments\n",
+      " * [new branch]        inference_benchmarking_transformers -> origin/inference_benchmarking_transformers\n",
+      " * [new branch]        laiacano/concurrency    -> origin/laiacano/concurrency\n",
+      "   835ad186..d8133b8f  main                    -> origin/main\n",
+      " * [new branch]        mtl_example             -> origin/mtl_example\n",
+      "   cb431a8a..b90e9a1b  release-22.12           -> origin/release-22.12\n",
+      " * [new branch]        release-23.02           -> origin/release-23.02\n",
+      " * [new branch]        release-23.04           -> origin/release-23.04\n",
+      " * [new branch]        stable                  -> origin/stable\n",
+      " * [new branch]        tf/batch_predict_fix    -> origin/tf/batch_predict_fix\n",
+      " * [new branch]        tf/column_sampling_serialization_fix -> origin/tf/column_sampling_serialization_fix\n",
+      " * [new branch]        tf/continuous_seq_feats_fix -> origin/tf/continuous_seq_feats_fix\n",
+      " * [new branch]        tf/dataloader_changes   -> origin/tf/dataloader_changes\n",
+      " * [new branch]        tf/dlrm_dropout_fix     -> origin/tf/dlrm_dropout_fix\n",
+      " * [new branch]        tf/fix_broadcast_to_sequence -> origin/tf/fix_broadcast_to_sequence\n",
+      " * [new branch]        tf/fix_logq_correction  -> origin/tf/fix_logq_correction\n",
+      " * [new branch]        tf/fix_training_smaller_accuracy -> origin/tf/fix_training_smaller_accuracy\n",
+      " * [new branch]        tf/loglossmetric_callbacks -> origin/tf/loglossmetric_callbacks\n",
+      " * [new branch]        tf/mtl_example_updates_v2 -> origin/tf/mtl_example_updates_v2\n",
+      " + 169f3df5...06eecddd tf/output-block         -> origin/tf/output-block  (forced update)\n",
+      " * [new branch]        tf/pretrained_emb       -> origin/tf/pretrained_emb\n",
+      " * [new branch]        tf/process_list_to_prepare_features -> origin/tf/process_list_to_prepare_features\n",
+      " * [new branch]        tf/quick_start_ranking  -> origin/tf/quick_start_ranking\n",
+      " * [new branch]        tf/transformer-api      -> origin/tf/transformer-api\n",
+      " * [new branch]        torch/dev               -> origin/torch/dev\n",
+      " * [new branch]        torch/masking           -> origin/torch/masking\n",
+      " * [new branch]        torch/prototype         -> origin/torch/prototype\n",
+      " * [new branch]        torch/remove-t4r-code   -> origin/torch/remove-t4r-code\n",
+      " * [new branch]        tox_github_actions_fix  -> origin/tox_github_actions_fix\n",
+      " * [new branch]        transformer-api         -> origin/transformer-api\n",
+      " + 0a65d603...9f53e8ff update_07               -> origin/update_07  (forced update)\n",
+      " * [new tag]           v23.02.00               -> v23.02.00\n",
+      " * [new tag]           v23.04.00               -> v23.04.00\n",
+      " * [new tag]           v23.05.dev0             -> v23.05.dev0\n",
+      "Previous HEAD position was cb431a8a Fix the serialization of `SequenceSummary` block (#927)\n",
+      "HEAD is now at a86201ee add masking support to SequencePredictRandom transform\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Processing /models\n",
+      "  Installing build dependencies: started\n",
+      "  Installing build dependencies: finished with status 'done'\n",
+      "  Getting requirements to build wheel: started\n",
+      "  Getting requirements to build wheel: finished with status 'done'\n",
+      "    Preparing wheel metadata: started\n",
+      "    Preparing wheel metadata: finished with status 'done'\n",
+      "Requirement already satisfied: merlin-dataloader>=0.0.2 in /usr/local/lib/python3.8/dist-packages (from merlin-models==23.2.0+7.ga86201ee) (0.0.4)\n",
+      "Requirement already satisfied: merlin-core>=0.2.0 in /usr/local/lib/python3.8/dist-packages (from merlin-models==23.2.0+7.ga86201ee) (0.10.0)\n",
+      "Requirement already satisfied: numba>=0.54 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (0.56.4)\n",
+      "Requirement already satisfied: tqdm>=4.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (4.64.1)\n",
+      "Requirement already satisfied: pyarrow>=5.0.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (8.0.0)\n",
+      "Requirement already satisfied: protobuf>=3.0.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (3.19.6)\n",
+      "Requirement already satisfied: tensorflow-metadata>=1.2.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (1.12.0)\n",
+      "Requirement already satisfied: betterproto<2.0.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (1.2.5)\n",
+      "Requirement already satisfied: dask>=2022.3.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (2022.7.1)\n",
+      "Requirement already satisfied: distributed>=2022.3.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (2022.7.1)\n",
+      "Requirement already satisfied: packaging in /usr/local/lib/python3.8/dist-packages (from merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (22.0)\n",
+      "Requirement already satisfied: fsspec==2022.5.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (2022.5.0)\n",
+      "Requirement already satisfied: pandas<1.4.0dev0,>=1.2.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (1.3.5)\n",
+      "Requirement already satisfied: llvmlite<0.40,>=0.39.0dev0 in /usr/local/lib/python3.8/dist-packages (from numba>=0.54->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (0.39.1)\n",
+      "Requirement already satisfied: setuptools in /usr/lib/python3/dist-packages (from numba>=0.54->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (45.2.0)\n",
+      "Requirement already satisfied: numpy<1.24,>=1.18 in /usr/local/lib/python3.8/dist-packages (from numba>=0.54->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (1.22.4)\n",
+      "Requirement already satisfied: importlib-metadata; python_version < \"3.9\" in /usr/local/lib/python3.8/dist-packages (from numba>=0.54->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (5.2.0)\n",
+      "Requirement already satisfied: absl-py<2.0.0,>=0.9 in /usr/local/lib/python3.8/dist-packages (from tensorflow-metadata>=1.2.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (1.3.0)\n",
+      "Requirement already satisfied: googleapis-common-protos<2,>=1.52.0 in /usr/local/lib/python3.8/dist-packages (from tensorflow-metadata>=1.2.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (1.57.0)\n",
+      "Requirement already satisfied: grpclib in /usr/local/lib/python3.8/dist-packages (from betterproto<2.0.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (0.4.3)\n",
+      "Requirement already satisfied: stringcase in /usr/local/lib/python3.8/dist-packages (from betterproto<2.0.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (1.2.0)\n",
+      "Requirement already satisfied: partd>=0.3.10 in /usr/local/lib/python3.8/dist-packages (from dask>=2022.3.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (1.3.0)\n",
+      "Requirement already satisfied: toolz>=0.8.2 in /usr/local/lib/python3.8/dist-packages (from dask>=2022.3.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (0.12.0)\n",
+      "Requirement already satisfied: pyyaml>=5.3.1 in /usr/local/lib/python3.8/dist-packages (from dask>=2022.3.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (6.0)\n",
+      "Requirement already satisfied: cloudpickle>=1.1.1 in /usr/local/lib/python3.8/dist-packages (from dask>=2022.3.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (2.2.0)\n",
+      "Requirement already satisfied: click>=6.6 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.3.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (8.1.3)\n",
+      "Requirement already satisfied: zict>=0.1.3 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.3.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (2.2.0)\n",
+      "Requirement already satisfied: psutil>=5.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.3.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (5.9.4)\n",
+      "Requirement already satisfied: tblib>=1.6.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.3.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (1.7.0)\n",
+      "Requirement already satisfied: sortedcontainers!=2.0.0,!=2.0.1 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.3.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (2.4.0)\n",
+      "Requirement already satisfied: urllib3 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.3.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (1.26.13)\n",
+      "Requirement already satisfied: msgpack>=0.6.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.3.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (1.0.4)\n",
+      "Requirement already satisfied: locket>=1.0.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.3.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (1.0.0)\n",
+      "Requirement already satisfied: tornado<6.2,>=6.0.3 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.3.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (6.1)\n",
+      "Requirement already satisfied: jinja2 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.3.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (3.1.2)\n",
+      "Requirement already satisfied: pytz>=2017.3 in /usr/local/lib/python3.8/dist-packages (from pandas<1.4.0dev0,>=1.2.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (2022.7)\n",
+      "Requirement already satisfied: python-dateutil>=2.7.3 in /usr/local/lib/python3.8/dist-packages (from pandas<1.4.0dev0,>=1.2.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (2.8.2)\n",
+      "Requirement already satisfied: zipp>=0.5 in /usr/local/lib/python3.8/dist-packages (from importlib-metadata; python_version < \"3.9\"->numba>=0.54->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (3.11.0)\n",
+      "Requirement already satisfied: multidict in /usr/local/lib/python3.8/dist-packages (from grpclib->betterproto<2.0.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (6.0.4)\n",
+      "Requirement already satisfied: h2<5,>=3.1.0 in /usr/local/lib/python3.8/dist-packages (from grpclib->betterproto<2.0.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (4.1.0)\n",
+      "Requirement already satisfied: heapdict in /usr/local/lib/python3.8/dist-packages (from zict>=0.1.3->distributed>=2022.3.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (1.0.1)\n",
+      "Requirement already satisfied: MarkupSafe>=2.0 in /usr/local/lib/python3.8/dist-packages (from jinja2->distributed>=2022.3.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (2.1.1)\n",
+      "Requirement already satisfied: six>=1.5 in /usr/lib/python3/dist-packages (from python-dateutil>=2.7.3->pandas<1.4.0dev0,>=1.2.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (1.14.0)\n",
+      "Requirement already satisfied: hyperframe<7,>=6.0 in /usr/local/lib/python3.8/dist-packages (from h2<5,>=3.1.0->grpclib->betterproto<2.0.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (6.0.1)\n",
+      "Requirement already satisfied: hpack<5,>=4.0 in /usr/local/lib/python3.8/dist-packages (from h2<5,>=3.1.0->grpclib->betterproto<2.0.0->merlin-core>=0.2.0->merlin-models==23.2.0+7.ga86201ee) (4.0.0)\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Building wheels for collected packages: merlin-models\n",
+      "  Building wheel for merlin-models (PEP 517): started\n",
+      "  Building wheel for merlin-models (PEP 517): finished with status 'done'\n",
+      "  Created wheel for merlin-models: filename=merlin_models-23.2.0+7.ga86201ee-py3-none-any.whl size=374647 sha256=e83a617585afdc41213cc3cf69dd7c136b778260ce9dc14c37e87c4a5675372a\n",
+      "  Stored in directory: /tmp/pip-ephem-wheel-cache-uc9xl_m5/wheels/4d/e8/98/0493db55fff90dc9af123f55a9455b96f7f8166c912a02c8a6\n",
+      "Successfully built merlin-models\n",
+      "Installing collected packages: merlin-models\n",
+      "  Attempting uninstall: merlin-models\n",
+      "    Found existing installation: merlin-models 0.11.0\n",
+      "    Uninstalling merlin-models-0.11.0:\n",
+      "      Successfully uninstalled merlin-models-0.11.0\n",
+      "Successfully installed merlin-models-23.2.0+7.ga86201ee\n"
+     ]
+    },
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "Previous HEAD position was a86201ee add masking support to SequencePredictRandom transform\n",
+      "Switched to branch 'main'\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Your branch is behind 'origin/main' by 75 commits, and can be fast-forwarded.\n",
+      "  (use \"git pull\" to update your local branch)\n"
+     ]
+    },
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "From https://github.com/NVIDIA-Merlin/Models\n",
+      " * branch              main       -> FETCH_HEAD\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Updating 835ad186..d8133b8f\n",
+      "Fast-forward\n",
+      " .github/workflows/blossom-ci.yml                   |  102 --\n",
+      " .github/workflows/check-base-branch.yaml           |    9 +\n",
+      " .github/workflows/cpu-horovod.yml                  |   53 +\n",
+      " .github/workflows/cpu-nvtabular.yml                |   10 +-\n",
+      " .github/workflows/cpu-systems.yml                  |   10 +-\n",
+      " .github/workflows/cpu-t4r.yml                      |   41 +\n",
+      " .github/workflows/datasets.yml                     |    8 +-\n",
+      " .github/workflows/docs-build.yaml                  |    2 +-\n",
+      " .github/workflows/docs-sched-rebuild.yaml          |    7 +-\n",
+      " .github/workflows/gpu-ci.yml                       |   12 +-\n",
+      " .github/workflows/implicit.yml                     |    8 +-\n",
+      " .github/workflows/lightfm.yml                      |   14 +-\n",
+      " .github/workflows/multi-gpu-ci.yml                 |   34 +\n",
+      " .github/workflows/packages.yaml                    |  120 ++\n",
+      " .github/workflows/pre-commit.yml                   |    8 +\n",
+      " .github/workflows/pytorch.yml                      |   85 +-\n",
+      " .github/workflows/release-drafter.yaml             |    2 +-\n",
+      " .github/workflows/set-stable-branch.yaml           |   10 +\n",
+      " .github/workflows/tensorflow.yml                   |   49 +-\n",
+      " .github/workflows/xgboost.yml                      |    8 +-\n",
+      " .pre-commit-config.yaml                            |   10 +-\n",
+      " MANIFEST.in                                        |    5 +-\n",
+      " README.md                                          |    2 +-\n",
+      " ci/pr.gpu.Jenkinsfile                              |    2 +-\n",
+      " conda/recipes/meta.yaml                            |   17 +-\n",
+      " docs/README.md                                     |   46 +-\n",
+      " docs/source/api.rst                                |   99 +-\n",
+      " examples/01-Getting-started.ipynb                  |  101 +-\n",
+      " ...2-Merlin-Models-and-NVTabular-integration.ipynb |   13 +-\n",
+      " examples/03-Exploring-different-models.ipynb       |   25 +-\n",
+      " examples/04-Exporting-ranking-models.ipynb         |    9 +-\n",
+      " examples/05-Retrieval-Model.ipynb                  |   30 +-\n",
+      " ...-your-own-architecture-with-Merlin-Models.ipynb |  546 +++----\n",
+      " ...nal-ML-models-using-the-Merlin-Models-API.ipynb |  701 +++++++-\n",
+      " examples/images/mtl_architectures.png              |  Bin 0 -> 72404 bytes\n",
+      " ...ing-of-large-embedding-tables-by-LazyAdam.ipynb |   12 +-\n",
+      " ...on-based-next-item-prediction-for-fashion.ipynb |   11 +-\n",
+      " .../entertainment-with-pretrained-embeddings.ipynb |    8 +-\n",
+      " .../incremental-training-with-layer-freezing.ipynb |  275 ++--\n",
+      " .../multi-gpu-data-parallel-training.ipynb         |    7 +-\n",
+      " .../multi-gpu/install_sparse_operation_kit.sh      |   16 +\n",
+      " .../usecases/ranking_with_multitask_learning.ipynb | 1718 ++++++++++++++++++++\n",
+      " ...etrieval-with-hyperparameter-optimization.ipynb |    5 +-\n",
+      " .../transformers-next-item-prediction.ipynb        | 1085 ++++++++----\n",
+      " .../ecommerce/booking/transformed/schema.pbtxt     |   15 +-\n",
+      " merlin/datasets/ecommerce/small/schema.json        |    7 +-\n",
+      " .../entertainment/movielens/100k/schema.pbtxt      |    1 +\n",
+      " .../entertainment/movielens/1m/schema.pbtxt        |    3 +-\n",
+      " .../entertainment/movielens/25m/schema.pbtxt       |    1 +\n",
+      " .../entertainment/music_streaming/schema.json      |   10 +-\n",
+      " .../entertainment/tenrec_video}/__init__.py        |    0\n",
+      " .../entertainment/tenrec_video/schema.pbtxt        |  159 ++\n",
+      " merlin/datasets/synthetic.py                       |  104 +-\n",
+      " .../datasets/testing/sequence_testing/schema.json  |   24 +-\n",
+      " merlin/models/implicit/__init__.py                 |  115 +-\n",
+      " merlin/models/io.py                                |    2 -\n",
+      " merlin/models/lightfm/__init__.py                  |  132 +-\n",
+      " merlin/models/tf/__init__.py                       |   12 +-\n",
+      " merlin/models/tf/blocks/dlrm.py                    |   21 +-\n",
+      " merlin/models/tf/blocks/experts.py                 |   33 +-\n",
+      " merlin/models/tf/blocks/optimizer.py               |   74 +-\n",
+      " merlin/models/tf/blocks/retrieval/base.py          |    1 -\n",
+      " merlin/models/tf/core/aggregation.py               |   87 +-\n",
+      " merlin/models/tf/core/combinators.py               |    6 +-\n",
+      " merlin/models/tf/core/encoder.py                   |   54 +-\n",
+      " merlin/models/tf/core/tabular.py                   |    3 +-\n",
+      " merlin/models/tf/distributed/backend.py            |   20 +\n",
+      " merlin/models/tf/distributed/embedding.py          |  232 +++\n",
+      " merlin/models/tf/experimental/sample_weight.py     |  177 ++\n",
+      " merlin/models/tf/inputs/base.py                    |   26 +-\n",
+      " merlin/models/tf/inputs/continuous.py              |   41 +-\n",
+      " merlin/models/tf/inputs/embedding.py               |  138 +-\n",
+      " merlin/models/tf/loader.py                         |   36 +-\n",
+      " merlin/models/tf/metrics/__init__.py               |   31 +-\n",
+      " merlin/models/tf/metrics/evaluation.py             |    4 +-\n",
+      " merlin/models/tf/metrics/topk.py                   |   17 +-\n",
+      " merlin/models/tf/models/base.py                    |  887 +++++++---\n",
+      " merlin/models/tf/models/benchmark.py               |   20 +-\n",
+      " merlin/models/tf/models/ranking.py                 |   93 +-\n",
+      " merlin/models/tf/models/retrieval.py               |    5 +\n",
+      " merlin/models/tf/models/utils.py                   |   38 +\n",
+      " merlin/models/tf/outputs/base.py                   |   27 +-\n",
+      " merlin/models/tf/outputs/block.py                  |  300 ++++\n",
+      " merlin/models/tf/outputs/classification.py         |   14 +-\n",
+      " merlin/models/tf/outputs/contrastive.py            |   65 +-\n",
+      " merlin/models/tf/outputs/regression.py             |    8 +-\n",
+      " merlin/models/tf/outputs/sampling/base.py          |   34 +-\n",
+      " merlin/models/tf/outputs/sampling/popularity.py    |   93 +-\n",
+      " merlin/models/tf/outputs/topk.py                   |    2 -\n",
+      " merlin/models/tf/prediction_tasks/base.py          |   15 +\n",
+      " .../models/tf/prediction_tasks/classification.py   |   11 +-\n",
+      " merlin/models/tf/prediction_tasks/regression.py    |    3 +-\n",
+      " merlin/models/tf/transformers/block.py             |   61 +-\n",
+      " merlin/models/tf/transformers/transforms.py        |   52 +-\n",
+      " merlin/models/tf/transforms/bias.py                |   18 +-\n",
+      " merlin/models/tf/transforms/features.py            |  579 +++++--\n",
+      " merlin/models/tf/transforms/negative_sampling.py   |   25 +-\n",
+      " merlin/models/tf/transforms/sequence.py            |  523 ++++--\n",
+      " merlin/models/tf/transforms/tensor.py              |  249 +--\n",
+      " merlin/models/tf/utils/batch_utils.py              |    8 +-\n",
+      " merlin/models/tf/utils/testing_utils.py            |   81 +-\n",
+      " merlin/models/tf/utils/tf_utils.py                 |   85 +-\n",
+      " merlin/models/torch/__init__.py                    |   97 --\n",
+      " merlin/models/torch/block/base.py                  |  321 ----\n",
+      " merlin/models/torch/block/mlp.py                   |   95 --\n",
+      " merlin/models/torch/features/base.py               |   23 -\n",
+      " merlin/models/torch/features/continuous.py         |   66 -\n",
+      " merlin/models/torch/features/embedding.py          |  497 ------\n",
+      " merlin/models/torch/features/tabular.py            |  217 ---\n",
+      " merlin/models/torch/losses.py                      |   75 -\n",
+      " merlin/models/torch/model/__init__.py              |   15 -\n",
+      " merlin/models/torch/model/base.py                  |  660 --------\n",
+      " merlin/models/torch/model/prediction_task.py       |  101 --\n",
+      " merlin/models/torch/tabular/__init__.py            |   15 -\n",
+      " merlin/models/torch/tabular/aggregation.py         |  149 --\n",
+      " merlin/models/torch/tabular/base.py                |  640 --------\n",
+      " merlin/models/torch/tabular/transformations.py     |  124 --\n",
+      " merlin/models/torch/typing.py                      |   30 -\n",
+      " merlin/models/torch/utils/__init__.py              |   15 -\n",
+      " merlin/models/torch/utils/data_utils.py            |  376 -----\n",
+      " merlin/models/torch/utils/examples_utils.py        |  107 --\n",
+      " merlin/models/torch/utils/torch_utils.py           |  210 ---\n",
+      " merlin/models/utils/dataset.py                     |   59 +-\n",
+      " merlin/models/utils/misc_utils.py                  |    7 +-\n",
+      " merlin/models/utils/nvt_utils.py                   |    6 +-\n",
+      " merlin/models/utils/schema_utils.py                |   24 +-\n",
+      " merlin/models/xgb/__init__.py                      |    1 -\n",
+      " pytest.ini                                         |   15 +\n",
+      " requirements/base.txt                              |    4 +-\n",
+      " requirements/docs.txt                              |    3 +-\n",
+      " requirements/horovod-cpu-environment.yml           |   18 +\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      " requirements/horovod.txt                           |    1 +\n",
+      " requirements/tensorflow.txt                        |    2 +-\n",
+      " requirements/test.txt                              |    2 +-\n",
+      " requirements/transformers.txt                      |    2 +-\n",
+      " tests/common/tf/retrieval/retrieval_utils.py       |    4 +-\n",
+      " tests/integration/tf/test_ci_01_getting_started.py |   20 +-\n",
+      " .../tf/test_ci_03_exploring_different_models.py    |    8 +-\n",
+      " .../tf/test_ci_06_advanced_own_architecture.py     |    8 +-\n",
+      " tests/unit/datasets/test_ecommerce.py              |   27 +-\n",
+      " tests/unit/datasets/test_synthetic.py              |   15 +-\n",
+      " tests/unit/implicit/test_implicit.py               |   60 +-\n",
+      " tests/unit/lightfm/test_lightfm.py                 |   68 +\n",
+      " .../blocks/retrieval/test_matrix_factorization.py  |    7 +-\n",
+      " tests/unit/tf/blocks/retrieval/test_two_tower.py   |    9 +-\n",
+      " tests/unit/tf/blocks/test_cross.py                 |    2 -\n",
+      " tests/unit/tf/blocks/test_interactions.py          |    6 +-\n",
+      " tests/unit/tf/blocks/test_mlp.py                   |   39 +\n",
+      " tests/unit/tf/blocks/test_optimizer.py             |   64 +-\n",
+      " tests/unit/tf/core/test_base.py                    |    5 +-\n",
+      " tests/unit/tf/core/test_combinators.py             |    1 +\n",
+      " tests/unit/tf/core/test_encoder.py                 |    6 +-\n",
+      " tests/unit/tf/core/test_prediction.py              |    2 +-\n",
+      " tests/unit/tf/examples/test_01_getting_started.py  |    8 +-\n",
+      " .../examples/test_03_exploring_different_models.py |    8 +-\n",
+      " ...test_usecase_accelerate_training_by_lazyadam.py |    1 +\n",
+      " ..._usecase_incremental_training_layer_freezing.py |    2 +-\n",
+      " ...test_usecase_ranking_with_multitask_learning.py |   46 +\n",
+      " ...st_usecase_transformers_next_item_prediction.py |   36 +-\n",
+      " .../unit/tf/experimental}/__init__.py              |    0\n",
+      " tests/unit/tf/experimental/test_sample_weight.py   |  112 ++\n",
+      " tests/unit/tf/horovod/__init__.py                  |    2 +-\n",
+      " tests/unit/tf/horovod/test_embedding.py            |   46 +\n",
+      " tests/unit/tf/horovod/test_horovod.py              |   10 +-\n",
+      " tests/unit/tf/inputs/test_base.py                  |    2 +-\n",
+      " tests/unit/tf/inputs/test_block.py                 |  202 +++\n",
+      " tests/unit/tf/inputs/test_continuous.py            |    4 +-\n",
+      " tests/unit/tf/inputs/test_embedding.py             |   41 +-\n",
+      " tests/unit/tf/inputs/test_tabular.py               |   10 +-\n",
+      " tests/unit/tf/metrics/test_metrics_topk.py         |    2 -\n",
+      " tests/unit/tf/models/test_base.py                  |   93 +-\n",
+      " tests/unit/tf/models/test_benchmark.py             |   13 +-\n",
+      " tests/unit/tf/models/test_ranking.py               |  103 +-\n",
+      " tests/unit/tf/models/test_retrieval.py             |   35 +-\n",
+      " tests/unit/tf/outputs/test_base.py                 |   78 +-\n",
+      " tests/unit/tf/outputs/test_block.py                |  936 +++++++++++\n",
+      " tests/unit/tf/outputs/test_classification.py       |   69 +-\n",
+      " tests/unit/tf/outputs/test_contrastive.py          |   28 +-\n",
+      " tests/unit/tf/outputs/test_sampling.py             |   17 +-\n",
+      " tests/unit/tf/prediction_tasks/test_multi_task.py  |  281 +++-\n",
+      " tests/unit/tf/test_loader.py                       |   28 +-\n",
+      " tests/unit/tf/transformers/test_block.py           |  187 ++-\n",
+      " tests/unit/tf/transforms/test_features.py          |  123 +-\n",
+      " tests/unit/tf/transforms/test_negative_sampling.py |   63 +-\n",
+      " tests/unit/tf/transforms/test_noise.py             |    1 -\n",
+      " tests/unit/tf/transforms/test_sequence.py          |   55 +-\n",
+      " tests/unit/tf/transforms/test_tensor.py            |   20 +-\n",
+      " tests/unit/tf/utils/test_batch.py                  |   20 +-\n",
+      " tests/unit/torch/__init__.py                       |   18 -\n",
+      " tests/unit/torch/_conftest.py                      |  151 --\n",
+      " tests/unit/torch/block/__init__.py                 |   15 -\n",
+      " tests/unit/torch/block/test_base.py                |   62 -\n",
+      " tests/unit/torch/block/test_mlp.py                 |   30 -\n",
+      " tests/unit/torch/features/__init__.py              |   15 -\n",
+      " tests/unit/torch/features/test_continuous.py       |   34 -\n",
+      " tests/unit/torch/features/test_embedding.py        |  250 ---\n",
+      " tests/unit/torch/features/test_tabular.py          |   84 -\n",
+      " tests/unit/torch/model/__init__.py                 |   15 -\n",
+      " tests/unit/torch/model/test_head.py                |   92 --\n",
+      " tests/unit/torch/model/test_model.py               |  122 --\n",
+      " tests/unit/torch/tabular/__init__.py               |   15 -\n",
+      " tests/unit/torch/tabular/test_aggregation.py       |  106 --\n",
+      " tests/unit/torch/tabular/test_tabular.py           |   88 -\n",
+      " tests/unit/torch/tabular/test_transformations.py   |  122 --\n",
+      " tests/unit/torch/test_dataloader_utils.py          |   86 -\n",
+      " tests/unit/torch/test_losses.py                    |   53 -\n",
+      " tests/unit/torch/test_public_api.py                |   27 -\n",
+      " tests/unit/torch/utils/__init__.py                 |   15 -\n",
+      " tests/unit/xgb/test_xgboost.py                     |    2 +-\n",
+      " tox.ini                                            |   78 +-\n",
+      " 210 files changed, 10688 insertions(+), 8019 deletions(-)\n",
+      " delete mode 100644 .github/workflows/blossom-ci.yml\n",
+      " create mode 100644 .github/workflows/check-base-branch.yaml\n",
+      " create mode 100644 .github/workflows/cpu-horovod.yml\n",
+      " create mode 100644 .github/workflows/cpu-t4r.yml\n",
+      " create mode 100644 .github/workflows/multi-gpu-ci.yml\n",
+      " create mode 100644 .github/workflows/packages.yaml\n",
+      " create mode 100644 .github/workflows/set-stable-branch.yaml\n",
+      " create mode 100644 examples/images/mtl_architectures.png\n",
+      " create mode 100644 examples/usecases/multi-gpu/install_sparse_operation_kit.sh\n",
+      " create mode 100644 examples/usecases/ranking_with_multitask_learning.ipynb\n",
+      " rename merlin/{models/torch/block => datasets/entertainment/tenrec_video}/__init__.py (100%)\n",
+      " create mode 100644 merlin/datasets/entertainment/tenrec_video/schema.pbtxt\n",
+      " create mode 100644 merlin/models/tf/distributed/embedding.py\n",
+      " create mode 100644 merlin/models/tf/experimental/sample_weight.py\n",
+      " create mode 100644 merlin/models/tf/outputs/block.py\n",
+      " delete mode 100644 merlin/models/torch/__init__.py\n",
+      " delete mode 100644 merlin/models/torch/block/base.py\n",
+      " delete mode 100644 merlin/models/torch/block/mlp.py\n",
+      " delete mode 100644 merlin/models/torch/features/base.py\n",
+      " delete mode 100644 merlin/models/torch/features/continuous.py\n",
+      " delete mode 100644 merlin/models/torch/features/embedding.py\n",
+      " delete mode 100644 merlin/models/torch/features/tabular.py\n",
+      " delete mode 100644 merlin/models/torch/losses.py\n",
+      " delete mode 100644 merlin/models/torch/model/__init__.py\n",
+      " delete mode 100644 merlin/models/torch/model/base.py\n",
+      " delete mode 100644 merlin/models/torch/model/prediction_task.py\n",
+      " delete mode 100644 merlin/models/torch/tabular/__init__.py\n",
+      " delete mode 100644 merlin/models/torch/tabular/aggregation.py\n",
+      " delete mode 100644 merlin/models/torch/tabular/base.py\n",
+      " delete mode 100644 merlin/models/torch/tabular/transformations.py\n",
+      " delete mode 100644 merlin/models/torch/typing.py\n",
+      " delete mode 100644 merlin/models/torch/utils/__init__.py\n",
+      " delete mode 100644 merlin/models/torch/utils/data_utils.py\n",
+      " delete mode 100644 merlin/models/torch/utils/examples_utils.py\n",
+      " delete mode 100644 merlin/models/torch/utils/torch_utils.py\n",
+      " create mode 100644 pytest.ini\n",
+      " create mode 100644 requirements/horovod-cpu-environment.yml\n",
+      " create mode 100644 tests/unit/tf/examples/test_usecase_ranking_with_multitask_learning.py\n",
+      " rename {merlin/models/torch/features => tests/unit/tf/experimental}/__init__.py (100%)\n",
+      " create mode 100644 tests/unit/tf/experimental/test_sample_weight.py\n",
+      " create mode 100644 tests/unit/tf/horovod/test_embedding.py\n",
+      " create mode 100644 tests/unit/tf/inputs/test_block.py\n",
+      " create mode 100644 tests/unit/tf/outputs/test_block.py\n",
+      " delete mode 100644 tests/unit/torch/__init__.py\n",
+      " delete mode 100644 tests/unit/torch/_conftest.py\n",
+      " delete mode 100644 tests/unit/torch/block/__init__.py\n",
+      " delete mode 100644 tests/unit/torch/block/test_base.py\n",
+      " delete mode 100644 tests/unit/torch/block/test_mlp.py\n",
+      " delete mode 100644 tests/unit/torch/features/__init__.py\n",
+      " delete mode 100644 tests/unit/torch/features/test_continuous.py\n",
+      " delete mode 100644 tests/unit/torch/features/test_embedding.py\n",
+      " delete mode 100644 tests/unit/torch/features/test_tabular.py\n",
+      " delete mode 100644 tests/unit/torch/model/__init__.py\n",
+      " delete mode 100644 tests/unit/torch/model/test_head.py\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      " delete mode 100644 tests/unit/torch/model/test_model.py\n",
+      " delete mode 100644 tests/unit/torch/tabular/__init__.py\n",
+      " delete mode 100644 tests/unit/torch/tabular/test_aggregation.py\n",
+      " delete mode 100644 tests/unit/torch/tabular/test_tabular.py\n",
+      " delete mode 100644 tests/unit/torch/tabular/test_transformations.py\n",
+      " delete mode 100644 tests/unit/torch/test_dataloader_utils.py\n",
+      " delete mode 100644 tests/unit/torch/test_losses.py\n",
+      " delete mode 100644 tests/unit/torch/test_public_api.py\n",
+      " delete mode 100644 tests/unit/torch/utils/__init__.py\n",
+      "Processing /models\n",
+      "  Installing build dependencies: started\n",
+      "  Installing build dependencies: finished with status 'done'\n",
+      "  Getting requirements to build wheel: started\n",
+      "  Getting requirements to build wheel: finished with status 'done'\n",
+      "    Preparing wheel metadata: started\n",
+      "    Preparing wheel metadata: finished with status 'done'\n",
+      "Collecting merlin-core>=23.4.0\n",
+      "  Downloading merlin-core-23.4.0.tar.gz (133 kB)\n",
+      "  Installing build dependencies: started\n",
+      "  Installing build dependencies: finished with status 'done'\n",
+      "  Getting requirements to build wheel: started\n",
+      "  Getting requirements to build wheel: finished with status 'done'\n",
+      "    Preparing wheel metadata: started\n",
+      "    Preparing wheel metadata: finished with status 'done'\n",
+      "Collecting merlin-dataloader>=23.4.0\n",
+      "  Downloading merlin-dataloader-23.4.0.tar.gz (46 kB)\n",
+      "  Installing build dependencies: started\n",
+      "  Installing build dependencies: finished with status 'done'\n",
+      "  Getting requirements to build wheel: started\n",
+      "  Getting requirements to build wheel: finished with status 'done'\n",
+      "    Preparing wheel metadata: started\n",
+      "    Preparing wheel metadata: finished with status 'done'\n",
+      "Requirement already satisfied: pyarrow>=5.0.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (8.0.0)\n",
+      "Collecting dask-cuda>=22.12.0\n",
+      "  Downloading dask_cuda-23.4.0-py3-none-any.whl (125 kB)\n",
+      "Requirement already satisfied: numba>=0.54 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (0.56.4)\n",
+      "Requirement already satisfied: tensorflow-metadata>=1.2.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (1.12.0)\n",
+      "Requirement already satisfied: pynvml<11.5,>=11.0.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (11.4.1)\n",
+      "Collecting fsspec>=2022.7.1\n",
+      "  Downloading fsspec-2023.5.0-py3-none-any.whl (160 kB)\n",
+      "Collecting dask>=2022.11.1\n",
+      "  Downloading dask-2023.4.1-py3-none-any.whl (1.2 MB)\n",
+      "Requirement already satisfied: numpy>=1.22.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (1.22.4)\n",
+      "Requirement already satisfied: packaging in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (22.0)\n",
+      "Requirement already satisfied: protobuf>=3.0.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (3.19.6)\n",
+      "Requirement already satisfied: pandas<1.6.0dev0,>=1.2.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (1.3.5)\n",
+      "Collecting distributed>=2022.11.1\n",
+      "  Downloading distributed-2023.4.1-py3-none-any.whl (962 kB)\n",
+      "Requirement already satisfied: betterproto<2.0.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (1.2.5)\n",
+      "Requirement already satisfied: tqdm>=4.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (4.64.1)\n",
+      "Requirement already satisfied: zict>=0.1.3 in /usr/local/lib/python3.8/dist-packages (from dask-cuda>=22.12.0->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (2.2.0)\n",
+      "Requirement already satisfied: setuptools in /usr/lib/python3/dist-packages (from numba>=0.54->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (45.2.0)\n",
+      "Requirement already satisfied: importlib-metadata; python_version < \"3.9\" in /usr/local/lib/python3.8/dist-packages (from numba>=0.54->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (5.2.0)\n",
+      "Requirement already satisfied: llvmlite<0.40,>=0.39.0dev0 in /usr/local/lib/python3.8/dist-packages (from numba>=0.54->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (0.39.1)\n",
+      "Requirement already satisfied: googleapis-common-protos<2,>=1.52.0 in /usr/local/lib/python3.8/dist-packages (from tensorflow-metadata>=1.2.0->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (1.57.0)\n",
+      "Requirement already satisfied: absl-py<2.0.0,>=0.9 in /usr/local/lib/python3.8/dist-packages (from tensorflow-metadata>=1.2.0->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (1.3.0)\n",
+      "Requirement already satisfied: toolz>=0.10.0 in /usr/local/lib/python3.8/dist-packages (from dask>=2022.11.1->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (0.12.0)\n",
+      "Requirement already satisfied: click>=8.0 in /usr/local/lib/python3.8/dist-packages (from dask>=2022.11.1->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (8.1.3)\n",
+      "Requirement already satisfied: cloudpickle>=1.5.0 in /usr/local/lib/python3.8/dist-packages (from dask>=2022.11.1->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (2.2.0)\n",
+      "Requirement already satisfied: pyyaml>=5.3.1 in /usr/local/lib/python3.8/dist-packages (from dask>=2022.11.1->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (6.0)\n",
+      "Requirement already satisfied: partd>=1.2.0 in /usr/local/lib/python3.8/dist-packages (from dask>=2022.11.1->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (1.3.0)\n",
+      "Requirement already satisfied: pytz>=2017.3 in /usr/local/lib/python3.8/dist-packages (from pandas<1.6.0dev0,>=1.2.0->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (2022.7)\n",
+      "Requirement already satisfied: python-dateutil>=2.7.3 in /usr/local/lib/python3.8/dist-packages (from pandas<1.6.0dev0,>=1.2.0->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (2.8.2)\n",
+      "Requirement already satisfied: jinja2>=2.10.3 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (3.1.2)\n",
+      "Requirement already satisfied: tblib>=1.6.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (1.7.0)\n",
+      "Requirement already satisfied: psutil>=5.7.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (5.9.4)\n",
+      "Requirement already satisfied: locket>=1.0.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (1.0.0)\n",
+      "Requirement already satisfied: sortedcontainers>=2.0.5 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (2.4.0)\n",
+      "Requirement already satisfied: urllib3>=1.24.3 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (1.26.13)\n",
+      "Requirement already satisfied: tornado>=6.0.3 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (6.1)\n",
+      "Requirement already satisfied: msgpack>=1.0.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (1.0.4)\n",
+      "Requirement already satisfied: grpclib in /usr/local/lib/python3.8/dist-packages (from betterproto<2.0.0->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (0.4.3)\n",
+      "Requirement already satisfied: stringcase in /usr/local/lib/python3.8/dist-packages (from betterproto<2.0.0->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (1.2.0)\n",
+      "Requirement already satisfied: heapdict in /usr/local/lib/python3.8/dist-packages (from zict>=0.1.3->dask-cuda>=22.12.0->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (1.0.1)\n",
+      "Requirement already satisfied: zipp>=0.5 in /usr/local/lib/python3.8/dist-packages (from importlib-metadata; python_version < \"3.9\"->numba>=0.54->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (3.11.0)\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Requirement already satisfied: six>=1.5 in /usr/lib/python3/dist-packages (from python-dateutil>=2.7.3->pandas<1.6.0dev0,>=1.2.0->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (1.14.0)\n",
+      "Requirement already satisfied: MarkupSafe>=2.0 in /usr/local/lib/python3.8/dist-packages (from jinja2>=2.10.3->distributed>=2022.11.1->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (2.1.1)\n",
+      "Requirement already satisfied: h2<5,>=3.1.0 in /usr/local/lib/python3.8/dist-packages (from grpclib->betterproto<2.0.0->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (4.1.0)\n",
+      "Requirement already satisfied: multidict in /usr/local/lib/python3.8/dist-packages (from grpclib->betterproto<2.0.0->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (6.0.4)\n",
+      "Requirement already satisfied: hyperframe<7,>=6.0 in /usr/local/lib/python3.8/dist-packages (from h2<5,>=3.1.0->grpclib->betterproto<2.0.0->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (6.0.1)\n",
+      "Requirement already satisfied: hpack<5,>=4.0 in /usr/local/lib/python3.8/dist-packages (from h2<5,>=3.1.0->grpclib->betterproto<2.0.0->merlin-core>=23.4.0->merlin-models==23.5.dev0+12.gd8133b8f) (4.0.0)\n",
+      "Building wheels for collected packages: merlin-models, merlin-core, merlin-dataloader\n",
+      "  Building wheel for merlin-models (PEP 517): started\n",
+      "  Building wheel for merlin-models (PEP 517): finished with status 'done'\n",
+      "  Created wheel for merlin-models: filename=merlin_models-23.5.dev0+12.gd8133b8f-py3-none-any.whl size=343289 sha256=1f20f65acef288535cc4e5bca6de216485c546156d707b17b3bb9b8ceedc3ec7\n",
+      "  Stored in directory: /tmp/pip-ephem-wheel-cache-0prgr6hn/wheels/4d/e8/98/0493db55fff90dc9af123f55a9455b96f7f8166c912a02c8a6\n",
+      "  Building wheel for merlin-core (PEP 517): started\n",
+      "  Building wheel for merlin-core (PEP 517): finished with status 'done'\n",
+      "  Created wheel for merlin-core: filename=merlin_core-23.4.0-py3-none-any.whl size=159556 sha256=9a716886c9862c32bd19979d286f32eb664022c85bcee19ca2d762fa014c8e85\n",
+      "  Stored in directory: /root/.cache/pip/wheels/42/ef/87/2c64bce8c3064a2c4e399933df4eda4838939355698ff8f7c7\n",
+      "  Building wheel for merlin-dataloader (PEP 517): started\n",
+      "  Building wheel for merlin-dataloader (PEP 517): finished with status 'done'\n",
+      "  Created wheel for merlin-dataloader: filename=merlin_dataloader-23.4.0-py3-none-any.whl size=34732 sha256=a7853a487205c4a6fdf99d03bda0cacba559264387e507e2f8d6cd87dc471c80\n",
+      "  Stored in directory: /root/.cache/pip/wheels/90/b0/66/48e52cc29f544ffbd105154b8be0901b5bb80cc85842b778fc\n",
+      "Successfully built merlin-models merlin-core merlin-dataloader\n"
+     ]
+    },
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "ERROR: dask-cudf 22.8.0a0+304.g6ca81bbc78.dirty requires cupy-cuda118<12,>=9.5.0, which is not installed.\n",
+      "ERROR: cudf 22.8.0a0+304.g6ca81bbc78.dirty requires cupy-cuda118<12,>=9.5.0, which is not installed.\n",
+      "ERROR: dask-cudf 22.8.0a0+304.g6ca81bbc78.dirty has requirement dask==2022.7.1, but you'll have dask 2023.4.1 which is incompatible.\n",
+      "ERROR: dask-cudf 22.8.0a0+304.g6ca81bbc78.dirty has requirement distributed==2022.7.1, but you'll have distributed 2023.4.1 which is incompatible.\n",
+      "ERROR: dask-cuda 23.4.0 has requirement dask==2023.3.2, but you'll have dask 2023.4.1 which is incompatible.\n",
+      "ERROR: dask-cuda 23.4.0 has requirement distributed==2023.3.2.1, but you'll have distributed 2023.4.1 which is incompatible.\n",
+      "ERROR: cudf 22.8.0a0+304.g6ca81bbc78.dirty has requirement cuda-python<11.7.1,>=11.5, but you'll have cuda-python 11.8.1 which is incompatible.\n",
+      "ERROR: cudf 22.8.0a0+304.g6ca81bbc78.dirty has requirement protobuf<3.21.0a0,>=3.20.1, but you'll have protobuf 3.19.6 which is incompatible.\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Installing collected packages: fsspec, dask, distributed, dask-cuda, merlin-core, merlin-dataloader, merlin-models\n",
+      "  Attempting uninstall: fsspec\n",
+      "    Found existing installation: fsspec 2022.5.0\n",
+      "    Uninstalling fsspec-2022.5.0:\n",
+      "      Successfully uninstalled fsspec-2022.5.0\n",
+      "  Attempting uninstall: dask\n",
+      "    Found existing installation: dask 2022.7.1\n",
+      "    Uninstalling dask-2022.7.1:\n",
+      "      Successfully uninstalled dask-2022.7.1\n",
+      "  Attempting uninstall: distributed\n",
+      "    Found existing installation: distributed 2022.7.1\n",
+      "    Uninstalling distributed-2022.7.1:\n",
+      "      Successfully uninstalled distributed-2022.7.1\n",
+      "  Attempting uninstall: dask-cuda\n",
+      "    Found existing installation: dask-cuda 22.8.0a0+36.g9860cad\n",
+      "    Uninstalling dask-cuda-22.8.0a0+36.g9860cad:\n",
+      "      Successfully uninstalled dask-cuda-22.8.0a0+36.g9860cad\n",
+      "  Attempting uninstall: merlin-core\n",
+      "    Found existing installation: merlin-core 0.10.0\n",
+      "    Uninstalling merlin-core-0.10.0:\n",
+      "      Successfully uninstalled merlin-core-0.10.0\n",
+      "  Attempting uninstall: merlin-dataloader\n",
+      "    Found existing installation: merlin-dataloader 0.0.4\n",
+      "    Uninstalling merlin-dataloader-0.0.4:\n",
+      "      Successfully uninstalled merlin-dataloader-0.0.4\n",
+      "  Attempting uninstall: merlin-models\n",
+      "    Found existing installation: merlin-models 23.2.0+7.ga86201ee\n",
+      "    Uninstalling merlin-models-23.2.0+7.ga86201ee:\n",
+      "      Successfully uninstalled merlin-models-23.2.0+7.ga86201ee\n",
+      "Successfully installed dask-2023.4.1 dask-cuda-23.4.0 distributed-2023.4.1 fsspec-2023.5.0 merlin-core-23.4.0 merlin-dataloader-23.4.0 merlin-models-23.5.dev0+12.gd8133b8f\n"
+     ]
+    },
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "Previous HEAD position was 2fc6889 add schema parameter to the `repartition` method (#192)\n",
+      "Switched to branch 'main'\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Your branch is up to date with 'origin/main'.\n"
+     ]
+    },
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "From https://github.com/NVIDIA-Merlin/core\n",
+      " * branch            main       -> FETCH_HEAD\n",
+      "   cd96ca5f..a0bcd30f main       -> origin/main\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Updating cd96ca5f..a0bcd30f\n",
+      "Fast-forward\n",
+      " .github/actionlint.yaml                            |   5 +\n",
+      " .github/release-drafter.yml                        |  44 +--\n",
+      " .github/workflows/ISSUE_TEMPLATE/bug-report.md     |  17 +-\n",
+      " .../ISSUE_TEMPLATE/documentation-request.md        |  12 +-\n",
+      " .../workflows/ISSUE_TEMPLATE/feature-request.md    |   5 +-\n",
+      " .../workflows/ISSUE_TEMPLATE/submit-question.md    |   3 +-\n",
+      " .github/workflows/ISSUE_TEMPLATE/task.md           |   5 +-\n",
+      " .github/workflows/check-base-branch.yaml           |   9 +\n",
+      " .github/workflows/cpu-ci.yml                       | 138 +-------\n",
+      " .github/workflows/cpu-models.yml                   |  44 ---\n",
+      " .github/workflows/cpu-nvtabular.yml                |  44 ---\n",
+      " .github/workflows/cpu-systems.yml                  |  44 ---\n",
+      " .github/workflows/docs-preview-pr.yaml             |   4 +-\n",
+      " .github/workflows/docs-sched-rebuild.yaml          |  51 +--\n",
+      " .github/workflows/gpu-ci.yml                       |  52 ++-\n",
+      " .github/workflows/lint.yaml                        |  11 +-\n",
+      " .github/workflows/merlin.yml                       |  35 ++\n",
+      " .github/workflows/packages.yaml                    | 154 ++++++++\n",
+      " .github/workflows/release-drafter.yaml             |   4 +-\n",
+      " .github/workflows/set-stable-branch.yaml           |  10 +\n",
+      " .github/workflows/tox.yml                          |  38 ++\n",
+      " .pre-commit-config.yaml                            |  55 +--\n",
+      " .prettierignore                                    |   2 +\n",
+      " CLA.md                                             |   9 +-\n",
+      " CONTRIBUTING.md                                    |  28 +-\n",
+      " README.md                                          |  68 ++--\n",
+      " ci/pr.gpu.Jenkinsfile                              |   2 +-\n",
+      " conda/recipe/meta.yaml                             |   4 +-\n",
+      " docs/README.md                                     |  49 ++-\n",
+      " merlin/core/compat/__init__.py                     | 143 ++++++++\n",
+      " merlin/core/compat/tensorflow.py                   |  92 +++++\n",
+      " merlin/core/compat/torch.py                        |  22 ++\n",
+      " merlin/core/dispatch.py                            | 245 ++++++++-----\n",
+      " merlin/core/has_gpu.py                             |  46 +++\n",
+      " merlin/core/utils.py                               |  88 +----\n",
+      " merlin/dag/__init__.py                             |   1 +\n",
+      " merlin/dag/base_operator.py                        |  30 +-\n",
+      " merlin/dag/dictarray.py                            |   3 +-\n",
+      " merlin/dag/executors.py                            | 242 +++++++------\n",
+      " merlin/dag/graph.py                                |  20 ++\n",
+      " merlin/dag/node.py                                 |   5 +-\n",
+      " merlin/dag/selector.py                             |  10 +-\n",
+      " merlin/dag/utils.py                                |  69 ++++\n",
+      " merlin/dispatch/lazy.py                            | 156 +++++++++\n",
+      " merlin/dtypes/__init__.py                          |  61 ++++\n",
+      " merlin/dtypes/aliases.py                           |  53 +++\n",
+      " merlin/dtypes/base.py                              | 179 ++++++++++\n",
+      " merlin/dtypes/mapping.py                           | 177 ++++++++++\n",
+      " .../compat.py => dtypes/mappings/__init__.py}      |  17 +-\n",
+      " merlin/dtypes/mappings/cudf.py                     |  61 ++++\n",
+      " merlin/dtypes/mappings/merlin.py                   |  51 +++\n",
+      " merlin/dtypes/mappings/numpy.py                    |  52 +++\n",
+      " merlin/dtypes/mappings/pandas.py                   |  38 ++\n",
+      " merlin/dtypes/mappings/python.py                   |  28 ++\n",
+      " merlin/dtypes/mappings/tf.py                       |  52 +++\n",
+      " merlin/dtypes/mappings/torch.py                    |  43 +++\n",
+      " merlin/dtypes/mappings/triton.py                   |  53 +++\n",
+      " merlin/dtypes/registry.py                          | 136 ++++++++\n",
+      " merlin/dtypes/shape.py                             | 200 +++++++++++\n",
+      " merlin/io/__init__.py                              |   2 +-\n",
+      " merlin/io/avro.py                                  |   6 +-\n",
+      " merlin/io/csv.py                                   |   9 +-\n",
+      " merlin/io/dask.py                                  |  74 +++-\n",
+      " merlin/io/dataframe_engine.py                      |   6 +-\n",
+      " merlin/io/dataset.py                               | 112 ++++--\n",
+      " merlin/io/fsspec_utils.py                          |  16 +-\n",
+      " merlin/io/parquet.py                               |  25 +-\n",
+      " merlin/io/shuffle.py                               |  13 +-\n",
+      " merlin/io/worker.py                                | 104 +++---\n",
+      " merlin/io/writer.py                                |   7 +-\n",
+      " merlin/io/writer_factory.py                        |  10 +-\n",
+      " merlin/schema/io/tensorflow_metadata.py            | 115 ++++--\n",
+      " merlin/schema/schema.py                            | 331 +++++++++++-------\n",
+      " merlin/schema/tags.py                              |   7 +-\n",
+      " merlin/table/__init__.py                           |  24 ++\n",
+      " merlin/table/conversions.py                        | 226 ++++++++++++\n",
+      " merlin/table/cupy_column.py                        | 108 ++++++\n",
+      " merlin/table/numpy_column.py                       | 122 +++++++\n",
+      " merlin/table/tensor_column.py                      | 261 ++++++++++++++\n",
+      " merlin/table/tensor_table.py                       | 294 ++++++++++++++++\n",
+      " merlin/table/tensorflow_column.py                  | 173 +++++++++\n",
+      " merlin/table/torch_column.py                       | 135 +++++++\n",
+      " requirements-gpu.txt                               |   2 +-\n",
+      " requirements.txt                                   |  13 +-\n",
+      " tests/conftest.py                                  |  35 +-\n",
+      " tests/unit/core/test_dispatch.py                   |  43 ++-\n",
+      " tests/unit/core/test_protocols.py                  |  10 +-\n",
+      " tests/unit/core/test_version.py                    |   2 +\n",
+      " tests/unit/dag/test_column_selector.py             |   6 +\n",
+      " tests/unit/dag/test_dag_utils.py                   |  31 ++\n",
+      " tests/unit/dispatch/test_lazy_dispatch.py          |  61 ++++\n",
+      " tests/unit/dtypes/test_cudf.py                     |  30 ++\n",
+      " tests/unit/dtypes/test_module.py                   |  61 ++++\n",
+      " tests/unit/dtypes/test_shape.py                    | 222 ++++++++++++\n",
+      " tests/unit/io/test_avro.py                         |   8 +-\n",
+      " tests/unit/io/test_dataset.py                      |  51 +++\n",
+      " tests/unit/io/test_io.py                           |  95 ++++-\n",
+      " tests/unit/io/test_worker.py                       | 142 ++++++++\n",
+      " tests/unit/schema/test_column_schemas.py           | 142 +++++---\n",
+      " tests/unit/schema/test_schema.py                   |  60 +++-\n",
+      " tests/unit/schema/test_schema_io.py                |  54 ++-\n",
+      " tests/unit/table/test_convert_column.py            | 164 +++++++++\n",
+      " tests/unit/table/test_tensor_column.py             | 262 ++++++++++++++\n",
+      " tests/unit/table/test_tensor_table.py              | 387 +++++++++++++++++++++\n",
+      " tests/unit/utils/test_utils.py                     |  16 +-\n",
+      " tox.ini                                            |  49 ++-\n",
+      " 106 files changed, 6299 insertions(+), 1146 deletions(-)\n",
+      " create mode 100644 .github/actionlint.yaml\n",
+      " create mode 100644 .github/workflows/check-base-branch.yaml\n",
+      " delete mode 100644 .github/workflows/cpu-models.yml\n",
+      " delete mode 100644 .github/workflows/cpu-nvtabular.yml\n",
+      " delete mode 100644 .github/workflows/cpu-systems.yml\n",
+      " create mode 100644 .github/workflows/merlin.yml\n",
+      " create mode 100644 .github/workflows/packages.yaml\n",
+      " create mode 100644 .github/workflows/set-stable-branch.yaml\n",
+      " create mode 100644 .github/workflows/tox.yml\n",
+      " create mode 100644 .prettierignore\n",
+      " create mode 100644 merlin/core/compat/__init__.py\n",
+      " create mode 100644 merlin/core/compat/tensorflow.py\n",
+      " create mode 100644 merlin/core/compat/torch.py\n",
+      " create mode 100644 merlin/core/has_gpu.py\n",
+      " create mode 100644 merlin/dag/utils.py\n",
+      " create mode 100644 merlin/dispatch/lazy.py\n",
+      " create mode 100644 merlin/dtypes/__init__.py\n",
+      " create mode 100644 merlin/dtypes/aliases.py\n",
+      " create mode 100644 merlin/dtypes/base.py\n",
+      " create mode 100644 merlin/dtypes/mapping.py\n",
+      " rename merlin/{core/compat.py => dtypes/mappings/__init__.py} (60%)\n",
+      " create mode 100644 merlin/dtypes/mappings/cudf.py\n",
+      " create mode 100644 merlin/dtypes/mappings/merlin.py\n",
+      " create mode 100644 merlin/dtypes/mappings/numpy.py\n",
+      " create mode 100644 merlin/dtypes/mappings/pandas.py\n",
+      " create mode 100644 merlin/dtypes/mappings/python.py\n",
+      " create mode 100644 merlin/dtypes/mappings/tf.py\n",
+      " create mode 100644 merlin/dtypes/mappings/torch.py\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      " create mode 100644 merlin/dtypes/mappings/triton.py\n",
+      " create mode 100644 merlin/dtypes/registry.py\n",
+      " create mode 100644 merlin/dtypes/shape.py\n",
+      " create mode 100644 merlin/table/__init__.py\n",
+      " create mode 100644 merlin/table/conversions.py\n",
+      " create mode 100644 merlin/table/cupy_column.py\n",
+      " create mode 100644 merlin/table/numpy_column.py\n",
+      " create mode 100644 merlin/table/tensor_column.py\n",
+      " create mode 100644 merlin/table/tensor_table.py\n",
+      " create mode 100644 merlin/table/tensorflow_column.py\n",
+      " create mode 100644 merlin/table/torch_column.py\n",
+      " create mode 100644 tests/unit/dag/test_dag_utils.py\n",
+      " create mode 100644 tests/unit/dispatch/test_lazy_dispatch.py\n",
+      " create mode 100644 tests/unit/dtypes/test_cudf.py\n",
+      " create mode 100644 tests/unit/dtypes/test_module.py\n",
+      " create mode 100644 tests/unit/dtypes/test_shape.py\n",
+      " create mode 100644 tests/unit/io/test_dataset.py\n",
+      " create mode 100644 tests/unit/io/test_worker.py\n",
+      " create mode 100644 tests/unit/table/test_convert_column.py\n",
+      " create mode 100644 tests/unit/table/test_tensor_column.py\n",
+      " create mode 100644 tests/unit/table/test_tensor_table.py\n",
+      "Processing /core\n",
+      "  Installing build dependencies: started\n",
+      "  Installing build dependencies: finished with status 'done'\n",
+      "  Getting requirements to build wheel: started\n",
+      "  Getting requirements to build wheel: finished with status 'done'\n",
+      "    Preparing wheel metadata: started\n",
+      "    Preparing wheel metadata: finished with status 'done'\n",
+      "Requirement already satisfied: betterproto<2.0.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core==0.9.0+125.ga0bcd30f) (1.2.5)\n",
+      "Requirement already satisfied: pandas<1.6.0dev0,>=1.2.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core==0.9.0+125.ga0bcd30f) (1.3.5)\n",
+      "Requirement already satisfied: numba>=0.54 in /usr/local/lib/python3.8/dist-packages (from merlin-core==0.9.0+125.ga0bcd30f) (0.56.4)\n",
+      "Requirement already satisfied: dask-cuda>=22.12.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core==0.9.0+125.ga0bcd30f) (23.4.0)\n",
+      "Requirement already satisfied: pynvml<11.5,>=11.0.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core==0.9.0+125.ga0bcd30f) (11.4.1)\n",
+      "Requirement already satisfied: packaging in /usr/local/lib/python3.8/dist-packages (from merlin-core==0.9.0+125.ga0bcd30f) (22.0)\n",
+      "Requirement already satisfied: distributed>=2022.11.1 in /usr/local/lib/python3.8/dist-packages (from merlin-core==0.9.0+125.ga0bcd30f) (2023.4.1)\n",
+      "Requirement already satisfied: protobuf>=3.0.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core==0.9.0+125.ga0bcd30f) (3.19.6)\n",
+      "Requirement already satisfied: dask>=2022.11.1 in /usr/local/lib/python3.8/dist-packages (from merlin-core==0.9.0+125.ga0bcd30f) (2023.4.1)\n",
+      "Requirement already satisfied: numpy>=1.22.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core==0.9.0+125.ga0bcd30f) (1.22.4)\n",
+      "Requirement already satisfied: tqdm>=4.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core==0.9.0+125.ga0bcd30f) (4.64.1)\n",
+      "Requirement already satisfied: pyarrow>=5.0.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core==0.9.0+125.ga0bcd30f) (8.0.0)\n",
+      "Requirement already satisfied: tensorflow-metadata>=1.2.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core==0.9.0+125.ga0bcd30f) (1.12.0)\n",
+      "Requirement already satisfied: fsspec>=2022.7.1 in /usr/local/lib/python3.8/dist-packages (from merlin-core==0.9.0+125.ga0bcd30f) (2023.5.0)\n",
+      "Requirement already satisfied: stringcase in /usr/local/lib/python3.8/dist-packages (from betterproto<2.0.0->merlin-core==0.9.0+125.ga0bcd30f) (1.2.0)\n",
+      "Requirement already satisfied: grpclib in /usr/local/lib/python3.8/dist-packages (from betterproto<2.0.0->merlin-core==0.9.0+125.ga0bcd30f) (0.4.3)\n",
+      "Requirement already satisfied: pytz>=2017.3 in /usr/local/lib/python3.8/dist-packages (from pandas<1.6.0dev0,>=1.2.0->merlin-core==0.9.0+125.ga0bcd30f) (2022.7)\n",
+      "Requirement already satisfied: python-dateutil>=2.7.3 in /usr/local/lib/python3.8/dist-packages (from pandas<1.6.0dev0,>=1.2.0->merlin-core==0.9.0+125.ga0bcd30f) (2.8.2)\n",
+      "Requirement already satisfied: importlib-metadata; python_version < \"3.9\" in /usr/local/lib/python3.8/dist-packages (from numba>=0.54->merlin-core==0.9.0+125.ga0bcd30f) (5.2.0)\n",
+      "Requirement already satisfied: llvmlite<0.40,>=0.39.0dev0 in /usr/local/lib/python3.8/dist-packages (from numba>=0.54->merlin-core==0.9.0+125.ga0bcd30f) (0.39.1)\n",
+      "Requirement already satisfied: setuptools in /usr/lib/python3/dist-packages (from numba>=0.54->merlin-core==0.9.0+125.ga0bcd30f) (45.2.0)\n",
+      "Requirement already satisfied: zict>=0.1.3 in /usr/local/lib/python3.8/dist-packages (from dask-cuda>=22.12.0->merlin-core==0.9.0+125.ga0bcd30f) (2.2.0)\n",
+      "Requirement already satisfied: jinja2>=2.10.3 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core==0.9.0+125.ga0bcd30f) (3.1.2)\n",
+      "Requirement already satisfied: psutil>=5.7.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core==0.9.0+125.ga0bcd30f) (5.9.4)\n",
+      "Requirement already satisfied: urllib3>=1.24.3 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core==0.9.0+125.ga0bcd30f) (1.26.13)\n",
+      "Requirement already satisfied: tornado>=6.0.3 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core==0.9.0+125.ga0bcd30f) (6.1)\n",
+      "Requirement already satisfied: pyyaml>=5.3.1 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core==0.9.0+125.ga0bcd30f) (6.0)\n",
+      "Requirement already satisfied: sortedcontainers>=2.0.5 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core==0.9.0+125.ga0bcd30f) (2.4.0)\n",
+      "Requirement already satisfied: tblib>=1.6.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core==0.9.0+125.ga0bcd30f) (1.7.0)\n",
+      "Requirement already satisfied: locket>=1.0.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core==0.9.0+125.ga0bcd30f) (1.0.0)\n",
+      "Requirement already satisfied: cloudpickle>=1.5.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core==0.9.0+125.ga0bcd30f) (2.2.0)\n",
+      "Requirement already satisfied: msgpack>=1.0.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core==0.9.0+125.ga0bcd30f) (1.0.4)\n",
+      "Requirement already satisfied: click>=8.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core==0.9.0+125.ga0bcd30f) (8.1.3)\n",
+      "Requirement already satisfied: toolz>=0.10.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core==0.9.0+125.ga0bcd30f) (0.12.0)\n",
+      "Requirement already satisfied: partd>=1.2.0 in /usr/local/lib/python3.8/dist-packages (from dask>=2022.11.1->merlin-core==0.9.0+125.ga0bcd30f) (1.3.0)\n",
+      "Requirement already satisfied: googleapis-common-protos<2,>=1.52.0 in /usr/local/lib/python3.8/dist-packages (from tensorflow-metadata>=1.2.0->merlin-core==0.9.0+125.ga0bcd30f) (1.57.0)\n",
+      "Requirement already satisfied: absl-py<2.0.0,>=0.9 in /usr/local/lib/python3.8/dist-packages (from tensorflow-metadata>=1.2.0->merlin-core==0.9.0+125.ga0bcd30f) (1.3.0)\n",
+      "Requirement already satisfied: multidict in /usr/local/lib/python3.8/dist-packages (from grpclib->betterproto<2.0.0->merlin-core==0.9.0+125.ga0bcd30f) (6.0.4)\n",
+      "Requirement already satisfied: h2<5,>=3.1.0 in /usr/local/lib/python3.8/dist-packages (from grpclib->betterproto<2.0.0->merlin-core==0.9.0+125.ga0bcd30f) (4.1.0)\n",
+      "Requirement already satisfied: six>=1.5 in /usr/lib/python3/dist-packages (from python-dateutil>=2.7.3->pandas<1.6.0dev0,>=1.2.0->merlin-core==0.9.0+125.ga0bcd30f) (1.14.0)\n",
+      "Requirement already satisfied: zipp>=0.5 in /usr/local/lib/python3.8/dist-packages (from importlib-metadata; python_version < \"3.9\"->numba>=0.54->merlin-core==0.9.0+125.ga0bcd30f) (3.11.0)\n",
+      "Requirement already satisfied: heapdict in /usr/local/lib/python3.8/dist-packages (from zict>=0.1.3->dask-cuda>=22.12.0->merlin-core==0.9.0+125.ga0bcd30f) (1.0.1)\n",
+      "Requirement already satisfied: MarkupSafe>=2.0 in /usr/local/lib/python3.8/dist-packages (from jinja2>=2.10.3->distributed>=2022.11.1->merlin-core==0.9.0+125.ga0bcd30f) (2.1.1)\n",
+      "Requirement already satisfied: hpack<5,>=4.0 in /usr/local/lib/python3.8/dist-packages (from h2<5,>=3.1.0->grpclib->betterproto<2.0.0->merlin-core==0.9.0+125.ga0bcd30f) (4.0.0)\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Requirement already satisfied: hyperframe<7,>=6.0 in /usr/local/lib/python3.8/dist-packages (from h2<5,>=3.1.0->grpclib->betterproto<2.0.0->merlin-core==0.9.0+125.ga0bcd30f) (6.0.1)\n",
+      "Building wheels for collected packages: merlin-core\n",
+      "  Building wheel for merlin-core (PEP 517): started\n",
+      "  Building wheel for merlin-core (PEP 517): finished with status 'done'\n",
+      "  Created wheel for merlin-core: filename=merlin_core-0.9.0+125.ga0bcd30f-py3-none-any.whl size=161449 sha256=57d8552cb7abbed6b1d1b2860391c64e7dfea045c442fc0f94c0fc940aed7e3d\n",
+      "  Stored in directory: /tmp/pip-ephem-wheel-cache-0yemn26u/wheels/8f/da/8c/c779661788874afaa32fd10abeac6016635956e3bad9940584\n",
+      "Successfully built merlin-core\n"
+     ]
+    },
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "ERROR: merlin-models 23.5.dev0+12.gd8133b8f has requirement merlin-core>=23.4.0, but you'll have merlin-core 0.9.0+125.ga0bcd30f which is incompatible.\n",
+      "ERROR: merlin-dataloader 23.4.0 has requirement merlin-core>=23.4.0, but you'll have merlin-core 0.9.0+125.ga0bcd30f which is incompatible.\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Installing collected packages: merlin-core\n",
+      "  Attempting uninstall: merlin-core\n",
+      "    Found existing installation: merlin-core 23.4.0\n",
+      "    Uninstalling merlin-core-23.4.0:\n",
+      "      Successfully uninstalled merlin-core-23.4.0\n",
+      "Successfully installed merlin-core-0.9.0+125.ga0bcd30f\n"
+     ]
+    },
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "Previous HEAD position was 020b24b7 Fix output error occurring due to  check if it is a dict or not (#1742)\n",
+      "Switched to branch 'main'\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Your branch is up to date with 'origin/main'.\n"
+     ]
+    },
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "From https://github.com/NVIDIA-Merlin/NVTabular\n",
+      " * branch              main       -> FETCH_HEAD\n",
+      "   c5bc4098..67136eba  main       -> origin/main\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Updating c5bc4098..67136eba\n",
+      "Fast-forward\n",
+      " .github/ISSUE_TEMPLATE/bug_report.md               |  11 +-\n",
+      " .github/ISSUE_TEMPLATE/documentation-request.md    |   3 +-\n",
+      " .github/ISSUE_TEMPLATE/feature_request.md          |   3 +-\n",
+      " .github/ISSUE_TEMPLATE/operator_request.md         |  14 +-\n",
+      " .github/ISSUE_TEMPLATE/research_question.md        |   3 +-\n",
+      " .github/ISSUE_TEMPLATE/submit-question.md          |   3 +-\n",
+      " .github/ISSUE_TEMPLATE/task.md                     |   4 +-\n",
+      " .github/release-drafter.yml                        |  44 ++--\n",
+      " .github/workflows/blossom-ci.yml                   | 230 ++++++++++-----------\n",
+      " .github/workflows/check-base-branch.yaml           |   9 +\n",
+      " .github/workflows/conda-env-create.yml             |  30 +--\n",
+      " .github/workflows/cpu-ci.yml                       | 138 -------------\n",
+      " .github/workflows/cpu-packages.yml                 | 179 ++++++++++++++++\n",
+      " .github/workflows/cpu-tests.yml                    |  75 +++++++\n",
+      " .github/workflows/docs-preview-pr.yaml             |   4 +-\n",
+      " .github/workflows/docs-sched-rebuild.yaml          |   7 +-\n",
+      " .github/workflows/gpu-ci.yml                       |  30 ---\n",
+      " .github/workflows/gpu-tests.yml                    |  34 +++\n",
+      " .github/workflows/lint.yaml                        |   4 +\n",
+      " .github/workflows/release-drafter.yaml             |   2 +-\n",
+      " .github/workflows/set-stable-branch.yaml           |  10 +\n",
+      " .gitlab-ci.yml                                     |  23 +--\n",
+      " .pre-commit-config.yaml                            |  47 +++--\n",
+      " .prettierignore                                    |   2 +\n",
+      " CHANGELOG.md                                       | 187 ++++++++---------\n",
+      " CONTRIBUTING.md                                    |  30 +--\n",
+      " README.md                                          |  48 ++---\n",
+      " bench/datasets/tools/nvt_etl.py                    |   4 +-\n",
+      " bench/datasets/tools/train_tensorflow.py           |   1 -\n",
+      " bench/examples/MultiGPUBench.md                    |  67 +++---\n",
+      " bench/examples/dask-nvtabular-criteo-benchmark.py  |   4 +-\n",
+      " ci/pr.gpu.Jenkinsfile                              |   2 +-\n",
+      " conda/environments/nvtabular_aws_sagemaker.yml     |   2 +-\n",
+      " conda/recipes/meta.yaml                            |   2 +-\n",
+      " cpp/nvtabular/inference/categorify.cc              |  10 +\n",
+      " docs/README.md                                     |  29 ++-\n",
+      " docs/source/core_features.md                       |  48 ++---\n",
+      " docs/source/resources/architecture.md              |  17 +-\n",
+      " docs/source/resources/cloud_integration.md         |  24 ++-\n",
+      " docs/source/resources/links.md                     |  40 ++--\n",
+      " docs/source/toc.yaml                               |  12 +-\n",
+      " examples/01-Getting-started.ipynb                  |   5 +-\n",
+      " examples/02-Advanced-NVTabular-workflow.ipynb      |   5 +-\n",
+      " .../03-Running-on-multiple-GPUs-or-on-CPU.ipynb    |  24 ++-\n",
+      " examples/README.md                                 |   1 +\n",
+      " .../tensorflow/tfrecords_to_parquet.py             |   9 +-\n",
+      " nvtabular/inference/__init__.py                    |   4 +-\n",
+      " nvtabular/inference/triton/data_conversions.py     |  24 +--\n",
+      " nvtabular/inference/triton/ensemble.py             |  86 ++------\n",
+      " nvtabular/inference/triton/model/model_pt.py       |   1 -\n",
+      " nvtabular/inference/workflow/hugectr.py            |   2 +-\n",
+      " nvtabular/loader/backend.py                        |  31 +--\n",
+      " nvtabular/loader/tensorflow.py                     |   1 +\n",
+      " nvtabular/ops/categorify.py                        |   4 +-\n",
+      " nvtabular/ops/column_similarity.py                 |  42 ++--\n",
+      " nvtabular/ops/groupby.py                           |  35 ++--\n",
+      " nvtabular/ops/join_external.py                     |   7 +-\n",
+      " nvtabular/ops/join_groupby.py                      |  18 +-\n",
+      " nvtabular/ops/list_slice.py                        |  22 +-\n",
+      " nvtabular/ops/moments.py                           |   2 -\n",
+      " nvtabular/ops/reduce_dtype_size.py                 |   9 +-\n",
+      " nvtabular/ops/target_encoding.py                   |   2 +-\n",
+      " nvtabular/ops/value_counts.py                      |  14 +-\n",
+      " nvtabular/tools/data_gen.py                        |  31 ++-\n",
+      " nvtabular/utils.py                                 |   2 +-\n",
+      " nvtabular/workflow/workflow.py                     | 169 +++++++++++++--\n",
+      " requirements-test.txt                              |   2 -\n",
+      " requirements/base.txt                              |   4 +-\n",
+      " requirements/test.txt                              |  15 +-\n",
+      " setup.py                                           |   5 +\n",
+      " tests/conftest.py                                  |  33 ++-\n",
+      " .../test_02-Advanced-NVTabular-workflow.py         |  17 +-\n",
+      " .../test_03-Running-on-multiple-GPUs-or-on-CPU.py  |  11 +-\n",
+      " tests/unit/loader/test_tf_dataloader.py            | 206 +++---------------\n",
+      " tests/unit/loader/test_torch_dataloader.py         |  79 ++-----\n",
+      " tests/unit/ops/test_categorify.py                  |  36 +++-\n",
+      " tests/unit/ops/test_column_similarity.py           |   3 +-\n",
+      " tests/unit/ops/test_drop_low_cardinality.py        |   7 +-\n",
+      " tests/unit/ops/test_groupyby.py                    |   9 +-\n",
+      " tests/unit/ops/test_join.py                        |  11 +-\n",
+      " tests/unit/ops/test_lambda.py                      |  28 ++-\n",
+      " tests/unit/ops/test_ops.py                         |  12 +-\n",
+      " tests/unit/ops/test_ops_schema.py                  |  25 ++-\n",
+      " tests/unit/ops/test_reduce_dtype_size.py           |   7 +-\n",
+      " tests/unit/ops/test_target_encode.py               |  11 +-\n",
+      " tests/unit/ops/test_value_count.py                 |   2 +\n",
+      " tests/unit/test_dask_nvt.py                        |   5 +-\n",
+      " tests/unit/test_s3.py                              |   8 +-\n",
+      " tests/unit/test_tf4rec.py                          |  11 +-\n",
+      " tests/unit/test_triton_inference.py                |   3 +-\n",
+      " tests/unit/workflow/test_cpu_workflow.py           |   6 +-\n",
+      " tests/unit/workflow/test_workflow.py               |  92 ++++++++-\n",
+      " tox.ini                                            |  10 +-\n",
+      " 93 files changed, 1448 insertions(+), 1196 deletions(-)\n",
+      " create mode 100644 .github/workflows/check-base-branch.yaml\n",
+      " delete mode 100644 .github/workflows/cpu-ci.yml\n",
+      " create mode 100644 .github/workflows/cpu-packages.yml\n",
+      " create mode 100644 .github/workflows/cpu-tests.yml\n",
+      " delete mode 100644 .github/workflows/gpu-ci.yml\n",
+      " create mode 100644 .github/workflows/gpu-tests.yml\n",
+      " create mode 100644 .github/workflows/set-stable-branch.yaml\n",
+      " create mode 100644 .prettierignore\n",
+      " delete mode 100644 requirements-test.txt\n",
+      "Processing /nvtabular\n",
+      "  Installing build dependencies: started\n",
+      "  Installing build dependencies: finished with status 'done'\n",
+      "  Getting requirements to build wheel: started\n",
+      "  Getting requirements to build wheel: finished with status 'done'\n",
+      "    Preparing wheel metadata: started\n",
+      "    Preparing wheel metadata: finished with status 'done'\n",
+      "Requirement already satisfied: merlin-dataloader>=23.4.0 in /usr/local/lib/python3.8/dist-packages (from nvtabular==1.6.0+66.g67136eba) (23.4.0)\n",
+      "Requirement already satisfied: scipy in /usr/local/lib/python3.8/dist-packages (from nvtabular==1.6.0+66.g67136eba) (1.9.3)\n",
+      "Processing /root/.cache/pip/wheels/42/ef/87/2c64bce8c3064a2c4e399933df4eda4838939355698ff8f7c7/merlin_core-23.4.0-py3-none-any.whl\n",
+      "Requirement already satisfied: numpy<1.26.0,>=1.18.5 in /usr/local/lib/python3.8/dist-packages (from scipy->nvtabular==1.6.0+66.g67136eba) (1.22.4)\n",
+      "Requirement already satisfied: numba>=0.54 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (0.56.4)\n",
+      "Requirement already satisfied: betterproto<2.0.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (1.2.5)\n",
+      "Requirement already satisfied: tensorflow-metadata>=1.2.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (1.12.0)\n",
+      "Requirement already satisfied: pyarrow>=5.0.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (8.0.0)\n",
+      "Requirement already satisfied: dask>=2022.11.1 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (2023.4.1)\n",
+      "Requirement already satisfied: tqdm>=4.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (4.64.1)\n",
+      "Requirement already satisfied: distributed>=2022.11.1 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (2023.4.1)\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Requirement already satisfied: protobuf>=3.0.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (3.19.6)\n",
+      "Requirement already satisfied: dask-cuda>=22.12.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (23.4.0)\n",
+      "Requirement already satisfied: pynvml<11.5,>=11.0.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (11.4.1)\n",
+      "Requirement already satisfied: fsspec>=2022.7.1 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (2023.5.0)\n",
+      "Requirement already satisfied: pandas<1.6.0dev0,>=1.2.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (1.3.5)\n",
+      "Requirement already satisfied: packaging in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (22.0)\n",
+      "Requirement already satisfied: llvmlite<0.40,>=0.39.0dev0 in /usr/local/lib/python3.8/dist-packages (from numba>=0.54->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (0.39.1)\n",
+      "Requirement already satisfied: setuptools in /usr/lib/python3/dist-packages (from numba>=0.54->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (45.2.0)\n",
+      "Requirement already satisfied: importlib-metadata; python_version < \"3.9\" in /usr/local/lib/python3.8/dist-packages (from numba>=0.54->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (5.2.0)\n",
+      "Requirement already satisfied: grpclib in /usr/local/lib/python3.8/dist-packages (from betterproto<2.0.0->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (0.4.3)\n",
+      "Requirement already satisfied: stringcase in /usr/local/lib/python3.8/dist-packages (from betterproto<2.0.0->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (1.2.0)\n",
+      "Requirement already satisfied: absl-py<2.0.0,>=0.9 in /usr/local/lib/python3.8/dist-packages (from tensorflow-metadata>=1.2.0->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (1.3.0)\n",
+      "Requirement already satisfied: googleapis-common-protos<2,>=1.52.0 in /usr/local/lib/python3.8/dist-packages (from tensorflow-metadata>=1.2.0->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (1.57.0)\n",
+      "Requirement already satisfied: partd>=1.2.0 in /usr/local/lib/python3.8/dist-packages (from dask>=2022.11.1->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (1.3.0)\n",
+      "Requirement already satisfied: pyyaml>=5.3.1 in /usr/local/lib/python3.8/dist-packages (from dask>=2022.11.1->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (6.0)\n",
+      "Requirement already satisfied: cloudpickle>=1.5.0 in /usr/local/lib/python3.8/dist-packages (from dask>=2022.11.1->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (2.2.0)\n",
+      "Requirement already satisfied: toolz>=0.10.0 in /usr/local/lib/python3.8/dist-packages (from dask>=2022.11.1->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (0.12.0)\n",
+      "Requirement already satisfied: click>=8.0 in /usr/local/lib/python3.8/dist-packages (from dask>=2022.11.1->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (8.1.3)\n",
+      "Requirement already satisfied: psutil>=5.7.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (5.9.4)\n",
+      "Requirement already satisfied: msgpack>=1.0.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (1.0.4)\n",
+      "Requirement already satisfied: tornado>=6.0.3 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (6.1)\n",
+      "Requirement already satisfied: urllib3>=1.24.3 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (1.26.13)\n",
+      "Requirement already satisfied: jinja2>=2.10.3 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (3.1.2)\n",
+      "Requirement already satisfied: locket>=1.0.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (1.0.0)\n",
+      "Requirement already satisfied: sortedcontainers>=2.0.5 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (2.4.0)\n",
+      "Requirement already satisfied: zict>=2.2.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (2.2.0)\n",
+      "Requirement already satisfied: tblib>=1.6.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (1.7.0)\n",
+      "Requirement already satisfied: python-dateutil>=2.7.3 in /usr/local/lib/python3.8/dist-packages (from pandas<1.6.0dev0,>=1.2.0->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (2.8.2)\n",
+      "Requirement already satisfied: pytz>=2017.3 in /usr/local/lib/python3.8/dist-packages (from pandas<1.6.0dev0,>=1.2.0->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (2022.7)\n",
+      "Requirement already satisfied: zipp>=0.5 in /usr/local/lib/python3.8/dist-packages (from importlib-metadata; python_version < \"3.9\"->numba>=0.54->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (3.11.0)\n",
+      "Requirement already satisfied: h2<5,>=3.1.0 in /usr/local/lib/python3.8/dist-packages (from grpclib->betterproto<2.0.0->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (4.1.0)\n",
+      "Requirement already satisfied: multidict in /usr/local/lib/python3.8/dist-packages (from grpclib->betterproto<2.0.0->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (6.0.4)\n",
+      "Requirement already satisfied: MarkupSafe>=2.0 in /usr/local/lib/python3.8/dist-packages (from jinja2>=2.10.3->distributed>=2022.11.1->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (2.1.1)\n",
+      "Requirement already satisfied: heapdict in /usr/local/lib/python3.8/dist-packages (from zict>=2.2.0->distributed>=2022.11.1->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (1.0.1)\n",
+      "Requirement already satisfied: six>=1.5 in /usr/lib/python3/dist-packages (from python-dateutil>=2.7.3->pandas<1.6.0dev0,>=1.2.0->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (1.14.0)\n",
+      "Requirement already satisfied: hpack<5,>=4.0 in /usr/local/lib/python3.8/dist-packages (from h2<5,>=3.1.0->grpclib->betterproto<2.0.0->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (4.0.0)\n",
+      "Requirement already satisfied: hyperframe<7,>=6.0 in /usr/local/lib/python3.8/dist-packages (from h2<5,>=3.1.0->grpclib->betterproto<2.0.0->merlin-core>=23.4.0->nvtabular==1.6.0+66.g67136eba) (6.0.1)\n",
+      "Building wheels for collected packages: nvtabular\n",
+      "  Building wheel for nvtabular (PEP 517): started\n",
+      "  Building wheel for nvtabular (PEP 517): finished with status 'done'\n",
+      "  Created wheel for nvtabular: filename=nvtabular-1.6.0+66.g67136eba-cp38-cp38-linux_x86_64.whl size=259850 sha256=957958ecd0f9149dbe203eb5e2a3d1b5ec128421aee4e31572f4ca8574131719\n",
+      "  Stored in directory: /tmp/pip-ephem-wheel-cache-btpmur92/wheels/df/bf/c2/9cc2a62fe6da42038c26a9c0c4e25f9767093528b102fa30a2\n",
+      "Successfully built nvtabular\n",
+      "Installing collected packages: merlin-core, nvtabular\n",
+      "  Attempting uninstall: merlin-core\n",
+      "    Found existing installation: merlin-core 0.9.0+125.ga0bcd30f\n",
+      "    Uninstalling merlin-core-0.9.0+125.ga0bcd30f:\n",
+      "      Successfully uninstalled merlin-core-0.9.0+125.ga0bcd30f\n",
+      "  Attempting uninstall: nvtabular\n",
+      "    Found existing installation: nvtabular 1.8.0\n",
+      "    Uninstalling nvtabular-1.8.0:\n",
+      "      Successfully uninstalled nvtabular-1.8.0\n",
+      "Successfully installed merlin-core-23.4.0 nvtabular-1.6.0+66.g67136eba\n"
+     ]
+    },
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "Previous HEAD position was feaf748 adding async tf strategy for gpu memory (#264)\n",
+      "Switched to branch 'main'\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Your branch is up to date with 'origin/main'.\n"
+     ]
+    },
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "From https://github.com/NVIDIA-Merlin/systems\n",
+      " * branch            main       -> FETCH_HEAD\n",
+      "   20bb231..2b1b90b  main       -> origin/main\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Updating 20bb231..2b1b90b\n",
+      "Fast-forward\n",
+      " .github/ISSUE_TEMPLATE/bug-report.md               |  17 +-\n",
+      " .github/ISSUE_TEMPLATE/documentation-request.md    |  12 +-\n",
+      " .github/ISSUE_TEMPLATE/feature-request.md          |   5 +-\n",
+      " .github/ISSUE_TEMPLATE/submit-question.md          |   3 +-\n",
+      " .github/ISSUE_TEMPLATE/task.md                     |   5 +-\n",
+      " .github/release-drafter.yml                        |  44 +-\n",
+      " .github/workflows/check-base-branch.yaml           |   9 +\n",
+      " .github/workflows/cpu-ci.yml                       | 128 ++--\n",
+      " .github/workflows/docs-preview-pr.yaml             |   6 +-\n",
+      " .github/workflows/docs-sched-rebuild.yaml          |   7 +-\n",
+      " .github/workflows/gpu-ci.yml                       |  40 +-\n",
+      " .github/workflows/lint.yaml                        |  18 +-\n",
+      " .github/workflows/packages.yaml                    | 118 ++++\n",
+      " .github/workflows/postmerge-cpu.yml                |  60 ++\n",
+      " .github/workflows/postmerge-gpu.yml                |  27 +\n",
+      " .github/workflows/release-drafter.yml              |   4 +-\n",
+      " .github/workflows/set-stable-branch.yaml           |  10 +\n",
+      " .pre-commit-config.yaml                            |  71 +-\n",
+      " .prettierignore                                    |   2 +\n",
+      " CLA.md                                             |   9 +-\n",
+      " CONTRIBUTING.md                                    |   2 +-\n",
+      " README.md                                          |   2 +-\n",
+      " ci/pr.gpu.Jenkinsfile                              |   2 +-\n",
+      " conda/recipes/meta.yaml                            |  18 +-\n",
+      " docs/README.md                                     |  53 +-\n",
+      " ...ing-An-Implicit-Model-With-Merlin-Systems.ipynb |   5 +-\n",
+      " ...ving-An-XGboost-Model-With-Merlin-Systems.ipynb |   5 +-\n",
+      " ...erving-Ranking-Models-With-Merlin-Systems.ipynb |   5 +-\n",
+      " merlin/systems/dag/__init__.py                     |   2 -\n",
+      " merlin/systems/dag/dictarray.py                    | 345 ----------\n",
+      " merlin/systems/dag/ensemble.py                     |   2 +-\n",
+      " merlin/systems/dag/node.py                         |  29 +-\n",
+      " merlin/systems/dag/op_runner.py                    |  68 --\n",
+      " merlin/systems/dag/ops/__init__.py                 |  22 +-\n",
+      " merlin/systems/dag/ops/faiss.py                    | 116 +---\n",
+      " merlin/systems/dag/ops/feast.py                    | 110 +---\n",
+      " merlin/systems/dag/ops/fil.py                      |  74 +--\n",
+      " merlin/systems/dag/ops/implicit.py                 |  84 +--\n",
+      " merlin/systems/dag/ops/operator.py                 | 216 +-----\n",
+      " merlin/systems/dag/ops/pytorch.py                  |  23 +-\n",
+      " merlin/systems/dag/ops/session_filter.py           |  72 +-\n",
+      " merlin/systems/dag/ops/softmax_sampling.py         |  61 +-\n",
+      " merlin/systems/dag/ops/tensorflow.py               | 143 ++--\n",
+      " merlin/systems/dag/ops/unroll_features.py          |  36 +-\n",
+      " merlin/systems/dag/ops/workflow.py                 |  29 +-\n",
+      " merlin/systems/dag/runtimes/triton/ops/fil.py      |  51 +-\n",
+      " merlin/systems/dag/runtimes/triton/ops/operator.py |  84 ++-\n",
+      " merlin/systems/dag/runtimes/triton/ops/pytorch.py  |  27 +-\n",
+      " .../systems/dag/runtimes/triton/ops/tensorflow.py  |  41 +-\n",
+      " merlin/systems/dag/runtimes/triton/ops/workflow.py | 132 +++-\n",
+      " merlin/systems/dag/runtimes/triton/runtime.py      |  36 +-\n",
+      " merlin/systems/triton/__init__.py                  | 118 ++--\n",
+      " merlin/systems/triton/conversions.py               | 198 ++++--\n",
+      " merlin/systems/triton/export.py                    | 731 +--------------------\n",
+      " merlin/systems/triton/models/executor_model.py     |  46 +-\n",
+      " merlin/systems/triton/models/oprunner_model.py     | 129 ----\n",
+      " merlin/systems/triton/models/pytorch_model.py      | 139 ++--\n",
+      " merlin/systems/triton/models/workflow_model.py     |  56 +-\n",
+      " merlin/systems/triton/utils.py                     |  58 +-\n",
+      " merlin/systems/workflow/base.py                    |  30 +-\n",
+      " merlin/systems/workflow/hugectr.py                 |  87 ---\n",
+      " merlin/systems/workflow/pytorch.py                 |  46 --\n",
+      " merlin/systems/workflow/tensorflow.py              |  68 --\n",
+      " pytest.ini                                         |   7 +-\n",
+      " requirements/test.txt                              |   2 +-\n",
+      " tests/conftest.py                                  |  36 +-\n",
+      " ...erving_an_implicit_model_with_merlin_systems.py |  12 +-\n",
+      " ...serving_an_xgboost_model_with_merlin_systems.py |   4 +-\n",
+      " tests/integration/tf/test_transformer_model.py     | 103 +++\n",
+      " .../systems/dag/test_column.py => test_passing.py} |  15 +-\n",
+      " tests/unit/systems/dag/ops/test_ops.py             | 101 ++-\n",
+      " .../dag/runtimes/local/ops/fil/test_lightgbm.py    |  15 +-\n",
+      " .../dag/runtimes/local/ops/fil/test_sklearn.py     |  15 +-\n",
+      " .../dag/runtimes/local/ops/fil/test_xgboost.py     |  18 +-\n",
+      " .../runtimes/local/ops/nvtabular/test_ensemble.py  |  10 +-\n",
+      " .../runtimes/local/ops/tensorflow/test_ensemble.py |  35 +-\n",
+      " .../dag/runtimes/local/ops/torch/test_op.py        |   6 +-\n",
+      " .../triton/ops/fil/test_lightgbm_triton.py         |  11 +-\n",
+      " .../runtimes/triton/ops/fil/test_sklearn_triton.py |   4 +-\n",
+      " .../runtimes/triton/ops/fil/test_xgboost_triton.py |   7 +-\n",
+      " .../dag/runtimes/triton/ops/torch/test_op.py       |   4 +-\n",
+      " .../runtimes/triton/ops/workflow/test_ensemble.py  | 305 ++++++++-\n",
+      " .../systems/dag/runtimes/triton/test_triton.py     |  21 +-\n",
+      " tests/unit/systems/dag/test_dict_array.py          |  76 ---\n",
+      " tests/unit/systems/dag/test_ensemble.py            |   4 +-\n",
+      " tests/unit/systems/dag/test_executors.py           |  12 +-\n",
+      " tests/unit/systems/dag/test_op_runner.py           | 210 ------\n",
+      " tests/unit/systems/ops/embedding_op.py             |  56 ++\n",
+      " tests/unit/systems/ops/faiss/test_executor.py      |  25 +-\n",
+      " tests/unit/systems/ops/feast/test_op.py            |  76 +--\n",
+      " tests/unit/systems/ops/fil/test_ensemble.py        |  21 +-\n",
+      " tests/unit/systems/ops/fil/test_forest.py          |  47 +-\n",
+      " tests/unit/systems/ops/fil/test_op.py              | 106 ++-\n",
+      " tests/unit/systems/ops/implicit/test_executor.py   |   4 +-\n",
+      " tests/unit/systems/ops/implicit/test_op.py         |  51 +-\n",
+      " tests/unit/systems/ops/padding_op.py               |  62 ++\n",
+      " tests/unit/systems/ops/tf/test_ensemble.py         |  15 +-\n",
+      " tests/unit/systems/ops/tf/test_op.py               |   6 +-\n",
+      " tests/unit/systems/ops/torch/test_ensemble.py      |  97 +++\n",
+      " tests/unit/systems/utils/ops.py                    |  13 +-\n",
+      " tests/unit/systems/utils/tf.py                     |  65 +-\n",
+      " tests/unit/test_export.py                          |  77 ---\n",
+      " tox.ini                                            |  42 +-\n",
+      " 103 files changed, 2427 insertions(+), 3565 deletions(-)\n",
+      " create mode 100644 .github/workflows/check-base-branch.yaml\n",
+      " create mode 100644 .github/workflows/packages.yaml\n",
+      " create mode 100644 .github/workflows/postmerge-cpu.yml\n",
+      " create mode 100644 .github/workflows/postmerge-gpu.yml\n",
+      " create mode 100644 .github/workflows/set-stable-branch.yaml\n",
+      " create mode 100644 .prettierignore\n",
+      " delete mode 100644 merlin/systems/dag/dictarray.py\n",
+      " delete mode 100644 merlin/systems/dag/op_runner.py\n",
+      " delete mode 100644 merlin/systems/triton/models/oprunner_model.py\n",
+      " delete mode 100644 merlin/systems/workflow/hugectr.py\n",
+      " delete mode 100644 merlin/systems/workflow/pytorch.py\n",
+      " delete mode 100644 merlin/systems/workflow/tensorflow.py\n",
+      " create mode 100644 tests/integration/tf/test_transformer_model.py\n",
+      " rename tests/{unit/systems/dag/test_column.py => test_passing.py} (66%)\n",
+      " delete mode 100644 tests/unit/systems/dag/test_dict_array.py\n",
+      " delete mode 100644 tests/unit/systems/dag/test_op_runner.py\n",
+      " create mode 100644 tests/unit/systems/ops/embedding_op.py\n",
+      " create mode 100644 tests/unit/systems/ops/padding_op.py\n",
+      " create mode 100644 tests/unit/systems/ops/torch/test_ensemble.py\n",
+      " delete mode 100644 tests/unit/test_export.py\n",
+      "Processing /systems\n",
+      "  Installing build dependencies: started\n",
+      "  Installing build dependencies: finished with status 'done'\n",
+      "  Getting requirements to build wheel: started\n",
+      "  Getting requirements to build wheel: finished with status 'done'\n",
+      "    Preparing wheel metadata: started\n",
+      "    Preparing wheel metadata: finished with status 'done'\n",
+      "Requirement already satisfied: treelite==2.4.0 in /usr/local/lib/python3.8/dist-packages (from merlin-systems==0.7.0+98.g2b1b90b) (2.4.0)\n",
+      "Requirement already satisfied: merlin-core>=0.2.0 in /usr/local/lib/python3.8/dist-packages (from merlin-systems==0.7.0+98.g2b1b90b) (23.4.0)\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Requirement already satisfied: requests<3,>=2.10 in /usr/local/lib/python3.8/dist-packages (from merlin-systems==0.7.0+98.g2b1b90b) (2.28.1)\n",
+      "Requirement already satisfied: treelite-runtime==2.4.0 in /usr/local/lib/python3.8/dist-packages (from merlin-systems==0.7.0+98.g2b1b90b) (2.4.0)\n",
+      "Requirement already satisfied: nvtabular>=1.0.0 in /usr/local/lib/python3.8/dist-packages (from merlin-systems==0.7.0+98.g2b1b90b) (1.6.0+66.g67136eba)\n",
+      "Requirement already satisfied: numpy in /usr/local/lib/python3.8/dist-packages (from treelite==2.4.0->merlin-systems==0.7.0+98.g2b1b90b) (1.22.4)\n",
+      "Requirement already satisfied: scipy in /usr/local/lib/python3.8/dist-packages (from treelite==2.4.0->merlin-systems==0.7.0+98.g2b1b90b) (1.9.3)\n",
+      "Requirement already satisfied: protobuf>=3.0.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (3.19.6)\n",
+      "Requirement already satisfied: pandas<1.6.0dev0,>=1.2.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (1.3.5)\n",
+      "Requirement already satisfied: betterproto<2.0.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (1.2.5)\n",
+      "Requirement already satisfied: tqdm>=4.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (4.64.1)\n",
+      "Requirement already satisfied: pyarrow>=5.0.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (8.0.0)\n",
+      "Requirement already satisfied: pynvml<11.5,>=11.0.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (11.4.1)\n",
+      "Requirement already satisfied: fsspec>=2022.7.1 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (2023.5.0)\n",
+      "Requirement already satisfied: distributed>=2022.11.1 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (2023.4.1)\n",
+      "Requirement already satisfied: dask-cuda>=22.12.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (23.4.0)\n",
+      "Requirement already satisfied: packaging in /usr/local/lib/python3.8/dist-packages (from merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (22.0)\n",
+      "Requirement already satisfied: numba>=0.54 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (0.56.4)\n",
+      "Requirement already satisfied: tensorflow-metadata>=1.2.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (1.12.0)\n",
+      "Requirement already satisfied: dask>=2022.11.1 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (2023.4.1)\n",
+      "Requirement already satisfied: idna<4,>=2.5 in /usr/lib/python3/dist-packages (from requests<3,>=2.10->merlin-systems==0.7.0+98.g2b1b90b) (2.8)\n",
+      "Requirement already satisfied: urllib3<1.27,>=1.21.1 in /usr/local/lib/python3.8/dist-packages (from requests<3,>=2.10->merlin-systems==0.7.0+98.g2b1b90b) (1.26.13)\n",
+      "Requirement already satisfied: charset-normalizer<3,>=2 in /usr/local/lib/python3.8/dist-packages (from requests<3,>=2.10->merlin-systems==0.7.0+98.g2b1b90b) (2.1.1)\n",
+      "Requirement already satisfied: certifi>=2017.4.17 in /usr/lib/python3/dist-packages (from requests<3,>=2.10->merlin-systems==0.7.0+98.g2b1b90b) (2019.11.28)\n",
+      "Requirement already satisfied: merlin-dataloader>=23.4.0 in /usr/local/lib/python3.8/dist-packages (from nvtabular>=1.0.0->merlin-systems==0.7.0+98.g2b1b90b) (23.4.0)\n",
+      "Requirement already satisfied: python-dateutil>=2.7.3 in /usr/local/lib/python3.8/dist-packages (from pandas<1.6.0dev0,>=1.2.0->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (2.8.2)\n",
+      "Requirement already satisfied: pytz>=2017.3 in /usr/local/lib/python3.8/dist-packages (from pandas<1.6.0dev0,>=1.2.0->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (2022.7)\n",
+      "Requirement already satisfied: stringcase in /usr/local/lib/python3.8/dist-packages (from betterproto<2.0.0->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (1.2.0)\n",
+      "Requirement already satisfied: grpclib in /usr/local/lib/python3.8/dist-packages (from betterproto<2.0.0->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (0.4.3)\n",
+      "Requirement already satisfied: tblib>=1.6.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (1.7.0)\n",
+      "Requirement already satisfied: zict>=2.2.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (2.2.0)\n",
+      "Requirement already satisfied: psutil>=5.7.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (5.9.4)\n",
+      "Requirement already satisfied: msgpack>=1.0.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (1.0.4)\n",
+      "Requirement already satisfied: tornado>=6.0.3 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (6.1)\n",
+      "Requirement already satisfied: cloudpickle>=1.5.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (2.2.0)\n",
+      "Requirement already satisfied: toolz>=0.10.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (0.12.0)\n",
+      "Requirement already satisfied: jinja2>=2.10.3 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (3.1.2)\n",
+      "Requirement already satisfied: pyyaml>=5.3.1 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (6.0)\n",
+      "Requirement already satisfied: locket>=1.0.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (1.0.0)\n",
+      "Requirement already satisfied: click>=8.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (8.1.3)\n",
+      "Requirement already satisfied: sortedcontainers>=2.0.5 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (2.4.0)\n",
+      "Requirement already satisfied: importlib-metadata; python_version < \"3.9\" in /usr/local/lib/python3.8/dist-packages (from numba>=0.54->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (5.2.0)\n",
+      "Requirement already satisfied: setuptools in /usr/lib/python3/dist-packages (from numba>=0.54->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (45.2.0)\n",
+      "Requirement already satisfied: llvmlite<0.40,>=0.39.0dev0 in /usr/local/lib/python3.8/dist-packages (from numba>=0.54->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (0.39.1)\n",
+      "Requirement already satisfied: absl-py<2.0.0,>=0.9 in /usr/local/lib/python3.8/dist-packages (from tensorflow-metadata>=1.2.0->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (1.3.0)\n",
+      "Requirement already satisfied: googleapis-common-protos<2,>=1.52.0 in /usr/local/lib/python3.8/dist-packages (from tensorflow-metadata>=1.2.0->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (1.57.0)\n",
+      "Requirement already satisfied: partd>=1.2.0 in /usr/local/lib/python3.8/dist-packages (from dask>=2022.11.1->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (1.3.0)\n",
+      "Requirement already satisfied: six>=1.5 in /usr/lib/python3/dist-packages (from python-dateutil>=2.7.3->pandas<1.6.0dev0,>=1.2.0->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (1.14.0)\n",
+      "Requirement already satisfied: h2<5,>=3.1.0 in /usr/local/lib/python3.8/dist-packages (from grpclib->betterproto<2.0.0->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (4.1.0)\n",
+      "Requirement already satisfied: multidict in /usr/local/lib/python3.8/dist-packages (from grpclib->betterproto<2.0.0->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (6.0.4)\n",
+      "Requirement already satisfied: heapdict in /usr/local/lib/python3.8/dist-packages (from zict>=2.2.0->distributed>=2022.11.1->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (1.0.1)\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Requirement already satisfied: MarkupSafe>=2.0 in /usr/local/lib/python3.8/dist-packages (from jinja2>=2.10.3->distributed>=2022.11.1->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (2.1.1)\n",
+      "Requirement already satisfied: zipp>=0.5 in /usr/local/lib/python3.8/dist-packages (from importlib-metadata; python_version < \"3.9\"->numba>=0.54->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (3.11.0)\n",
+      "Requirement already satisfied: hyperframe<7,>=6.0 in /usr/local/lib/python3.8/dist-packages (from h2<5,>=3.1.0->grpclib->betterproto<2.0.0->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (6.0.1)\n",
+      "Requirement already satisfied: hpack<5,>=4.0 in /usr/local/lib/python3.8/dist-packages (from h2<5,>=3.1.0->grpclib->betterproto<2.0.0->merlin-core>=0.2.0->merlin-systems==0.7.0+98.g2b1b90b) (4.0.0)\n",
+      "Building wheels for collected packages: merlin-systems\n",
+      "  Building wheel for merlin-systems (PEP 517): started\n",
+      "  Building wheel for merlin-systems (PEP 517): finished with status 'done'\n",
+      "  Created wheel for merlin-systems: filename=merlin_systems-0.7.0+98.g2b1b90b-py3-none-any.whl size=83152 sha256=282b1d3abe91766660d30dcbfa6d196c7f13d8d7d1b554eefd02455b7cdc1924\n",
+      "  Stored in directory: /tmp/pip-ephem-wheel-cache-ojtyyyod/wheels/1f/e9/71/1b0c6295aa7f4b37cb70292d96d87d9f38204674e6531bdda6\n",
+      "Successfully built merlin-systems\n",
+      "Installing collected packages: merlin-systems\n",
+      "  Attempting uninstall: merlin-systems\n",
+      "    Found existing installation: merlin-systems 0.9.0\n",
+      "    Uninstalling merlin-systems-0.9.0:\n",
+      "      Successfully uninstalled merlin-systems-0.9.0\n",
+      "Successfully installed merlin-systems-0.7.0+98.g2b1b90b\n"
+     ]
+    },
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "Previous HEAD position was fd5d3fc Use tf.function for list column operations (#89)\n",
+      "Switched to branch 'main'\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Your branch is up to date with 'origin/main'.\n"
+     ]
+    },
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "From https://github.com/NVIDIA-Merlin/dataloader\n",
+      " * branch            main       -> FETCH_HEAD\n",
+      "   5b3fe46..d9e97b4  main       -> origin/main\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Updating 5b3fe46..d9e97b4\n",
+      "Fast-forward\n",
+      " .github/workflows/check-base-branch.yaml           |   9 +\n",
+      " .github/workflows/cpu-ci.yml                       |  83 +----\n",
+      " .github/workflows/cpu-packages.yml                 | 125 +++++++\n",
+      " .github/workflows/docs-sched-rebuild.yaml          |   7 +-\n",
+      " .github/workflows/gpu-ci.yml                       |   2 +-\n",
+      " .github/workflows/jax.yaml                         |   2 +-\n",
+      " .github/workflows/models.yml                       |  43 +++\n",
+      " .github/workflows/nvtabular.yml                    |  43 +++\n",
+      " .github/workflows/release-drafter.yaml             |   2 +-\n",
+      " .github/workflows/set-stable-branch.yaml           |  10 +\n",
+      " .github/workflows/systems.yml                      |  43 +++\n",
+      " .github/workflows/tensorflow.yml                   |   2 +-\n",
+      " .github/workflows/torch.yaml                       |   2 +-\n",
+      " .github/workflows/transformers4rec.yml             |  43 +++\n",
+      " .pre-commit-config.yaml                            |  14 +-\n",
+      " ci/pr.gpu.Jenkinsfile                              |  44 +++\n",
+      " docs/README.md                                     |  28 +-\n",
+      " examples/01a-Getting-started-Tensorflow.ipynb      |   5 +-\n",
+      " examples/01b-Getting-started-Pytorch.ipynb         |   5 +-\n",
+      " .../02-Multi-GPU-Tensorflow-with-Horovod.ipynb     | 371 ++++++++++++++++++\n",
+      " merlin/dataloader/jax.py                           |  52 +--\n",
+      " merlin/dataloader/loader_base.py                   | 413 +++++++++------------\n",
+      " merlin/dataloader/ops/embeddings.py                | 110 ++++++\n",
+      " merlin/dataloader/ops/embeddings/__init__.py       |  15 -\n",
+      " merlin/dataloader/ops/embeddings/embedding_op.py   | 237 ------------\n",
+      " .../dataloader/ops/embeddings/tf_embedding_op.py   | 101 -----\n",
+      " .../ops/embeddings/torch_embedding_op.py           | 106 ------\n",
+      " merlin/dataloader/ops/padding.py                   |  88 +++++\n",
+      " merlin/dataloader/tensorflow.py                    | 337 +++++------------\n",
+      " merlin/dataloader/torch.py                         | 225 +++++------\n",
+      " merlin/dataloader/utils/tf/tf_trainer.py           |  13 +-\n",
+      " requirements/base.txt                              |   2 +-\n",
+      " tests/conftest.py                                  |  11 +-\n",
+      " .../test_multi_GPU_with_horovod_and_tensorflow.py  |  28 ++\n",
+      " tests/unit/dataloader/test_array_dataloader.py     |  57 +++\n",
+      " tests/unit/dataloader/test_array_to_tensorflow.py  |  54 +++\n",
+      " tests/unit/dataloader/test_array_to_torch.py       |  69 ++++\n",
+      " .../{test_tf_embeddings.py => test_embeddings.py}  | 188 +++++-----\n",
+      " tests/unit/dataloader/test_jax_dataloader.py       |  29 +-\n",
+      " tests/unit/dataloader/test_padding.py              |  46 +++\n",
+      " tests/unit/dataloader/test_tf_dataloader.py        | 358 +++++++++---------\n",
+      " tests/unit/dataloader/test_torch_dataloader.py     | 245 ++++++++----\n",
+      " tests/unit/dataloader/test_torch_embeddings.py     | 242 ------------\n",
+      " tox.ini                                            |  55 +++\n",
+      " 44 files changed, 2154 insertions(+), 1810 deletions(-)\n",
+      " create mode 100644 .github/workflows/check-base-branch.yaml\n",
+      " create mode 100644 .github/workflows/cpu-packages.yml\n",
+      " create mode 100644 .github/workflows/models.yml\n",
+      " create mode 100644 .github/workflows/nvtabular.yml\n",
+      " create mode 100644 .github/workflows/set-stable-branch.yaml\n",
+      " create mode 100644 .github/workflows/systems.yml\n",
+      " create mode 100644 .github/workflows/transformers4rec.yml\n",
+      " create mode 100644 ci/pr.gpu.Jenkinsfile\n",
+      " create mode 100644 examples/02-Multi-GPU-Tensorflow-with-Horovod.ipynb\n",
+      " create mode 100644 merlin/dataloader/ops/embeddings.py\n",
+      " delete mode 100644 merlin/dataloader/ops/embeddings/__init__.py\n",
+      " delete mode 100644 merlin/dataloader/ops/embeddings/embedding_op.py\n",
+      " delete mode 100644 merlin/dataloader/ops/embeddings/tf_embedding_op.py\n",
+      " delete mode 100644 merlin/dataloader/ops/embeddings/torch_embedding_op.py\n",
+      " create mode 100644 merlin/dataloader/ops/padding.py\n",
+      " create mode 100644 tests/examples/test_multi_GPU_with_horovod_and_tensorflow.py\n",
+      " create mode 100644 tests/unit/dataloader/test_array_dataloader.py\n",
+      " create mode 100644 tests/unit/dataloader/test_array_to_tensorflow.py\n",
+      " create mode 100644 tests/unit/dataloader/test_array_to_torch.py\n",
+      " rename tests/unit/dataloader/{test_tf_embeddings.py => test_embeddings.py} (52%)\n",
+      " create mode 100644 tests/unit/dataloader/test_padding.py\n",
+      " delete mode 100644 tests/unit/dataloader/test_torch_embeddings.py\n",
+      "Processing /dataloader\n",
+      "  Installing build dependencies: started\n",
+      "  Installing build dependencies: finished with status 'done'\n",
+      "  Getting requirements to build wheel: started\n",
+      "  Getting requirements to build wheel: finished with status 'done'\n",
+      "    Preparing wheel metadata: started\n",
+      "    Preparing wheel metadata: finished with status 'done'\n",
+      "Requirement already satisfied: merlin-core>=23.04.00 in /usr/local/lib/python3.8/dist-packages (from merlin-dataloader==0.0.2+72.gd9e97b4) (23.4.0)\n",
+      "Requirement already satisfied: numba>=0.54 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (0.56.4)\n",
+      "Requirement already satisfied: pandas<1.6.0dev0,>=1.2.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (1.3.5)\n",
+      "Requirement already satisfied: pyarrow>=5.0.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (8.0.0)\n",
+      "Requirement already satisfied: betterproto<2.0.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (1.2.5)\n",
+      "Requirement already satisfied: tqdm>=4.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (4.64.1)\n",
+      "Requirement already satisfied: distributed>=2022.11.1 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (2023.4.1)\n",
+      "Requirement already satisfied: pynvml<11.5,>=11.0.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (11.4.1)\n",
+      "Requirement already satisfied: dask-cuda>=22.12.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (23.4.0)\n",
+      "Requirement already satisfied: tensorflow-metadata>=1.2.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (1.12.0)\n",
+      "Requirement already satisfied: packaging in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (22.0)\n",
+      "Requirement already satisfied: numpy>=1.22.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (1.22.4)\n",
+      "Requirement already satisfied: protobuf>=3.0.0 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (3.19.6)\n",
+      "Requirement already satisfied: fsspec>=2022.7.1 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (2023.5.0)\n",
+      "Requirement already satisfied: dask>=2022.11.1 in /usr/local/lib/python3.8/dist-packages (from merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (2023.4.1)\n",
+      "Requirement already satisfied: setuptools in /usr/lib/python3/dist-packages (from numba>=0.54->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (45.2.0)\n",
+      "Requirement already satisfied: llvmlite<0.40,>=0.39.0dev0 in /usr/local/lib/python3.8/dist-packages (from numba>=0.54->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (0.39.1)\n",
+      "Requirement already satisfied: importlib-metadata; python_version < \"3.9\" in /usr/local/lib/python3.8/dist-packages (from numba>=0.54->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (5.2.0)\n",
+      "Requirement already satisfied: python-dateutil>=2.7.3 in /usr/local/lib/python3.8/dist-packages (from pandas<1.6.0dev0,>=1.2.0->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (2.8.2)\n",
+      "Requirement already satisfied: pytz>=2017.3 in /usr/local/lib/python3.8/dist-packages (from pandas<1.6.0dev0,>=1.2.0->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (2022.7)\n",
+      "Requirement already satisfied: stringcase in /usr/local/lib/python3.8/dist-packages (from betterproto<2.0.0->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (1.2.0)\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Requirement already satisfied: grpclib in /usr/local/lib/python3.8/dist-packages (from betterproto<2.0.0->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (0.4.3)\n",
+      "Requirement already satisfied: cloudpickle>=1.5.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (2.2.0)\n",
+      "Requirement already satisfied: psutil>=5.7.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (5.9.4)\n",
+      "Requirement already satisfied: locket>=1.0.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (1.0.0)\n",
+      "Requirement already satisfied: msgpack>=1.0.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (1.0.4)\n",
+      "Requirement already satisfied: pyyaml>=5.3.1 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (6.0)\n",
+      "Requirement already satisfied: tornado>=6.0.3 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (6.1)\n",
+      "Requirement already satisfied: jinja2>=2.10.3 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (3.1.2)\n",
+      "Requirement already satisfied: sortedcontainers>=2.0.5 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (2.4.0)\n",
+      "Requirement already satisfied: tblib>=1.6.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (1.7.0)\n",
+      "Requirement already satisfied: toolz>=0.10.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (0.12.0)\n",
+      "Requirement already satisfied: urllib3>=1.24.3 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (1.26.13)\n",
+      "Requirement already satisfied: click>=8.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (8.1.3)\n",
+      "Requirement already satisfied: zict>=2.2.0 in /usr/local/lib/python3.8/dist-packages (from distributed>=2022.11.1->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (2.2.0)\n",
+      "Requirement already satisfied: absl-py<2.0.0,>=0.9 in /usr/local/lib/python3.8/dist-packages (from tensorflow-metadata>=1.2.0->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (1.3.0)\n",
+      "Requirement already satisfied: googleapis-common-protos<2,>=1.52.0 in /usr/local/lib/python3.8/dist-packages (from tensorflow-metadata>=1.2.0->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (1.57.0)\n",
+      "Requirement already satisfied: partd>=1.2.0 in /usr/local/lib/python3.8/dist-packages (from dask>=2022.11.1->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (1.3.0)\n",
+      "Requirement already satisfied: zipp>=0.5 in /usr/local/lib/python3.8/dist-packages (from importlib-metadata; python_version < \"3.9\"->numba>=0.54->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (3.11.0)\n",
+      "Requirement already satisfied: six>=1.5 in /usr/lib/python3/dist-packages (from python-dateutil>=2.7.3->pandas<1.6.0dev0,>=1.2.0->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (1.14.0)\n",
+      "Requirement already satisfied: multidict in /usr/local/lib/python3.8/dist-packages (from grpclib->betterproto<2.0.0->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (6.0.4)\n",
+      "Requirement already satisfied: h2<5,>=3.1.0 in /usr/local/lib/python3.8/dist-packages (from grpclib->betterproto<2.0.0->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (4.1.0)\n",
+      "Requirement already satisfied: MarkupSafe>=2.0 in /usr/local/lib/python3.8/dist-packages (from jinja2>=2.10.3->distributed>=2022.11.1->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (2.1.1)\n",
+      "Requirement already satisfied: heapdict in /usr/local/lib/python3.8/dist-packages (from zict>=2.2.0->distributed>=2022.11.1->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (1.0.1)\n",
+      "Requirement already satisfied: hpack<5,>=4.0 in /usr/local/lib/python3.8/dist-packages (from h2<5,>=3.1.0->grpclib->betterproto<2.0.0->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (4.0.0)\n",
+      "Requirement already satisfied: hyperframe<7,>=6.0 in /usr/local/lib/python3.8/dist-packages (from h2<5,>=3.1.0->grpclib->betterproto<2.0.0->merlin-core>=23.04.00->merlin-dataloader==0.0.2+72.gd9e97b4) (6.0.1)\n",
+      "Building wheels for collected packages: merlin-dataloader\n",
+      "  Building wheel for merlin-dataloader (PEP 517): started\n",
+      "  Building wheel for merlin-dataloader (PEP 517): finished with status 'done'\n",
+      "  Created wheel for merlin-dataloader: filename=merlin_dataloader-0.0.2+72.gd9e97b4-py3-none-any.whl size=34881 sha256=c39b7e146f814713447917029d09f8cf4978202ed3852dce51544461cd074e3b\n",
+      "  Stored in directory: /tmp/pip-ephem-wheel-cache-t_njcpzr/wheels/8c/19/5b/15dc04f5a977f6a7f73ed66c91996a687b1d9e3154a4765536\n",
+      "Successfully built merlin-dataloader\n"
+     ]
+    },
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "ERROR: nvtabular 1.6.0+66.g67136eba has requirement merlin-dataloader>=23.4.0, but you'll have merlin-dataloader 0.0.2+72.gd9e97b4 which is incompatible.\n",
+      "ERROR: merlin-models 23.5.dev0+12.gd8133b8f has requirement merlin-dataloader>=23.4.0, but you'll have merlin-dataloader 0.0.2+72.gd9e97b4 which is incompatible.\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Installing collected packages: merlin-dataloader\n",
+      "  Attempting uninstall: merlin-dataloader\n",
+      "    Found existing installation: merlin-dataloader 23.4.0\n",
+      "    Uninstalling merlin-dataloader-23.4.0:\n",
+      "      Successfully uninstalled merlin-dataloader-23.4.0\n",
+      "Successfully installed merlin-dataloader-0.0.2+72.gd9e97b4\n"
+     ]
+    }
+   ],
    "source": [
     "# %%bash\n",
     "\n",
-    "# # cd /models && git fetch origin && git checkout origin/tf/transformer-api && pip install .\n",
+    "# cd /models && git fetch origin && git checkout origin/tf/transformer-api && pip install .\n",
     "# cd /models && git checkout main && git pull origin main && pip install .\n",
     "# cd /core && git checkout main && git pull origin main && pip install .\n",
     "# cd /nvtabular && git checkout main && git pull origin main && pip install .\n",
     "# cd /systems && git checkout main && git pull origin main && pip install .\n",
-    "# cd /dataloader && git checkout main && git pull origin main && pip install .\n",
-    "\n",
-    "# ---\n",
-    "# pip install matplotlib"
+    "# cd /dataloader && git checkout main && git pull origin main && pip install ."
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 2,
+   "execution_count": 3,
    "id": "e9929dc8",
    "metadata": {},
    "outputs": [
@@ -30,18 +1531,22 @@
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "Requirement already satisfied: gdown in /usr/local/lib/python3.8/dist-packages (4.7.1)\n",
-      "Requirement already satisfied: tqdm in /usr/local/lib/python3.8/dist-packages (from gdown) (4.64.1)\n",
+      "Collecting gdown\n",
+      "  Downloading gdown-4.7.1-py3-none-any.whl (15 kB)\n",
       "Requirement already satisfied: filelock in /usr/local/lib/python3.8/dist-packages (from gdown) (3.9.0)\n",
-      "Requirement already satisfied: beautifulsoup4 in /usr/local/lib/python3.8/dist-packages (from gdown) (4.11.1)\n",
+      "Requirement already satisfied: tqdm in /usr/local/lib/python3.8/dist-packages (from gdown) (4.64.1)\n",
       "Requirement already satisfied: six in /usr/lib/python3/dist-packages (from gdown) (1.14.0)\n",
+      "Requirement already satisfied: beautifulsoup4 in /usr/local/lib/python3.8/dist-packages (from gdown) (4.11.1)\n",
       "Requirement already satisfied: requests[socks] in /usr/local/lib/python3.8/dist-packages (from gdown) (2.28.1)\n",
       "Requirement already satisfied: soupsieve>1.2 in /usr/local/lib/python3.8/dist-packages (from beautifulsoup4->gdown) (2.3.2.post1)\n",
-      "Requirement already satisfied: certifi>=2017.4.17 in /usr/lib/python3/dist-packages (from requests[socks]->gdown) (2019.11.28)\n",
       "Requirement already satisfied: urllib3<1.27,>=1.21.1 in /usr/local/lib/python3.8/dist-packages (from requests[socks]->gdown) (1.26.13)\n",
+      "Requirement already satisfied: certifi>=2017.4.17 in /usr/lib/python3/dist-packages (from requests[socks]->gdown) (2019.11.28)\n",
       "Requirement already satisfied: charset-normalizer<3,>=2 in /usr/local/lib/python3.8/dist-packages (from requests[socks]->gdown) (2.1.1)\n",
       "Requirement already satisfied: idna<4,>=2.5 in /usr/lib/python3/dist-packages (from requests[socks]->gdown) (2.8)\n",
-      "Requirement already satisfied: PySocks!=1.5.7,>=1.5.6; extra == \"socks\" in /usr/local/lib/python3.8/dist-packages (from requests[socks]->gdown) (1.7.1)\n"
+      "Collecting PySocks!=1.5.7,>=1.5.6; extra == \"socks\"\n",
+      "  Downloading PySocks-1.7.1-py3-none-any.whl (16 kB)\n",
+      "Installing collected packages: gdown, PySocks\n",
+      "Successfully installed PySocks-1.7.1 gdown-4.7.1\n"
      ]
     },
     {
@@ -50,26 +1555,42 @@
      "text": [
       "Downloading...\n",
       "From (uriginal): https://drive.google.com/uc?id=1NCFZ5ya3zyxPsrmupEoc9UEm4sslAddV\n",
-      "From (redirected): https://drive.google.com/uc?id=1NCFZ5ya3zyxPsrmupEoc9UEm4sslAddV&confirm=t&uuid=0dd96474-79af-47bb-9148-b96d64204e14\n",
+      "From (redirected): https://drive.google.com/uc?id=1NCFZ5ya3zyxPsrmupEoc9UEm4sslAddV&confirm=t&uuid=b5bb23eb-a2dd-4adc-b7b7-be5687c89aca\n",
       "To: /workspace/T4Rec_repro/rees46_ecom_dataset_small_for_ci.zip\n",
-      "100%|██████████| 43.4M/43.4M [00:12<00:00, 3.62MB/s]\n"
+      "100%|██████████| 43.4M/43.4M [00:07<00:00, 6.20MB/s]\n"
      ]
     },
     {
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "Hit:1 https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64  InRelease\n",
-      "Hit:2 http://archive.ubuntu.com/ubuntu focal InRelease\n",
-      "Hit:3 http://security.ubuntu.com/ubuntu focal-security InRelease\n",
-      "Hit:4 http://archive.ubuntu.com/ubuntu focal-updates InRelease\n",
-      "Hit:5 http://archive.ubuntu.com/ubuntu focal-backports InRelease\n",
+      "Get:1 https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64  InRelease [1581 B]\n",
+      "Get:2 https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64  Packages [1009 kB]\n",
+      "Get:3 http://archive.ubuntu.com/ubuntu focal InRelease [265 kB]\n",
+      "Get:4 http://security.ubuntu.com/ubuntu focal-security InRelease [114 kB]\n",
+      "Get:5 http://security.ubuntu.com/ubuntu focal-security/main amd64 Packages [2674 kB]\n",
+      "Get:6 http://archive.ubuntu.com/ubuntu focal-updates InRelease [114 kB]\n",
+      "Get:7 http://archive.ubuntu.com/ubuntu focal-backports InRelease [108 kB]\n",
+      "Get:8 http://archive.ubuntu.com/ubuntu focal/main amd64 Packages [1275 kB]\n",
+      "Get:9 http://security.ubuntu.com/ubuntu focal-security/restricted amd64 Packages [2203 kB]\n",
+      "Get:10 http://archive.ubuntu.com/ubuntu focal/restricted amd64 Packages [33.4 kB]\n",
+      "Get:11 http://archive.ubuntu.com/ubuntu focal/universe amd64 Packages [11.3 MB]\n",
+      "Get:12 http://security.ubuntu.com/ubuntu focal-security/multiverse amd64 Packages [28.5 kB]\n",
+      "Get:13 http://security.ubuntu.com/ubuntu focal-security/universe amd64 Packages [1045 kB]\n",
+      "Get:14 http://archive.ubuntu.com/ubuntu focal/multiverse amd64 Packages [177 kB]\n",
+      "Get:15 http://archive.ubuntu.com/ubuntu focal-updates/restricted amd64 Packages [2341 kB]\n",
+      "Get:16 http://archive.ubuntu.com/ubuntu focal-updates/universe amd64 Packages [1341 kB]\n",
+      "Get:17 http://archive.ubuntu.com/ubuntu focal-updates/main amd64 Packages [3157 kB]\n",
+      "Get:18 http://archive.ubuntu.com/ubuntu focal-updates/multiverse amd64 Packages [31.2 kB]\n",
+      "Get:19 http://archive.ubuntu.com/ubuntu focal-backports/main amd64 Packages [55.2 kB]\n",
+      "Get:20 http://archive.ubuntu.com/ubuntu focal-backports/universe amd64 Packages [28.6 kB]\n",
+      "Fetched 27.3 MB in 9s (2922 kB/s)\n",
       "Reading package lists...\n",
       "Reading package lists...\n",
       "Building dependency tree...\n",
       "Reading state information...\n",
       "unzip is already the newest version (6.0-25ubuntu1.1).\n",
-      "0 upgraded, 0 newly installed, 0 to remove and 98 not upgraded.\n",
+      "0 upgraded, 0 newly installed, 0 to remove and 99 not upgraded.\n",
       "Archive:  rees46_ecom_dataset_small_for_ci.zip\n",
       "   creating: ecom_dataset/0001/\n",
       "  inflating: ecom_dataset/0001/valid.parquet  \n",
@@ -84,17 +1605,17 @@
     }
    ],
    "source": [
-    "%%bash\n",
+    "# %%bash\n",
     "\n",
-    "rm -rf ecom_dataset\n",
-    "mkdir -p ecom_dataset\n",
+    "# rm -rf ecom_dataset\n",
+    "# mkdir -p ecom_dataset\n",
     "\n",
-    "pip install gdown\n",
-    "# gdown https://drive.google.com/uc?id=1BvCHc4eXComuNK93bKhRM6cbg9y5p350  # <-- full dataset\n",
-    "gdown https://drive.google.com/uc?id=1NCFZ5ya3zyxPsrmupEoc9UEm4sslAddV\n",
-    "apt-get update -y\n",
-    "apt-get install unzip -y\n",
-    "unzip -d ecom_dataset \"rees46_ecom_dataset_small_for_ci.zip\""
+    "# pip install gdown\n",
+    "# # gdown https://drive.google.com/uc?id=1BvCHc4eXComuNK93bKhRM6cbg9y5p350  # <-- full dataset\n",
+    "# gdown https://drive.google.com/uc?id=1NCFZ5ya3zyxPsrmupEoc9UEm4sslAddV\n",
+    "# apt-get update -y\n",
+    "# apt-get install unzip -y\n",
+    "# unzip -d ecom_dataset \"rees46_ecom_dataset_small_for_ci.zip\""
    ]
   },
   {
@@ -353,18 +1874,47 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 7,
-   "id": "ceb3ae93",
+   "execution_count": 4,
+   "id": "0660887b",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "import os\n",
+    "# os.environ[\"TF_GPU_ALLOCATOR\"]=\"cuda_malloc_async\"\n",
+    "import gc\n",
+    "import numpy as np"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 5,
+   "id": "ec38f1a6",
    "metadata": {},
    "outputs": [
     {
      "name": "stderr",
      "output_type": "stream",
      "text": [
-      "2023-04-13 11:21:28.090236: I tensorflow/core/platform/cpu_feature_guard.cc:194] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  SSE3 SSE4.1 SSE4.2 AVX\n",
-      "To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.\n"
+      "2023-05-09 01:50:24.115697: I tensorflow/core/platform/cpu_feature_guard.cc:194] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  SSE3 SSE4.1 SSE4.2 AVX\n",
+      "To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.\n",
+      "/usr/local/lib/python3.8/dist-packages/merlin/dtypes/mappings/torch.py:43: UserWarning: PyTorch dtype mappings did not load successfully due to an error: No module named 'torch'\n",
+      "  warn(f\"PyTorch dtype mappings did not load successfully due to an error: {exc.msg}\")\n"
      ]
-    },
+    }
+   ],
+   "source": [
+    "import tensorflow as tf\n",
+    "\n",
+    "from merlin.schema.tags import Tags\n",
+    "from merlin.io.dataset import Dataset"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 6,
+   "id": "ceb3ae93",
+   "metadata": {},
+   "outputs": [
     {
      "name": "stdout",
      "output_type": "stream",
@@ -376,11 +1926,9 @@
      "name": "stderr",
      "output_type": "stream",
      "text": [
-      "/usr/local/lib/python3.8/dist-packages/merlin/dtypes/mappings/torch.py:43: UserWarning: PyTorch dtype mappings did not load successfully due to an error: No module named 'torch'\n",
-      "  warn(f\"PyTorch dtype mappings did not load successfully due to an error: {exc.msg}\")\n",
-      "2023-04-13 11:21:30.471061: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:21:30.471514: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:21:30.471678: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n"
+      "2023-05-09 01:50:26.436605: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:50:26.437013: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:50:26.437158: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n"
      ]
     },
     {
@@ -397,38 +1945,28 @@
      "name": "stderr",
      "output_type": "stream",
      "text": [
-      "2023-04-13 11:21:30.757567: I tensorflow/core/platform/cpu_feature_guard.cc:194] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  SSE3 SSE4.1 SSE4.2 AVX\n",
+      "2023-05-09 01:50:26.674203: I tensorflow/core/platform/cpu_feature_guard.cc:194] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  SSE3 SSE4.1 SSE4.2 AVX\n",
       "To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.\n",
-      "2023-04-13 11:21:30.758435: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:21:30.758639: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:21:30.758792: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:21:31.508591: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:21:31.508802: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:21:31.508961: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:21:31.509071: W tensorflow/core/common_runtime/gpu/gpu_bfc_allocator.cc:42] Overriding orig_value setting because the TF_FORCE_GPU_ALLOW_GROWTH environment variable is set. Original config value was 0.\n",
-      "2023-04-13 11:21:31.509079: I tensorflow/core/common_runtime/gpu/gpu_process_state.cc:222] Using CUDA malloc Async allocator for GPU: 0\n",
-      "2023-04-13 11:21:31.509140: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1637] Created device /job:localhost/replica:0/task:0/device:GPU:0 with 24576 MB memory:  -> device: 0, name: Quadro RTX 8000, pci bus id: 0000:08:00.0, compute capability: 7.5\n",
+      "2023-05-09 01:50:26.675123: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:50:26.675302: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:50:26.675428: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:50:27.455564: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:50:27.455749: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:50:27.455877: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:50:27.455980: W tensorflow/core/common_runtime/gpu/gpu_bfc_allocator.cc:42] Overriding orig_value setting because the TF_FORCE_GPU_ALLOW_GROWTH environment variable is set. Original config value was 0.\n",
+      "2023-05-09 01:50:27.456001: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1637] Created device /job:localhost/replica:0/task:0/device:GPU:0 with 24576 MB memory:  -> device: 0, name: Quadro RTX 8000, pci bus id: 0000:08:00.0, compute capability: 7.5\n",
       "/usr/local/lib/python3.8/dist-packages/tqdm/auto.py:22: TqdmWarning: IProgress not found. Please update jupyter and ipywidgets. See https://ipywidgets.readthedocs.io/en/stable/user_install.html\n",
       "  from .autonotebook import tqdm as notebook_tqdm\n"
      ]
     }
    ],
    "source": [
-    "import os\n",
-    "os.environ[\"TF_GPU_ALLOCATOR\"]=\"cuda_malloc_async\"\n",
-    "import gc\n",
-    "import numpy as np\n",
-    "\n",
-    "import tensorflow as tf\n",
-    "\n",
-    "from merlin.schema.tags import Tags\n",
-    "from merlin.io.dataset import Dataset\n",
     "import merlin.models.tf as mm"
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 8,
+   "execution_count": 7,
    "id": "11647dd3",
    "metadata": {},
    "outputs": [],
@@ -439,7 +1977,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 9,
+   "execution_count": 8,
    "id": "4ab4e0fb",
    "metadata": {},
    "outputs": [],
@@ -450,7 +1988,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 10,
+   "execution_count": 9,
    "id": "8d9903e6",
    "metadata": {},
    "outputs": [],
@@ -469,7 +2007,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 11,
+   "execution_count": 10,
    "id": "410ea223",
    "metadata": {},
    "outputs": [],
@@ -480,7 +2018,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 12,
+   "execution_count": 11,
    "id": "4328f03a",
    "metadata": {},
    "outputs": [],
@@ -492,231 +2030,11804 @@
   },
   {
    "cell_type": "code",
-   "execution_count": null,
-   "id": "4571b92b",
+   "execution_count": 12,
+   "id": "d5a9dd50",
    "metadata": {},
    "outputs": [],
-   "source": []
+   "source": [
+    "ops = ['sess_pid_seq'] >> Categorify(dtype=np.int32) #>> Rename(name=seq_name)\n",
+    "\n",
+    "wf = Workflow(ops)\n",
+    "\n",
+    "train = wf.fit_transform(train)\n",
+    "valid = wf.transform(valid)"
+   ]
   },
   {
    "cell_type": "code",
    "execution_count": 13,
-   "id": "d5a9dd50",
+   "id": "3116726e",
    "metadata": {},
    "outputs": [],
    "source": [
-    "ops = ['sess_pid_seq'] >> Categorify(dtype=np.int32) #>> Rename(name=seq_name)\n",
+    "# cat rees46_schema_modified.pbtxt"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 14,
+   "id": "69e8f95c",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "# %%writefile rees46_schema_modified_2.pbtxt\n",
     "\n",
-    "wf = Workflow(ops)\n",
+    "# feature {\n",
+    "#   name: \"seq\"\n",
+    "#   value_count {\n",
+    "#     min: 2\n",
+    "#   }\n",
+    "#   type: INT\n",
+    "#   int_domain {\n",
+    "#     name: \"seq\"\n",
+    "#     min: 1\n",
+    "#     max: 390000\n",
+    "#     is_categorical: true\n",
+    "#   }\n",
+    "#   annotation {\n",
+    "#     tag: \"item_id\"\n",
+    "#     tag: \"list\"\n",
+    "#     tag: \"categorical\"\n",
+    "#     tag: \"item\"\n",
+    "#   }\n",
+    "# }"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 15,
+   "id": "a6ade14a",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from merlin.schema.io.tensorflow_metadata import TensorflowMetadata\n",
     "\n",
-    "train = wf.fit_transform(train)\n",
-    "valid = wf.transform(valid)"
+    "def get_model():\n",
+    "    mlp_block = mm.MLPBlock(\n",
+    "                    [d_model],\n",
+    "                    activation='relu',\n",
+    "                    no_activation_last_layer=True,\n",
+    "                )\n",
+    "\n",
+    "    schema = TensorflowMetadata.from_proto_text_file(\n",
+    "        './',\n",
+    "        file_name='rees46_schema_modified.pbtxt'\n",
+    "    ).to_merlin_schema()\n",
+    "\n",
+    "    train.schema = schema\n",
+    "    \n",
+    "    schema_model = schema.select_by_tag(Tags.ITEM_ID)\n",
+    "    input_block = mm.InputBlockV2(\n",
+    "        schema_model,\n",
+    "        categorical=mm.Embeddings(\n",
+    "                schema_model.select_by_tag(Tags.CATEGORICAL),\n",
+    "                dim=item_embedding_dim,\n",
+    "                sequence_combiner=None,\n",
+    "            )\n",
+    "        )\n",
+    "\n",
+    "    train.schema = train.schema.select_by_name(seq_name)\n",
+    "\n",
+    "    xlnet_block = mm.XLNetBlock(d_model=d_model, n_head=n_head, n_layer=n_layer)\n",
+    "\n",
+    "    dense_block = mm.SequentialBlock(\n",
+    "        input_block,\n",
+    "        mlp_block,\n",
+    "        xlnet_block\n",
+    "    )\n",
+    "\n",
+    "    mlp_block2 = mm.MLPBlock(\n",
+    "                    [item_embedding_dim],\n",
+    "                    activation='relu',\n",
+    "                    no_activation_last_layer=True,\n",
+    "                )\n",
+    "\n",
+    "    prediction_task = mm.CategoricalOutput(\n",
+    "        to_call=input_block[\"categorical\"][target],\n",
+    "    )\n",
+    "\n",
+    "    model_transformer = mm.Model(dense_block, mlp_block2, prediction_task)\n",
+    "\n",
+    "    optimizer = tf.keras.optimizers.Adam(\n",
+    "        learning_rate=learning_rate,\n",
+    "    )\n",
+    "\n",
+    "    model_transformer.compile(run_eagerly=False, optimizer=optimizer, loss=\"categorical_crossentropy\",\n",
+    "                  metrics=mm.TopKMetricsAggregator.default_metrics(top_ks=[20])\n",
+    "                 )\n",
+    "    return model_transformer, xlnet_block"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 16,
+   "id": "076f42cc",
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "/usr/local/lib/python3.8/dist-packages/merlin/schema/tags.py:149: UserWarning: Compound tags like Tags.ITEM_ID have been deprecated and will be removed in a future version. Please use the atomic versions of these tags, like [<Tags.ITEM: 'item'>, <Tags.ID: 'id'>].\n",
+      "  warnings.warn(\n"
+     ]
+    }
+   ],
+   "source": [
+    "model_transformer, xlnet_block = get_model()"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 17,
+   "id": "523fe2ac",
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "/usr/local/lib/python3.8/dist-packages/keras/initializers/initializers_v2.py:120: UserWarning: The initializer TruncatedNormal is unseeded and being called multiple times, which will return identical values  each time (even if the initializer is unseeded). Please update your code to provide a seed to the initializer, or avoid using the same initalizer instance more than once.\n",
+      "  warnings.warn(\n",
+      "2023-05-09 01:50:35.053579: I tensorflow/stream_executor/cuda/cuda_dnn.cc:424] Loaded cuDNN version 8700\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "WARNING:tensorflow:Gradients do not exist for variables ['model/mask_emb:0', 'transformer/layer_._0/rel_attn/r_s_bias:0', 'transformer/layer_._0/rel_attn/seg_embed:0', 'transformer/layer_._1/rel_attn/r_s_bias:0', 'transformer/layer_._1/rel_attn/seg_embed:0', 'transformer/layer_._2/rel_attn/r_s_bias:0', 'transformer/layer_._2/rel_attn/seg_embed:0'] when minimizing the loss. If you're using `model.compile()`, did you forget to provide a `loss` argument?\n"
+     ]
+    },
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "/usr/local/lib/python3.8/dist-packages/tensorflow/python/framework/indexed_slices.py:444: UserWarning: Converting sparse IndexedSlices(IndexedSlices(indices=Tensor(\"gradient_tape/model/sequential_block_4/xl_net_block/prepare_transformer_inputs_4/RaggedToTensor_1/boolean_mask_1/GatherV2:0\", shape=(None,), dtype=int32), values=Tensor(\"gradient_tape/model/sequential_block_4/xl_net_block/prepare_transformer_inputs_4/RaggedToTensor_1/boolean_mask/GatherV2:0\", shape=(None, 192), dtype=float32), dense_shape=Tensor(\"gradient_tape/model/sequential_block_4/xl_net_block/prepare_transformer_inputs_4/RaggedToTensor_1/Shape:0\", shape=(2,), dtype=int32))) to a dense Tensor of unknown shape. This may consume a large amount of memory.\n",
+      "  warnings.warn(\n",
+      "/usr/local/lib/python3.8/dist-packages/tensorflow/python/framework/indexed_slices.py:436: UserWarning: Converting sparse IndexedSlices to a dense Tensor with 174720448 elements. This may consume a large amount of memory.\n",
+      "  warnings.warn(\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "WARNING:tensorflow:Gradients do not exist for variables ['model/mask_emb:0', 'transformer/layer_._0/rel_attn/r_s_bias:0', 'transformer/layer_._0/rel_attn/seg_embed:0', 'transformer/layer_._1/rel_attn/r_s_bias:0', 'transformer/layer_._1/rel_attn/seg_embed:0', 'transformer/layer_._2/rel_attn/r_s_bias:0', 'transformer/layer_._2/rel_attn/seg_embed:0'] when minimizing the loss. If you're using `model.compile()`, did you forget to provide a `loss` argument?\n",
+      "677/677 [==============================] - 105s 143ms/step - loss: 7.2880 - recall_at_20: 0.1451 - mrr_at_20: 0.0813 - ndcg_at_20: 0.0954 - map_at_20: 0.0813 - precision_at_20: 0.0073 - regularization_loss: 0.0000e+00 - loss_batch: 7.2857\n",
+      "84/84 [==============================] - 4s 26ms/step - loss: 8.5378 - recall_at_20: 0.2315 - mrr_at_20: 0.0811 - ndcg_at_20: 0.1142 - map_at_20: 0.0811 - precision_at_20: 0.0116 - regularization_loss: 0.0000e+00 - loss_batch: 8.5385\n"
+     ]
+    },
+    {
+     "data": {
+      "text/plain": [
+       "{'loss': 8.537825584411621,\n",
+       " 'recall_at_20': 0.2337784469127655,\n",
+       " 'mrr_at_20': 0.07926096022129059,\n",
+       " 'ndcg_at_20': 0.11324834823608398,\n",
+       " 'map_at_20': 0.07926096022129059,\n",
+       " 'precision_at_20': 0.011688923463225365,\n",
+       " 'regularization_loss': 0.0,\n",
+       " 'loss_batch': 8.566910743713379}"
+      ]
+     },
+     "execution_count": 17,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "model_transformer.fit(\n",
+    "    train,\n",
+    "    batch_size=batch_size,\n",
+    "    epochs=n_epoch,\n",
+    "    pre=mm.SequencePredictNext(schema=train.schema, target=target, transformer=xlnet_block)\n",
+    ")\n",
+    "\n",
+    "predict_last = mm.SequencePredictLast(schema=valid.schema, target=target, transformer=xlnet_block)\n",
+    "model_transformer.evaluate(\n",
+    "    valid,\n",
+    "    batch_size=batch_size,\n",
+    "    pre=predict_last,\n",
+    "    return_dict=True\n",
+    ")"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 18,
+   "id": "febab09e",
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "WARNING:tensorflow:Skipping full serialization of Keras layer TFSharedEmbeddings(\n",
+      "  (_feature_shapes): Dict(\n",
+      "    (sess_pid_seq): TensorShape([128, None, 1])\n",
+      "  )\n",
+      "  (_feature_dtypes): Dict(\n",
+      "    (sess_pid_seq): tf.int32\n",
+      "  )\n",
+      "), because it is not built.\n",
+      "WARNING:tensorflow:Skipping full serialization of Keras layer Dropout(\n",
+      "  (_feature_shapes): Dict(\n",
+      "    (sess_pid_seq): TensorShape([128, None, 1])\n",
+      "  )\n",
+      "  (_feature_dtypes): Dict(\n",
+      "    (sess_pid_seq): tf.int32\n",
+      "  )\n",
+      "), because it is not built.\n",
+      "WARNING:tensorflow:Skipping full serialization of Keras layer Dropout(\n",
+      "  (_feature_shapes): Dict(\n",
+      "    (sess_pid_seq): TensorShape([128, None, 1])\n",
+      "  )\n",
+      "  (_feature_dtypes): Dict(\n",
+      "    (sess_pid_seq): tf.int32\n",
+      "  )\n",
+      "), because it is not built.\n",
+      "WARNING:tensorflow:Skipping full serialization of Keras layer Dropout(\n",
+      "  (_feature_shapes): Dict(\n",
+      "    (sess_pid_seq): TensorShape([128, None, 1])\n",
+      "  )\n",
+      "  (_feature_dtypes): Dict(\n",
+      "    (sess_pid_seq): tf.int32\n",
+      "  )\n",
+      "), because it is not built.\n"
+     ]
+    },
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "WARNING:absl:Found untraced functions such as model_context_layer_call_fn, model_context_layer_call_and_return_conditional_losses, sequence_predict_next_layer_call_fn, sequence_predict_next_layer_call_and_return_conditional_losses, sequence_predict_last_layer_call_fn while saving (showing 5 of 114). These functions will not be directly callable after loading.\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "INFO:tensorflow:Assets written to: t4rec_model/assets\n"
+     ]
+    },
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "INFO:tensorflow:Assets written to: t4rec_model/assets\n",
+      "/usr/local/lib/python3.8/dist-packages/merlin/models/tf/utils/tf_utils.py:101: CustomMaskWarning: Custom mask layers require a config and must override get_config. When loading, the custom mask layer must be passed to the custom_objects argument.\n",
+      "  config[key] = tf.keras.utils.serialize_keras_object(maybe_value)\n",
+      "/usr/local/lib/python3.8/dist-packages/merlin/models/tf/core/combinators.py:288: CustomMaskWarning: Custom mask layers require a config and must override get_config. When loading, the custom mask layer must be passed to the custom_objects argument.\n",
+      "  config[i] = tf.keras.utils.serialize_keras_object(layer)\n",
+      "/usr/local/lib/python3.8/dist-packages/keras/saving/saved_model/layer_serialization.py:134: CustomMaskWarning: Custom mask layers require a config and must override get_config. When loading, the custom mask layer must be passed to the custom_objects argument.\n",
+      "  return generic_utils.serialize_keras_object(obj)\n",
+      "/usr/local/lib/python3.8/dist-packages/merlin/schema/tags.py:149: UserWarning: Compound tags like Tags.ITEM_ID have been deprecated and will be removed in a future version. Please use the atomic versions of these tags, like [<Tags.ITEM: 'item'>, <Tags.ID: 'id'>].\n",
+      "  warnings.warn(\n",
+      "/usr/local/lib/python3.8/dist-packages/keras/initializers/initializers_v2.py:120: UserWarning: The initializer TruncatedNormal is unseeded and being called multiple times, which will return identical values  each time (even if the initializer is unseeded). Please update your code to provide a seed to the initializer, or avoid using the same initalizer instance more than once.\n",
+      "  warnings.warn(\n"
+     ]
+    }
+   ],
+   "source": [
+    "model_transformer.save('t4rec_model')"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 19,
+   "id": "8e0ea1b1",
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "/usr/local/lib/python3.8/dist-packages/merlin/schema/tags.py:149: UserWarning: Compound tags like Tags.ITEM_ID have been deprecated and will be removed in a future version. Please use the atomic versions of these tags, like [<Tags.ITEM: 'item'>, <Tags.ID: 'id'>].\n",
+      "  warnings.warn(\n",
+      "/usr/local/lib/python3.8/dist-packages/keras/initializers/initializers_v2.py:120: UserWarning: The initializer TruncatedNormal is unseeded and being called multiple times, which will return identical values  each time (even if the initializer is unseeded). Please update your code to provide a seed to the initializer, or avoid using the same initalizer instance more than once.\n",
+      "  warnings.warn(\n"
+     ]
+    },
+    {
+     "data": {
+      "text/plain": [
+       "Model(\n",
+       "  (_should_compute_train_metrics_for_batch): <tf.Variable 'should_compute_train_metrics_for_batch:0' shape=() dtype=bool, numpy=True>\n",
+       "  (blocks): _TupleWrapper((SequentialBlock(\n",
+       "    (layers): List(\n",
+       "      (0): ParallelBlock(\n",
+       "        (_aggregation): ConcatFeatures(\n",
+       "          (_feature_shapes): Dict()\n",
+       "          (_feature_dtypes): Dict()\n",
+       "        )\n",
+       "        (parallel_layers): Dict(\n",
+       "          (categorical): ParallelBlock(\n",
+       "            (parallel_layers): Dict(\n",
+       "              (sess_pid_seq): EmbeddingTable(\n",
+       "                (features): Dict(\n",
+       "                  (sess_pid_seq): ColumnSchema(name='sess_pid_seq', tags={<Tags.LIST: 'list'>, <Tags.ITEM_ID: 'item_id'>, <Tags.CATEGORICAL: 'categorical'>, <Tags.ITEM: 'item'>, <Tags.ID: 'id'>}, properties={'domain': {'min': 1, 'max': 390000, 'name': 'sess_pid_seq'}, 'value_count': {'min': 2, 'max': None}}, dtype=DType(name='int64', element_type=<ElementType.Int: 'int'>, element_size=64, element_unit=None, signed=True, shape=Shape(dims=(Dimension(min=0, max=None), Dimension(min=2, max=None)))), is_list=True, is_ragged=True)\n",
+       "                )\n",
+       "                (table): Embedding(\n",
+       "                  (embeddings): <tf.Variable 'model/embeddings:0' shape=(390001, 448) dtype=float32, numpy=\n",
+       "                  array([[-0.07078984,  0.02619123, -0.0765224 , ..., -0.00312191,\n",
+       "                          -0.05631081,  0.00704953],\n",
+       "                         [ 0.01045333,  0.00758395,  0.04146114, ...,  0.04109409,\n",
+       "                           0.03323384, -0.01482256],\n",
+       "                         [ 0.05135752,  0.00544662,  0.01021936, ...,  0.01505754,\n",
+       "                           0.04705757,  0.05248646],\n",
+       "                         ...,\n",
+       "                         [-0.01608207, -0.01954165, -0.07535209, ..., -0.04260258,\n",
+       "                          -0.01301942, -0.06323248],\n",
+       "                         [-0.06214527, -0.00186577, -0.0687324 , ..., -0.06297008,\n",
+       "                           0.01791379,  0.00888064],\n",
+       "                         [ 0.00934703, -0.02699249, -0.05696923, ..., -0.01498478,\n",
+       "                          -0.02875059, -0.01258981]], dtype=float32)>\n",
+       "                  (_feature_shapes): Dict()\n",
+       "                  (_feature_dtypes): Dict()\n",
+       "                )\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "            )\n",
+       "            (_feature_shapes): Dict()\n",
+       "            (_feature_dtypes): Dict()\n",
+       "          )\n",
+       "        )\n",
+       "        (_feature_shapes): Dict()\n",
+       "        (_feature_dtypes): Dict()\n",
+       "      )\n",
+       "      (1): SequentialBlock(\n",
+       "        (layers): List(\n",
+       "          (0): _Dense(\n",
+       "            (dense): Dense(\n",
+       "              192, activation=linear, use_bias=True\n",
+       "              (kernel): <tf.Variable 'model/sequential_block_4/sequential_block_3/private__dense_4/dense_4/kernel:0' shape=(448, 192) dtype=float32, numpy=\n",
+       "              array([[ 0.02981133,  0.06461035,  0.01510283, ...,  0.1004636 ,\n",
+       "                       0.08716937, -0.08222788],\n",
+       "                     [ 0.12464947, -0.01943095, -0.08936852, ..., -0.11199582,\n",
+       "                      -0.00518215,  0.03097023],\n",
+       "                     [-0.05487638, -0.03602364,  0.01802338, ...,  0.07153857,\n",
+       "                      -0.07527662,  0.08495165],\n",
+       "                     ...,\n",
+       "                     [-0.1403924 ,  0.05157026, -0.02877661, ..., -0.06823655,\n",
+       "                      -0.01583085,  0.00734937],\n",
+       "                     [ 0.0970163 ,  0.00122412, -0.06907965, ...,  0.00457447,\n",
+       "                       0.13658312, -0.03208682],\n",
+       "                     [ 0.12975962, -0.08130139,  0.06337038, ..., -0.05003506,\n",
+       "                       0.10430032, -0.0064334 ]], dtype=float32)>\n",
+       "              (bias): <tf.Variable 'model/sequential_block_4/sequential_block_3/private__dense_4/dense_4/bias:0' shape=(192,) dtype=float32, numpy=\n",
+       "              array([ 1.43787926e-02,  1.59404390e-02,  1.67473760e-02,  7.21977139e-03,\n",
+       "                      6.33917842e-03,  2.58572530e-02,  3.13014239e-02,  1.73701141e-02,\n",
+       "                      1.48087014e-02,  2.96549569e-03, -2.38333214e-02,  8.77642911e-03,\n",
+       "                      1.06761325e-02,  3.36384363e-02,  4.62334929e-03, -8.29183683e-03,\n",
+       "                     -8.38614441e-03,  5.23438072e-03, -1.13991052e-02, -8.36018473e-03,\n",
+       "                     -1.31951617e-02,  2.81518009e-02, -9.40237835e-04,  9.32820234e-03,\n",
+       "                      1.33291865e-02, -1.77176334e-02,  2.10216315e-03,  1.87406167e-02,\n",
+       "                      1.61009599e-02, -8.48586764e-03, -1.15597923e-03, -3.26531157e-02,\n",
+       "                     -2.06898451e-02,  5.39109018e-03, -1.36626642e-02, -1.38687436e-02,\n",
+       "                     -2.26706192e-02,  6.11577649e-03, -3.18103912e-03,  1.94463357e-02,\n",
+       "                     -8.99321120e-03,  1.10318577e-02, -3.57778568e-04, -2.15437096e-02,\n",
+       "                      8.29706341e-03,  1.93839315e-02, -1.22853033e-02,  4.07569576e-03,\n",
+       "                     -3.85260396e-03,  1.50105879e-02,  2.51611378e-02, -1.21379722e-04,\n",
+       "                     -8.72366596e-03,  1.10414680e-02,  8.01387336e-03,  1.93086620e-02,\n",
+       "                     -1.17792934e-02, -1.27949128e-02, -1.77857298e-02,  6.12063659e-03,\n",
+       "                     -1.06555698e-02,  2.38406751e-02,  1.68557782e-02, -2.46193428e-02,\n",
+       "                     -4.28844243e-04, -9.85239353e-03, -8.28314759e-03, -1.45868491e-02,\n",
+       "                     -2.00257804e-02, -2.40923855e-02, -1.39658488e-02, -1.27546610e-02,\n",
+       "                     -9.04119946e-03, -4.83184028e-03, -2.38742288e-02,  8.41362681e-03,\n",
+       "                      6.28646929e-03, -6.15912909e-03, -1.63500663e-02, -2.31754519e-02,\n",
+       "                      1.32788168e-02,  9.51185077e-03,  1.65086053e-02, -1.60954632e-02,\n",
+       "                      9.85623058e-03,  2.38858704e-02,  3.10745835e-02,  2.13986728e-02,\n",
+       "                      2.30935402e-02,  4.93171439e-03,  2.00362224e-03, -1.62822679e-02,\n",
+       "                     -8.62161350e-03,  4.49663820e-03, -2.08899472e-03, -5.89254498e-03,\n",
+       "                     -2.94782836e-02, -1.22268952e-03, -1.93146132e-02,  1.21866888e-03,\n",
+       "                     -1.87950805e-02,  2.44022720e-02,  1.59054287e-02,  2.21225247e-02,\n",
+       "                      3.15532903e-03,  1.12948762e-02,  8.12306348e-03,  1.56098893e-02,\n",
+       "                     -1.17675038e-02, -1.63580347e-02,  1.88086070e-02, -1.38652390e-02,\n",
+       "                     -3.15350899e-03,  8.77492130e-03,  1.18342219e-02, -1.49739422e-02,\n",
+       "                      6.47581508e-03,  3.03330850e-02, -1.90902874e-02, -1.45000021e-03,\n",
+       "                     -1.03481673e-02,  7.81869609e-03,  1.72040816e-02,  6.01074891e-03,\n",
+       "                     -5.98280178e-03,  1.62119158e-02, -3.46120563e-03,  2.07602121e-02,\n",
+       "                     -2.54524648e-02,  1.74027961e-02, -3.89394991e-04, -1.67317968e-02,\n",
+       "                     -1.35547416e-02, -9.72852856e-03,  1.18460059e-02,  1.24235135e-02,\n",
+       "                     -1.63785629e-02,  1.74656305e-02,  1.90548915e-02,  1.04588689e-03,\n",
+       "                     -1.90762617e-03,  7.47023476e-03, -2.55116820e-02, -1.26734246e-02,\n",
+       "                     -4.49683182e-02,  1.02095297e-02,  1.64573826e-02, -3.88838630e-03,\n",
+       "                      2.11874070e-03,  1.12091172e-02,  3.44686466e-03, -1.45416530e-02,\n",
+       "                     -4.72093653e-03, -8.66287446e-04,  2.89157755e-03, -1.11150099e-02,\n",
+       "                     -6.02090824e-03, -4.13971767e-03, -6.68562716e-05, -5.79372188e-03,\n",
+       "                      4.68081189e-03,  2.69649494e-02, -1.22015532e-02,  5.52360713e-03,\n",
+       "                      1.16638672e-02, -3.86768812e-03, -2.13873144e-02,  1.76261328e-02,\n",
+       "                     -1.74660943e-02, -4.66883089e-03,  6.08942751e-03, -1.52808484e-02,\n",
+       "                      8.08198191e-03, -1.73900351e-02,  2.05766819e-02, -1.57578122e-02,\n",
+       "                     -1.46813886e-02, -3.82549944e-03,  9.23505798e-03,  2.55444204e-04,\n",
+       "                     -1.10080764e-02, -5.10681840e-03, -4.75318544e-03,  1.36948908e-02,\n",
+       "                     -1.06984098e-02, -1.48467710e-02, -4.16625105e-03, -1.44588202e-02,\n",
+       "                      1.68166235e-02,  6.71163388e-03, -1.79299600e-02,  5.36123384e-03],\n",
+       "                    dtype=float32)>\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "            (_feature_shapes): Dict()\n",
+       "            (_feature_dtypes): Dict()\n",
+       "          )\n",
+       "        )\n",
+       "        (_feature_shapes): Dict()\n",
+       "        (_feature_dtypes): Dict()\n",
+       "      )\n",
+       "      (2): XLNetBlock(\n",
+       "        (transformer): TFXLNetMainLayer(\n",
+       "          (word_embedding): TFSharedEmbeddings(\n",
+       "            (_feature_shapes): Dict()\n",
+       "            (_feature_dtypes): Dict()\n",
+       "          )\n",
+       "          (layer): List(\n",
+       "            (0): TFXLNetLayer(\n",
+       "              (rel_attn): TFXLNetRelativeAttention(\n",
+       "                (layer_norm): LayerNormalization(\n",
+       "                  (axis): List(\n",
+       "                    (0): 2\n",
+       "                  )\n",
+       "                  (gamma): <tf.Variable 'transformer/layer_._0/rel_attn/layer_norm/gamma:0' shape=(192,) dtype=float32, numpy=\n",
+       "                  array([1.0096865 , 1.0156112 , 1.0047966 , 1.0055697 , 1.0296937 ,\n",
+       "                         1.0257732 , 1.0405434 , 1.0163577 , 0.9534506 , 1.0183752 ,\n",
+       "                         1.027002  , 1.0310668 , 1.0172462 , 1.0297366 , 0.9981551 ,\n",
+       "                         0.9956357 , 0.99598515, 0.98782843, 1.0019149 , 1.0021151 ,\n",
+       "                         0.9731392 , 1.0394815 , 1.0419115 , 0.99122995, 0.9815058 ,\n",
+       "                         1.0394274 , 0.95420986, 1.0140872 , 1.0178257 , 1.0153575 ,\n",
+       "                         0.9975193 , 1.0342228 , 0.9783905 , 0.99436754, 1.0437794 ,\n",
+       "                         1.0107313 , 0.9973728 , 1.0330907 , 0.98237264, 1.0205512 ,\n",
+       "                         1.0262665 , 1.057069  , 1.0186831 , 1.0065695 , 1.0573292 ,\n",
+       "                         0.9723765 , 1.0185301 , 0.9783078 , 1.0805802 , 1.0072856 ,\n",
+       "                         1.046347  , 0.9651661 , 1.0125892 , 1.0318221 , 1.0100422 ,\n",
+       "                         0.98210293, 1.0385141 , 1.0028491 , 1.0255537 , 0.9748143 ,\n",
+       "                         1.0136645 , 0.9777978 , 1.0167676 , 0.9867102 , 0.99873364,\n",
+       "                         1.0448893 , 0.9775781 , 1.020897  , 1.0156687 , 1.0070162 ,\n",
+       "                         0.9949982 , 0.9890248 , 1.0294597 , 0.97803134, 0.9471789 ,\n",
+       "                         1.0155677 , 1.0290877 , 1.0084465 , 0.9563062 , 0.98199034,\n",
+       "                         1.0073545 , 0.96270114, 1.0361133 , 1.0037365 , 1.0049076 ,\n",
+       "                         0.9958272 , 1.0042776 , 0.9906111 , 1.0195004 , 0.98845285,\n",
+       "                         1.0099287 , 1.0035214 , 0.9916738 , 0.9639702 , 0.9999653 ,\n",
+       "                         1.0250297 , 1.036368  , 1.0106395 , 0.99796367, 0.9961404 ,\n",
+       "                         0.99974966, 0.98292816, 0.9863248 , 1.0158017 , 0.9997731 ,\n",
+       "                         1.0132103 , 1.0377946 , 1.0157263 , 0.98545736, 1.0048945 ,\n",
+       "                         1.0137354 , 1.0606142 , 0.98290765, 1.0372158 , 0.9920816 ,\n",
+       "                         1.0716795 , 1.0048707 , 1.0199146 , 1.0151896 , 1.0404963 ,\n",
+       "                         1.009017  , 1.0116297 , 1.0267462 , 1.0299959 , 0.9948385 ,\n",
+       "                         1.0162882 , 1.0151713 , 0.9754863 , 1.0113914 , 1.0105838 ,\n",
+       "                         1.018187  , 1.0054674 , 1.0116692 , 1.0358899 , 1.0134988 ,\n",
+       "                         1.0051659 , 0.96874547, 0.99625516, 1.0667871 , 0.97690076,\n",
+       "                         1.0244907 , 0.9951849 , 0.9845813 , 0.9981892 , 1.0345283 ,\n",
+       "                         0.9751158 , 1.0104059 , 1.0049229 , 1.0344111 , 1.0108231 ,\n",
+       "                         1.0074483 , 1.0138446 , 0.97882235, 0.9838856 , 0.9797773 ,\n",
+       "                         1.0448751 , 1.0250106 , 0.9940398 , 1.0415001 , 1.010096  ,\n",
+       "                         0.9959737 , 1.0421578 , 0.99612373, 1.008482  , 1.0168474 ,\n",
+       "                         1.0117303 , 1.0058619 , 1.0206212 , 0.9813257 , 0.97197706,\n",
+       "                         1.0078402 , 1.0188038 , 0.9819965 , 1.0236609 , 0.9870887 ,\n",
+       "                         0.96151966, 1.0474262 , 1.0463325 , 1.0403295 , 1.015123  ,\n",
+       "                         1.0659757 , 0.98529726, 0.96674085, 1.0507897 , 0.9882364 ,\n",
+       "                         1.0611303 , 0.98063576, 1.0268865 , 0.9999817 , 0.95722026,\n",
+       "                         1.0107577 , 1.0596876 ], dtype=float32)>\n",
+       "                  (beta): <tf.Variable 'transformer/layer_._0/rel_attn/layer_norm/beta:0' shape=(192,) dtype=float32, numpy=\n",
+       "                  array([-7.82491732e-03,  1.17448866e-02,  2.86215218e-05,  2.13310122e-02,\n",
+       "                          6.15173485e-03,  4.41838168e-02,  3.52672711e-02,  3.73794995e-02,\n",
+       "                         -2.44397484e-02,  2.63913777e-02, -1.92101207e-02,  1.68179050e-02,\n",
+       "                          1.09884115e-02,  6.81292498e-03, -1.47153009e-02,  1.50813432e-02,\n",
+       "                         -7.20379350e-04,  1.68901030e-02, -4.87045525e-03, -2.82951538e-02,\n",
+       "                         -1.63124632e-02,  2.98008770e-02,  2.43800394e-02, -1.33296829e-02,\n",
+       "                          5.78173622e-03,  8.41072667e-03, -1.16651105e-02,  4.57805302e-03,\n",
+       "                         -1.83029305e-02, -5.12085622e-03,  1.37897804e-02, -2.52885967e-02,\n",
+       "                          1.42254690e-02, -1.35734994e-02,  5.25993854e-02, -1.03573725e-02,\n",
+       "                         -1.14020770e-02,  9.41959268e-04,  3.96627970e-02,  3.15781720e-02,\n",
+       "                         -2.24383790e-02,  1.86920688e-02, -7.97046442e-03, -2.70248894e-02,\n",
+       "                          3.81716304e-02,  1.37069626e-02,  1.00353323e-02, -6.83175074e-03,\n",
+       "                          1.59086268e-02,  4.49690456e-03,  1.20646395e-02, -1.96351800e-02,\n",
+       "                         -1.78791047e-03, -2.16557011e-02,  5.07375300e-02, -2.81546824e-03,\n",
+       "                          5.75071760e-03, -4.75972937e-03,  2.06295010e-02, -7.60992151e-03,\n",
+       "                          1.30418986e-02,  1.54393655e-03,  8.23538285e-03, -9.66409966e-03,\n",
+       "                         -1.59477256e-02, -6.53768145e-03,  2.64450200e-02, -1.21939182e-02,\n",
+       "                         -2.44537480e-02, -1.32514127e-02,  4.72463388e-03, -6.23199455e-02,\n",
+       "                         -9.88284126e-03, -1.01852976e-03,  8.38834606e-03,  5.14619891e-03,\n",
+       "                         -2.43399031e-02, -3.44760045e-02,  3.00469343e-02, -1.12967705e-02,\n",
+       "                         -1.09801833e-02,  2.30398844e-03,  9.92888771e-03, -3.32463742e-03,\n",
+       "                          3.43136154e-02,  3.60682383e-02, -3.67968087e-03,  1.74639337e-02,\n",
+       "                          1.97809841e-02, -2.45451611e-02,  1.67986832e-03,  2.69882358e-03,\n",
+       "                         -2.04691254e-02,  1.29097085e-02, -2.70051602e-02, -4.05806676e-02,\n",
+       "                         -2.31585279e-02,  4.98421630e-03, -4.47037667e-02, -8.27246532e-03,\n",
+       "                         -7.42262113e-04, -3.22355516e-03, -5.14169736e-03,  2.15779357e-02,\n",
+       "                         -1.11045064e-02, -2.59866863e-02,  3.82872522e-02,  1.02850962e-02,\n",
+       "                          3.94708291e-02, -1.60061326e-02,  5.03637968e-03, -2.80841645e-02,\n",
+       "                          7.09669766e-05, -4.67813946e-03, -1.76187896e-05,  1.27147445e-02,\n",
+       "                         -4.22244053e-03,  4.70675938e-02, -1.94290020e-02, -1.37540735e-02,\n",
+       "                          1.72726456e-02, -3.45245190e-02, -1.70333236e-02,  6.64326828e-03,\n",
+       "                         -2.56029330e-02,  3.23950835e-02, -1.42239043e-02, -1.48923928e-02,\n",
+       "                         -1.45010799e-02,  2.70975046e-02,  3.46343732e-03, -1.41528598e-03,\n",
+       "                         -3.36916260e-02,  9.26417951e-03,  1.23228608e-02, -1.04462192e-03,\n",
+       "                         -4.54590917e-02,  6.67568156e-03, -3.63403489e-03, -6.04176559e-02,\n",
+       "                          4.78232652e-03, -3.75009403e-02, -2.47718971e-02, -1.40848383e-03,\n",
+       "                         -5.22233248e-02, -1.13894709e-03, -7.80673418e-03,  5.45118609e-03,\n",
+       "                          1.58662163e-03,  4.10271995e-02,  1.59943216e-02, -3.07554863e-02,\n",
+       "                         -1.69451218e-02, -1.17179407e-02,  2.83574010e-03, -2.54462264e-03,\n",
+       "                         -1.83762833e-02, -1.88289094e-03, -3.40282395e-02,  1.10489558e-02,\n",
+       "                         -1.69651117e-03,  2.39129476e-02,  5.87868970e-03,  9.99899115e-04,\n",
+       "                         -5.21592982e-03,  3.35242087e-03, -1.36361187e-02,  1.72579456e-02,\n",
+       "                          3.15937190e-03,  4.49407697e-02, -1.53307710e-02, -6.07074127e-02,\n",
+       "                          3.54830991e-03, -3.54800522e-02,  9.24525037e-03,  3.27169746e-02,\n",
+       "                         -2.32813358e-02,  3.64200436e-02, -6.11901516e-04, -3.56406788e-03,\n",
+       "                         -1.71201453e-02,  1.83092244e-02,  3.73052014e-03,  4.37969994e-03,\n",
+       "                         -6.32673851e-04,  1.01843160e-02,  2.05308665e-02, -2.17945818e-02,\n",
+       "                          2.46619992e-02, -1.98999303e-03, -6.00536261e-03, -1.18894950e-02],\n",
+       "                        dtype=float32)>\n",
+       "                  (_feature_shapes): Dict()\n",
+       "                  (_feature_dtypes): Dict()\n",
+       "                )\n",
+       "                (dropout): Dropout(\n",
+       "                  (_feature_shapes): Dict()\n",
+       "                  (_feature_dtypes): Dict()\n",
+       "                )\n",
+       "                (q): <tf.Variable 'transformer/layer_._0/rel_attn/q:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "                array([[[ 0.13197099, -0.12747517, -0.11641935, ..., -0.10109836,\n",
+       "                         -0.12369698, -0.12235671],\n",
+       "                        [-0.01014621,  0.0235051 , -0.0030254 , ..., -0.00358669,\n",
+       "                          0.02513896,  0.02814367],\n",
+       "                        [-0.09935587,  0.12525903, -0.1472499 , ...,  0.11936913,\n",
+       "                          0.13238919, -0.11256532],\n",
+       "                        ...,\n",
+       "                        [-0.12259299,  0.09363633, -0.11260894, ..., -0.07576296,\n",
+       "                         -0.08214942, -0.12410881],\n",
+       "                        [-0.05617683,  0.07248516,  0.05206291, ..., -0.06845155,\n",
+       "                          0.06023917,  0.07214421],\n",
+       "                        [ 0.0586201 ,  0.05837682,  0.05086967, ..., -0.04357501,\n",
+       "                         -0.06763364,  0.05550697]],\n",
+       "                \n",
+       "                       [[-0.13025644,  0.12209299,  0.12323013, ...,  0.12075363,\n",
+       "                          0.09601118,  0.09255827],\n",
+       "                        [ 0.08915628,  0.07382819,  0.07099618, ..., -0.0768103 ,\n",
+       "                          0.0475458 , -0.07742295],\n",
+       "                        [ 0.02872836, -0.06235151,  0.11553147, ..., -0.05319935,\n",
+       "                         -0.05903677,  0.03677876],\n",
+       "                        ...,\n",
+       "                        [ 0.12209638, -0.10401054,  0.13268085, ...,  0.09688871,\n",
+       "                          0.10452053,  0.12009949],\n",
+       "                        [ 0.10607433, -0.09689898, -0.06376923, ...,  0.08841456,\n",
+       "                         -0.10300028, -0.1044563 ],\n",
+       "                        [-0.0914668 , -0.08097184, -0.06668061, ...,  0.09470978,\n",
+       "                          0.06220397, -0.09111064]],\n",
+       "                \n",
+       "                       [[ 0.00058233,  0.02772736,  0.02006061, ...,  0.00036397,\n",
+       "                         -0.02168103,  0.01568287],\n",
+       "                        [ 0.00347983,  0.05903155,  0.02945688, ..., -0.03992393,\n",
+       "                          0.03995887, -0.01548792],\n",
+       "                        [-0.07598231,  0.09135605, -0.10173324, ...,  0.07594861,\n",
+       "                          0.08776175, -0.08319726],\n",
+       "                        ...,\n",
+       "                        [ 0.02002489, -0.0180598 ,  0.02898292, ...,  0.05892501,\n",
+       "                          0.07759988,  0.03240566],\n",
+       "                        [ 0.0311827 , -0.02396172, -0.06914719, ...,  0.02610791,\n",
+       "                         -0.031378  , -0.02404469],\n",
+       "                        [ 0.03871018,  0.03000399,  0.01775593, ..., -0.02095439,\n",
+       "                         -0.02130386,  0.04530597]],\n",
+       "                \n",
+       "                       ...,\n",
+       "                \n",
+       "                       [[-0.14868718,  0.15100038,  0.16120967, ...,  0.1410322 ,\n",
+       "                          0.15062724,  0.12837149],\n",
+       "                        [ 0.05342876,  0.03672805,  0.0651921 , ..., -0.05224199,\n",
+       "                          0.04776929, -0.08523804],\n",
+       "                        [ 0.05559164, -0.09261318,  0.107168  , ..., -0.08454619,\n",
+       "                         -0.09076596,  0.08992289],\n",
+       "                        ...,\n",
+       "                        [ 0.12589426, -0.11314777,  0.12426507, ...,  0.08356976,\n",
+       "                          0.10044491,  0.12639156],\n",
+       "                        [ 0.06355417, -0.04420558, -0.01156731, ...,  0.05051657,\n",
+       "                         -0.05817353, -0.03657222],\n",
+       "                        [-0.03658766, -0.02278869, -0.04286689, ...,  0.06056577,\n",
+       "                          0.04052235, -0.05048911]],\n",
+       "                \n",
+       "                       [[ 0.00077285, -0.02091939, -0.02179666, ..., -0.02718211,\n",
+       "                         -0.0087873 ,  0.00054167],\n",
+       "                        [-0.03704397, -0.0547603 , -0.04194904, ...,  0.0333349 ,\n",
+       "                         -0.03617225,  0.04379632],\n",
+       "                        [-0.00530401, -0.01642063,  0.00167275, ...,  0.00762442,\n",
+       "                          0.00649468,  0.00245123],\n",
+       "                        ...,\n",
+       "                        [ 0.00478095, -0.01497871, -0.00115625, ..., -0.00592807,\n",
+       "                         -0.01775305,  0.01014595],\n",
+       "                        [ 0.00987361, -0.01282128,  0.00660534, ...,  0.01324118,\n",
+       "                         -0.01851957,  0.00425063],\n",
+       "                        [ 0.01102448,  0.01941266,  0.00894985, ..., -0.02141596,\n",
+       "                          0.00027551,  0.04116082]],\n",
+       "                \n",
+       "                       [[-0.12173207,  0.12579004,  0.12077694, ...,  0.10138801,\n",
+       "                          0.11864589,  0.10221381],\n",
+       "                        [-0.02032071, -0.04710845, -0.0055217 , ...,  0.02435347,\n",
+       "                         -0.05264059,  0.00311177],\n",
+       "                        [-0.00397544, -0.03643695,  0.10240758, ..., -0.02665599,\n",
+       "                         -0.04377652,  0.03546317],\n",
+       "                        ...,\n",
+       "                        [ 0.0769384 , -0.06460597,  0.06227714, ...,  0.0460739 ,\n",
+       "                          0.02304599,  0.05762106],\n",
+       "                        [ 0.06128034, -0.04426205, -0.03479004, ...,  0.042454  ,\n",
+       "                         -0.05019034, -0.04568675],\n",
+       "                        [-0.05524379, -0.06202021, -0.04874821, ...,  0.04686412,\n",
+       "                          0.04290378, -0.0746149 ]]], dtype=float32)>\n",
+       "                (k): <tf.Variable 'transformer/layer_._0/rel_attn/k:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "                array([[[-7.68226478e-03, -2.18245108e-02,  9.52953065e-04, ...,\n",
+       "                         -4.93486365e-03, -1.21793533e-02, -1.26160523e-02],\n",
+       "                        [-7.43793417e-03, -1.20707992e-02, -6.53376943e-03, ...,\n",
+       "                          2.92456280e-02, -3.25674308e-03,  1.21511864e-02],\n",
+       "                        [-1.35852136e-02,  1.87938241e-03, -1.01676602e-02, ...,\n",
+       "                          2.05786899e-02,  1.34299798e-02, -1.43495211e-02],\n",
+       "                        ...,\n",
+       "                        [ 3.58363008e-03, -2.66930517e-02,  1.21933036e-03, ...,\n",
+       "                         -1.62357197e-03, -1.62881166e-02,  3.91136855e-03],\n",
+       "                        [ 2.21821051e-02, -2.58309972e-02, -3.92753910e-03, ...,\n",
+       "                          3.09738088e-02, -2.88884938e-02, -1.72762908e-02],\n",
+       "                        [ 3.42399031e-02,  4.14119326e-02,  3.64699885e-02, ...,\n",
+       "                         -1.62819158e-02, -4.43666801e-02,  4.56376821e-02]],\n",
+       "                \n",
+       "                       [[ 5.56782149e-02, -3.10854726e-02, -4.81049083e-02, ...,\n",
+       "                         -3.98653857e-02, -4.33852226e-02, -3.19941342e-02],\n",
+       "                        [ 4.35383096e-02,  6.49795458e-02,  2.57861316e-02, ...,\n",
+       "                         -5.24633527e-02,  4.20018435e-02, -2.63198018e-02],\n",
+       "                        [-2.54611839e-02,  3.08996532e-02,  1.94905959e-02, ...,\n",
+       "                          3.56150158e-02,  2.95397937e-02, -5.12102805e-02],\n",
+       "                        ...,\n",
+       "                        [-1.21757882e-02,  2.53642909e-02,  7.72101339e-05, ...,\n",
+       "                          1.69840753e-02,  8.38600751e-03, -3.96163156e-03],\n",
+       "                        [-3.53838429e-02,  3.53519283e-02, -3.68676893e-02, ...,\n",
+       "                         -2.53158119e-02,  2.94843595e-02,  1.01852333e-02],\n",
+       "                        [-1.47796969e-03,  6.62320666e-03,  1.49483886e-02, ...,\n",
+       "                         -2.28901999e-03, -6.19671959e-03,  2.28765719e-02]],\n",
+       "                \n",
+       "                       [[ 1.17053827e-02, -2.50329729e-02, -2.19117496e-02, ...,\n",
+       "                         -3.80133167e-02, -2.65514757e-02, -7.27514597e-03],\n",
+       "                        [-1.78928077e-02, -1.69182811e-02,  3.16141150e-03, ...,\n",
+       "                          1.59324165e-02, -1.54765015e-02,  7.96239730e-03],\n",
+       "                        [-1.16813637e-01,  1.03553854e-01, -3.13211568e-02, ...,\n",
+       "                          1.13394342e-01,  1.06305420e-01, -1.10351004e-01],\n",
+       "                        ...,\n",
+       "                        [-2.18171608e-02,  1.39812902e-02, -1.50209228e-02, ...,\n",
+       "                         -3.89618762e-02, -4.92681414e-02, -4.68410878e-03],\n",
+       "                        [ 3.05185374e-02, -3.40098143e-02,  1.13884155e-02, ...,\n",
+       "                          2.97950469e-02, -3.64380144e-02, -1.04942517e-02],\n",
+       "                        [ 3.37445624e-02,  3.35685574e-02,  3.04103903e-02, ...,\n",
+       "                         -2.40385197e-02, -1.90875176e-02,  4.48835082e-02]],\n",
+       "                \n",
+       "                       ...,\n",
+       "                \n",
+       "                       [[ 4.42194827e-02, -5.08627035e-02, -3.86995897e-02, ...,\n",
+       "                         -5.09292372e-02, -4.82375398e-02, -4.56841141e-02],\n",
+       "                        [-5.57947196e-02, -4.15932760e-02, -4.83722910e-02, ...,\n",
+       "                          4.65600304e-02, -4.73332889e-02,  3.59597690e-02],\n",
+       "                        [-4.08401750e-02,  2.42609885e-02,  3.46741155e-02, ...,\n",
+       "                          3.86420041e-02,  9.45237931e-03, -3.15879993e-02],\n",
+       "                        ...,\n",
+       "                        [ 4.90185805e-03,  4.53932863e-03,  1.13866816e-03, ...,\n",
+       "                          1.40106957e-02,  1.91211719e-02, -8.73244926e-03],\n",
+       "                        [-6.61803456e-03,  1.66730173e-02, -4.06372882e-02, ...,\n",
+       "                         -2.04761196e-02,  3.11128376e-03,  1.49987591e-02],\n",
+       "                        [ 5.47084492e-03,  6.85863616e-03,  2.34094419e-04, ...,\n",
+       "                          2.92215571e-02,  5.72894141e-03, -1.19066413e-03]],\n",
+       "                \n",
+       "                       [[-4.31554615e-02,  6.39417619e-02,  5.02575226e-02, ...,\n",
+       "                          6.53538033e-02,  5.54384664e-02,  4.20371369e-02],\n",
+       "                        [ 7.17930421e-02,  7.29683116e-02,  6.09961711e-02, ...,\n",
+       "                         -9.18020830e-02,  8.56361762e-02, -6.71873838e-02],\n",
+       "                        [ 5.04934788e-02, -4.51203883e-02,  1.68532617e-02, ...,\n",
+       "                         -3.29082832e-02, -2.49036923e-02,  4.25316319e-02],\n",
+       "                        ...,\n",
+       "                        [ 1.46742398e-02, -3.43895471e-03,  5.69227152e-03, ...,\n",
+       "                         -2.83451960e-03,  1.22414744e-02,  1.62646342e-02],\n",
+       "                        [-6.54027564e-03,  1.52935763e-03, -9.13942046e-03, ...,\n",
+       "                          5.21203212e-04, -2.77781975e-03, -6.00035116e-03],\n",
+       "                        [-5.78916371e-02, -5.93501814e-02, -8.45207125e-02, ...,\n",
+       "                          4.54125442e-02,  6.86786473e-02, -5.92041649e-02]],\n",
+       "                \n",
+       "                       [[ 4.55016270e-02, -1.08455513e-02, -2.07238458e-02, ...,\n",
+       "                         -2.82163695e-02, -2.77336575e-02, -3.14533934e-02],\n",
+       "                        [-2.32847258e-02, -1.02253594e-02, -4.68420517e-03, ...,\n",
+       "                         -5.64631820e-03, -2.67742760e-03,  2.13843174e-02],\n",
+       "                        [-2.86033489e-02,  2.24300697e-02,  4.91300672e-02, ...,\n",
+       "                          1.67693906e-02,  1.43385716e-02, -1.24855936e-02],\n",
+       "                        ...,\n",
+       "                        [-1.71137322e-02,  2.70220917e-02, -2.11604238e-02, ...,\n",
+       "                          1.46003044e-03, -1.17526902e-02, -1.94206256e-02],\n",
+       "                        [-8.81280228e-02,  8.72216299e-02,  4.61283103e-02, ...,\n",
+       "                         -8.43449533e-02,  8.62690136e-02,  8.77720714e-02],\n",
+       "                        [ 6.30031154e-03, -7.33704399e-03, -6.12117175e-04, ...,\n",
+       "                         -7.54373753e-03,  4.23501385e-03, -1.15064979e-02]]],\n",
+       "                      dtype=float32)>\n",
+       "                (v): <tf.Variable 'transformer/layer_._0/rel_attn/v:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "                array([[[ 2.1935981e-02, -6.5499027e-03, -1.1758077e-02, ...,\n",
+       "                          1.0016707e-02, -7.5214269e-04, -8.2895309e-03],\n",
+       "                        [-1.8930623e-03,  5.3072263e-02,  1.5991306e-03, ...,\n",
+       "                         -1.8671863e-02,  2.4590937e-02,  2.4358975e-02],\n",
+       "                        [-3.1385969e-02, -2.4187125e-02, -2.3068676e-02, ...,\n",
+       "                         -2.9522167e-03,  2.9918220e-02, -1.3696299e-02],\n",
+       "                        ...,\n",
+       "                        [ 4.5431224e-03, -2.1852402e-03, -3.7807938e-02, ...,\n",
+       "                         -6.8151602e-03, -6.5027446e-02, -2.5086295e-02],\n",
+       "                        [ 1.6041191e-02,  2.7763426e-02,  3.7474424e-02, ...,\n",
+       "                         -2.7330104e-02,  1.4487169e-02, -3.0760732e-02],\n",
+       "                        [ 2.8109785e-02, -2.4505377e-02,  1.8567089e-02, ...,\n",
+       "                          1.4045787e-02, -1.9658763e-02, -1.4424617e-02]],\n",
+       "                \n",
+       "                       [[ 1.8175874e-03, -3.2669792e-04,  1.3658139e-02, ...,\n",
+       "                         -2.3051307e-02, -4.8103187e-02,  1.1212352e-02],\n",
+       "                        [ 8.3899694e-03,  2.7757354e-02,  2.1220583e-03, ...,\n",
+       "                          1.4684557e-02, -9.0189716e-03, -1.3189890e-02],\n",
+       "                        [-4.5665298e-03,  6.0181617e-04, -1.9221806e-03, ...,\n",
+       "                         -2.3014978e-02, -1.6371313e-02, -1.3619252e-02],\n",
+       "                        ...,\n",
+       "                        [-4.4560842e-02,  3.2866932e-02, -1.5270534e-02, ...,\n",
+       "                          4.7959336e-03, -5.0913695e-02, -4.4832855e-02],\n",
+       "                        [-2.6422122e-02,  3.0812582e-05, -1.1526907e-02, ...,\n",
+       "                         -2.9947080e-02,  9.2024086e-03,  4.0475205e-03],\n",
+       "                        [-4.6224903e-02,  4.9632844e-03,  7.3847193e-03, ...,\n",
+       "                         -3.4064833e-02,  1.4927809e-02,  4.0222075e-02]],\n",
+       "                \n",
+       "                       [[-2.4709852e-02,  4.0778179e-02,  2.4162993e-02, ...,\n",
+       "                         -7.7223894e-04,  3.3004548e-02, -2.0557796e-03],\n",
+       "                        [-1.7915012e-02, -4.2037833e-02,  1.7063325e-02, ...,\n",
+       "                          3.9280627e-02, -8.4403567e-03,  1.0665564e-03],\n",
+       "                        [-3.1648852e-02,  1.9462965e-02, -5.1749021e-02, ...,\n",
+       "                          1.2728607e-02, -3.1452335e-02, -1.2489329e-02],\n",
+       "                        ...,\n",
+       "                        [-3.3701200e-02,  1.7426152e-02,  9.4926590e-03, ...,\n",
+       "                          8.8201044e-03, -2.5306158e-02,  5.8208715e-02],\n",
+       "                        [ 1.6601574e-02, -1.4275823e-02, -1.6822370e-02, ...,\n",
+       "                          2.4828877e-02, -8.6892888e-02,  6.4262375e-03],\n",
+       "                        [ 9.1747073e-03, -1.1685979e-02, -3.6286458e-02, ...,\n",
+       "                          1.3910839e-02,  8.0748266e-03,  5.0397436e-03]],\n",
+       "                \n",
+       "                       ...,\n",
+       "                \n",
+       "                       [[-8.4186476e-03, -1.0676413e-02, -1.0499355e-02, ...,\n",
+       "                          1.4340507e-03, -1.5456588e-02,  8.2055647e-03],\n",
+       "                        [ 2.0050982e-02,  3.9912029e-03, -4.9512643e-02, ...,\n",
+       "                         -8.0223344e-03,  8.9866975e-03, -1.7193217e-02],\n",
+       "                        [-6.1425157e-03, -2.3025960e-02, -2.0697471e-02, ...,\n",
+       "                         -1.3261255e-03, -4.4959106e-02,  1.4391148e-02],\n",
+       "                        ...,\n",
+       "                        [-3.9630566e-02,  3.4915447e-02, -2.5021229e-02, ...,\n",
+       "                          1.9735634e-02,  2.4283731e-02,  8.8040769e-02],\n",
+       "                        [ 7.1960546e-02, -3.2245752e-03, -3.1058513e-02, ...,\n",
+       "                          9.1858171e-03,  2.0113736e-02,  3.4582719e-02],\n",
+       "                        [ 3.5613827e-02,  5.2555401e-02,  2.0199718e-02, ...,\n",
+       "                          2.9557332e-02, -2.4335729e-03, -4.0849347e-02]],\n",
+       "                \n",
+       "                       [[ 2.5519842e-02,  3.4481441e-03,  7.5593151e-02, ...,\n",
+       "                         -1.0861231e-02,  1.3288087e-02, -2.1570064e-03],\n",
+       "                        [ 2.5518127e-02,  1.7416688e-02,  3.1182369e-02, ...,\n",
+       "                         -2.4906599e-03,  1.5789142e-02,  8.4962416e-03],\n",
+       "                        [ 1.0470330e-02, -9.0953298e-03,  2.6568150e-02, ...,\n",
+       "                         -7.2716870e-03,  3.2788489e-02,  1.6375307e-02],\n",
+       "                        ...,\n",
+       "                        [ 5.4019187e-03, -1.6473958e-02, -2.0612899e-02, ...,\n",
+       "                         -9.2589520e-03,  1.1356876e-02,  2.7651006e-02],\n",
+       "                        [ 1.5268090e-02,  8.3070369e-03,  8.7036788e-03, ...,\n",
+       "                          7.7237003e-03,  7.3369341e-03,  2.1213299e-02],\n",
+       "                        [-4.1702986e-02, -1.6719857e-02, -4.1055001e-02, ...,\n",
+       "                          2.3881821e-03, -1.4375679e-02, -5.3924224e-03]],\n",
+       "                \n",
+       "                       [[-3.8459700e-02,  2.7399434e-02, -2.4477823e-02, ...,\n",
+       "                         -2.8467288e-02,  4.2125326e-02, -2.4380080e-02],\n",
+       "                        [-8.2248095e-03,  9.4872410e-04,  3.1300731e-02, ...,\n",
+       "                          1.2363208e-02,  1.0819474e-02, -1.3270676e-03],\n",
+       "                        [-1.3462825e-02,  1.1999467e-02, -5.2867807e-03, ...,\n",
+       "                          5.4947892e-03,  8.4173940e-03, -1.5731178e-02],\n",
+       "                        ...,\n",
+       "                        [ 6.6192739e-02, -2.1830844e-03, -2.2746423e-02, ...,\n",
+       "                          9.5197987e-03, -3.5458893e-02,  4.4134855e-02],\n",
+       "                        [ 2.5184005e-02,  5.4138672e-02,  1.3472022e-02, ...,\n",
+       "                         -4.9555153e-02, -3.8271304e-02, -1.1530346e-03],\n",
+       "                        [-1.5618957e-02, -2.3071036e-02,  6.0527720e-02, ...,\n",
+       "                          3.5982949e-03,  7.5665531e-03,  1.2278390e-03]]], dtype=float32)>\n",
+       "                (o): <tf.Variable 'transformer/layer_._0/rel_attn/o:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "                array([[[ 3.4558035e-02, -8.1972502e-02, -5.6760699e-02, ...,\n",
+       "                          1.3388766e-02, -3.4494880e-03, -3.5049133e-02],\n",
+       "                        [ 1.4903742e-02,  5.1185200e-03,  2.7732885e-02, ...,\n",
+       "                          1.5752869e-02, -1.6719513e-04, -3.2367846e-03],\n",
+       "                        [-3.1436101e-02, -3.6930665e-02, -8.4744478e-03, ...,\n",
+       "                          1.1747203e-02, -2.9896988e-02, -2.3278227e-02],\n",
+       "                        ...,\n",
+       "                        [-4.4766188e-02, -2.9565591e-02,  2.2492344e-02, ...,\n",
+       "                          2.3775781e-03, -2.3477389e-03, -6.3977003e-02],\n",
+       "                        [-7.9599731e-03,  2.3603067e-02,  4.2270361e-03, ...,\n",
+       "                         -7.9671228e-03, -8.4035415e-03,  3.3881772e-02],\n",
+       "                        [ 2.3896206e-02,  5.2790940e-02, -1.9825008e-02, ...,\n",
+       "                          3.4890927e-02, -1.6427118e-02, -1.3012372e-02]],\n",
+       "                \n",
+       "                       [[ 5.6012128e-02,  3.9354857e-02, -3.7056282e-02, ...,\n",
+       "                         -9.5437188e-04, -1.5669381e-02,  3.6575941e-03],\n",
+       "                        [ 1.0521270e-02,  2.4832424e-02,  1.0564318e-02, ...,\n",
+       "                          4.5253210e-02, -3.8564852e-03, -5.6845369e-03],\n",
+       "                        [ 1.9469766e-02, -2.4921447e-03,  1.7152067e-02, ...,\n",
+       "                         -2.1238407e-02, -3.6743453e-03, -1.8075069e-02],\n",
+       "                        ...,\n",
+       "                        [-9.2346454e-04,  3.8158480e-02,  1.6374113e-02, ...,\n",
+       "                          1.5201136e-02,  1.3134910e-02,  6.9975376e-02],\n",
+       "                        [-2.4690642e-03,  7.7905254e-03, -2.1554135e-02, ...,\n",
+       "                         -3.9290216e-02, -4.0334272e-03, -1.0793213e-03],\n",
+       "                        [-1.6754212e-02,  4.7255494e-02, -3.2703991e-03, ...,\n",
+       "                         -3.3369564e-02, -6.0496605e-03,  2.2343850e-02]],\n",
+       "                \n",
+       "                       [[ 3.5791956e-02,  3.4770794e-02,  3.7401337e-02, ...,\n",
+       "                         -4.1593242e-02, -6.7334563e-02,  7.5647626e-03],\n",
+       "                        [-5.5595064e-03, -8.0210743e-03,  3.9957631e-02, ...,\n",
+       "                          1.7897096e-02,  2.1864127e-02,  4.6957351e-02],\n",
+       "                        [-3.2328866e-02,  1.4444360e-02, -6.8443440e-02, ...,\n",
+       "                          8.4532611e-03, -8.8195698e-03,  4.0060803e-03],\n",
+       "                        ...,\n",
+       "                        [-4.3917345e-03,  2.9294435e-02, -3.1086415e-02, ...,\n",
+       "                          3.7843004e-02,  2.0224897e-02, -9.4552422e-03],\n",
+       "                        [ 2.0256270e-02,  1.3612260e-02, -1.5514650e-02, ...,\n",
+       "                          1.6113631e-02, -7.7781297e-02,  4.5416508e-02],\n",
+       "                        [-1.7456708e-02, -3.6125474e-02, -4.8056237e-02, ...,\n",
+       "                          5.6817383e-03,  3.8123481e-02,  5.2873984e-02]],\n",
+       "                \n",
+       "                       ...,\n",
+       "                \n",
+       "                       [[-6.6254879e-03, -7.6921834e-03,  1.3759888e-02, ...,\n",
+       "                         -9.2632528e-03,  1.1549971e-02, -3.9358933e-02],\n",
+       "                        [ 1.4470451e-02, -4.2162634e-02,  1.2218486e-02, ...,\n",
+       "                          3.8135707e-02, -3.5125174e-02, -5.4729473e-02],\n",
+       "                        [ 8.0266371e-03,  8.7115606e-03,  5.6484030e-03, ...,\n",
+       "                          5.8089835e-03, -3.3503424e-02, -1.6844057e-02],\n",
+       "                        ...,\n",
+       "                        [-1.0784569e-02,  4.7266845e-02,  5.7555144e-03, ...,\n",
+       "                         -3.6044452e-02,  3.6605848e-03, -1.0359948e-02],\n",
+       "                        [ 1.3826589e-02, -2.8647454e-03,  2.5868905e-03, ...,\n",
+       "                          1.7714184e-02, -3.6266308e-02, -7.1984404e-03],\n",
+       "                        [-2.3084020e-02,  2.2052677e-02, -2.8226499e-02, ...,\n",
+       "                          5.0086722e-02,  1.3204823e-02,  2.3870086e-03]],\n",
+       "                \n",
+       "                       [[-2.8730264e-02, -5.2821822e-03, -9.1553042e-03, ...,\n",
+       "                          2.0447128e-02, -4.7689546e-02,  7.5007915e-03],\n",
+       "                        [-2.3960054e-02, -1.7942205e-02, -1.8274842e-02, ...,\n",
+       "                         -8.0897193e-03, -2.3875024e-02, -1.4553037e-02],\n",
+       "                        [ 1.7344387e-02, -2.0958342e-02,  1.4681545e-02, ...,\n",
+       "                         -2.2302102e-02,  2.8698748e-02, -9.1849379e-03],\n",
+       "                        ...,\n",
+       "                        [-1.8616887e-02,  4.7773879e-02,  2.2023235e-02, ...,\n",
+       "                         -3.4950111e-02, -3.9754819e-02,  3.8231418e-03],\n",
+       "                        [-2.6944082e-03, -2.2312153e-02,  6.6401674e-03, ...,\n",
+       "                          1.6840655e-02,  8.5035199e-04, -5.4619432e-04],\n",
+       "                        [ 7.5075715e-03,  2.7986795e-02, -2.1366706e-02, ...,\n",
+       "                          2.1776481e-02, -3.2732459e-03,  1.7775759e-02]],\n",
+       "                \n",
+       "                       [[ 1.7125104e-02,  1.5672354e-02, -1.9874105e-02, ...,\n",
+       "                         -8.8345492e-03, -6.3765082e-03,  3.8814072e-02],\n",
+       "                        [-1.5929114e-02,  4.0955096e-02,  1.8637704e-02, ...,\n",
+       "                         -4.3095972e-02,  5.2418392e-03, -8.3040539e-03],\n",
+       "                        [-2.5189148e-02,  1.6959475e-02,  2.0080386e-03, ...,\n",
+       "                          1.7491961e-06, -9.4349124e-03, -8.7165339e-03],\n",
+       "                        ...,\n",
+       "                        [-1.5020861e-02,  9.1123721e-03, -1.2940341e-02, ...,\n",
+       "                          2.1540092e-02, -4.8262607e-02,  9.3815767e-04],\n",
+       "                        [-2.0072028e-02, -3.4046255e-03, -5.2106597e-02, ...,\n",
+       "                         -1.6067177e-02,  4.7017686e-02,  5.2954555e-03],\n",
+       "                        [ 2.7247950e-02, -4.7271936e-03,  3.7552916e-02, ...,\n",
+       "                         -2.3428671e-02,  2.5338635e-02, -7.1937349e-03]]], dtype=float32)>\n",
+       "                (r): <tf.Variable 'transformer/layer_._0/rel_attn/r:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "                array([[[ 3.38747710e-01, -3.52252215e-01, -3.31913650e-01, ...,\n",
+       "                         -3.32406253e-01, -3.55435610e-01, -3.70355815e-01],\n",
+       "                        [-2.57155180e-01, -2.27717996e-01, -2.49137834e-01, ...,\n",
+       "                          2.52328873e-01, -2.27478221e-01,  2.74260193e-01],\n",
+       "                        [-8.42767283e-02,  1.40244111e-01, -1.90620884e-01, ...,\n",
+       "                          1.35595366e-01,  1.51921853e-01, -1.44851297e-01],\n",
+       "                        ...,\n",
+       "                        [-3.61111403e-01,  3.26171756e-01, -3.69894445e-01, ...,\n",
+       "                         -3.20066005e-01, -3.35039854e-01, -3.68529588e-01],\n",
+       "                        [-3.09335232e-01,  3.14753771e-01,  3.20735216e-01, ...,\n",
+       "                         -3.20914894e-01,  2.96445906e-01,  3.30758154e-01],\n",
+       "                        [ 2.12763369e-01,  2.13694334e-01,  2.23139688e-01, ...,\n",
+       "                         -2.15393752e-01, -2.09336951e-01,  2.45465353e-01]],\n",
+       "                \n",
+       "                       [[ 3.20928752e-01, -2.94858247e-01, -3.14106166e-01, ...,\n",
+       "                         -3.04256856e-01, -3.10841501e-01, -3.13560814e-01],\n",
+       "                        [-1.59511223e-01, -1.70894131e-01, -1.87740177e-01, ...,\n",
+       "                          1.77135527e-01, -1.74924582e-01,  1.93289027e-01],\n",
+       "                        [-1.41561776e-02,  7.51935318e-02, -1.13328710e-01, ...,\n",
+       "                          7.05530196e-02,  7.44837448e-02, -9.26639065e-02],\n",
+       "                        ...,\n",
+       "                        [-3.11126292e-01,  3.01795095e-01, -2.95113325e-01, ...,\n",
+       "                         -2.81502992e-01, -2.79552013e-01, -2.94877738e-01],\n",
+       "                        [-2.69808233e-01,  2.46761337e-01,  2.37797692e-01, ...,\n",
+       "                         -2.70426184e-01,  2.29666948e-01,  2.68684894e-01],\n",
+       "                        [ 1.52459487e-01,  1.56723812e-01,  1.87588021e-01, ...,\n",
+       "                         -1.80774227e-01, -1.40872061e-01,  1.92230970e-01]],\n",
+       "                \n",
+       "                       [[ 2.41833925e-01, -2.19398052e-01, -2.29633719e-01, ...,\n",
+       "                         -2.45204329e-01, -2.58349568e-01, -2.36624196e-01],\n",
+       "                        [-1.61572859e-01, -1.48212776e-01, -1.40561178e-01, ...,\n",
+       "                          1.41516134e-01, -1.32165566e-01,  1.68426186e-01],\n",
+       "                        [ 8.09539296e-03,  3.59569304e-02, -1.04876310e-01, ...,\n",
+       "                          1.58704743e-02,  3.60485800e-02, -2.96752173e-02],\n",
+       "                        ...,\n",
+       "                        [-2.84408092e-01,  2.66984671e-01, -2.70496905e-01, ...,\n",
+       "                         -2.57439345e-01, -2.39332542e-01, -2.48226896e-01],\n",
+       "                        [-2.43775159e-01,  2.12252900e-01,  2.33381778e-01, ...,\n",
+       "                         -2.36481652e-01,  2.05704838e-01,  2.55553931e-01],\n",
+       "                        [ 1.28472507e-01,  1.25496238e-01,  1.41340226e-01, ...,\n",
+       "                         -1.42667651e-01, -1.06452040e-01,  1.74517885e-01]],\n",
+       "                \n",
+       "                       ...,\n",
+       "                \n",
+       "                       [[ 1.18206572e-02, -1.62823759e-02, -1.13886865e-02, ...,\n",
+       "                         -2.72346847e-02, -1.76205616e-02, -2.58876495e-02],\n",
+       "                        [-2.48313230e-02, -2.81952247e-02, -2.03840993e-02, ...,\n",
+       "                          1.74464211e-02, -2.47928239e-02,  7.45158223e-03],\n",
+       "                        [-9.72194225e-03,  1.15375388e-02, -2.56897379e-02, ...,\n",
+       "                          3.06775165e-03,  1.03304058e-03,  2.59421836e-03],\n",
+       "                        ...,\n",
+       "                        [-1.75657198e-02,  2.45507937e-02, -2.12120879e-02, ...,\n",
+       "                         -2.06703022e-02, -1.25367660e-02, -1.66469775e-02],\n",
+       "                        [ 1.25846509e-02, -3.71760194e-04,  4.49259765e-03, ...,\n",
+       "                         -6.64241752e-03, -9.64385923e-03,  1.40363369e-02],\n",
+       "                        [ 1.40556889e-02,  1.82496123e-02, -2.07160265e-04, ...,\n",
+       "                          2.71461118e-04, -8.42160638e-03,  1.78159462e-04]],\n",
+       "                \n",
+       "                       [[-2.22503580e-02,  3.15407328e-02,  2.72795390e-02, ...,\n",
+       "                          2.50934549e-02,  3.40305455e-02,  3.39202397e-02],\n",
+       "                        [ 1.35067226e-02,  2.46651508e-02,  1.00027593e-02, ...,\n",
+       "                         -2.89492551e-02,  1.59373134e-02, -1.51004000e-02],\n",
+       "                        [ 2.25287229e-02, -2.75186412e-02,  1.70388352e-02, ...,\n",
+       "                         -1.08766872e-02, -1.86810736e-03,  1.76009033e-02],\n",
+       "                        ...,\n",
+       "                        [ 1.43293003e-02, -1.70654003e-02,  1.25767132e-02, ...,\n",
+       "                          8.09190446e-04,  1.77804064e-02,  3.09025124e-02],\n",
+       "                        [ 2.47963774e-03, -2.90571898e-03, -1.11264074e-02, ...,\n",
+       "                          5.73507929e-03, -9.31484811e-03,  3.93942930e-03],\n",
+       "                        [-8.68460070e-03,  2.89098313e-03, -2.11955067e-02, ...,\n",
+       "                          1.13159856e-02,  2.39106696e-02,  7.65375979e-03]],\n",
+       "                \n",
+       "                       [[ 5.94059192e-02, -3.16232182e-02, -4.25012745e-02, ...,\n",
+       "                         -4.64180671e-02, -4.29909676e-02, -5.43733463e-02],\n",
+       "                        [ 1.00171287e-02,  2.10887119e-02,  3.75756249e-02, ...,\n",
+       "                         -3.65561582e-02,  1.15714017e-02, -2.47725472e-02],\n",
+       "                        [-2.42286529e-02,  6.19218312e-03,  2.24700011e-02, ...,\n",
+       "                         -6.83102896e-03, -3.37700290e-03,  4.71456256e-03],\n",
+       "                        ...,\n",
+       "                        [ 1.35079189e-03,  1.35904429e-02, -1.20370295e-02, ...,\n",
+       "                         -6.28219778e-03, -2.10926589e-02, -1.22290216e-02],\n",
+       "                        [-3.48052718e-02,  4.21429165e-02, -4.43692598e-03, ...,\n",
+       "                         -3.98377255e-02,  2.64684688e-02,  3.64753604e-02],\n",
+       "                        [-1.27071552e-02, -1.95082203e-02, -4.74442961e-03, ...,\n",
+       "                         -5.14267990e-03,  1.45630771e-02, -1.93668939e-02]]],\n",
+       "                      dtype=float32)>\n",
+       "                (r_r_bias): <tf.Variable 'transformer/layer_._0/rel_attn/r_r_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "                array([[-0.37346047,  0.37250054,  0.3907651 ,  0.38277408,  0.35741195,\n",
+       "                         0.38824454, -0.36372992,  0.37197435,  0.37989146,  0.37147713,\n",
+       "                         0.37070706,  0.35559788],\n",
+       "                       [ 0.06975611,  0.07689185,  0.07228172, -0.0722764 ,  0.08365536,\n",
+       "                         0.06633326,  0.07988963, -0.06860004, -0.0622002 , -0.06374823,\n",
+       "                         0.0776644 , -0.07216003],\n",
+       "                       [ 0.22928728, -0.17429328,  0.09725206, -0.10263564,  0.06898433,\n",
+       "                         0.13690604,  0.12810868,  0.06246556, -0.14255992, -0.169385  ,\n",
+       "                        -0.16261199,  0.16058037],\n",
+       "                       [-0.19601476, -0.19472797,  0.20428008,  0.20267177,  0.18398753,\n",
+       "                        -0.20113394, -0.20566987, -0.21166983,  0.2035028 ,  0.20144981,\n",
+       "                        -0.20082442, -0.21696469],\n",
+       "                       [-0.27361003,  0.26644444, -0.25823227,  0.27925947,  0.27160206,\n",
+       "                        -0.26067862,  0.270715  ,  0.2698397 ,  0.25726572,  0.25751913,\n",
+       "                         0.24445428,  0.27668142],\n",
+       "                       [-0.30897072,  0.29939672,  0.29147333, -0.29759452,  0.31223142,\n",
+       "                        -0.270364  , -0.3067601 , -0.30111563,  0.31529158,  0.31188235,\n",
+       "                        -0.29824102, -0.31075856],\n",
+       "                       [-0.39532706,  0.38874832, -0.39142627, -0.3886234 , -0.38499188,\n",
+       "                        -0.39429832,  0.3917147 , -0.37333068, -0.38008067,  0.38615617,\n",
+       "                        -0.38081092, -0.39247522],\n",
+       "                       [ 0.2290351 , -0.23079675,  0.23544736,  0.21889143,  0.21990548,\n",
+       "                         0.2233682 ,  0.20575589,  0.23166424,  0.21836095, -0.22710325,\n",
+       "                        -0.23054157, -0.22402786],\n",
+       "                       [ 0.31462234, -0.33824605,  0.34888077,  0.35271886, -0.35531324,\n",
+       "                         0.34544548,  0.3376679 ,  0.3411377 , -0.335851  , -0.3580673 ,\n",
+       "                         0.33728704, -0.35013184],\n",
+       "                       [ 0.28967628, -0.28802818,  0.29017174,  0.29956898,  0.29380292,\n",
+       "                        -0.28895316, -0.28544793, -0.292428  , -0.2882111 , -0.28964576,\n",
+       "                         0.29340708,  0.2927634 ],\n",
+       "                       [-0.3411081 ,  0.35220957,  0.33591127,  0.3540816 ,  0.3503263 ,\n",
+       "                         0.33048216, -0.34637055,  0.32407367, -0.32438353,  0.3529602 ,\n",
+       "                        -0.35776407, -0.33932883],\n",
+       "                       [-0.37032467, -0.36812896, -0.39068243, -0.37287602, -0.3721401 ,\n",
+       "                        -0.38354024, -0.3734055 ,  0.4030942 ,  0.37940052,  0.34137526,\n",
+       "                         0.3707558 , -0.3911879 ],\n",
+       "                       [-0.13885868, -0.07073349, -0.1152356 ,  0.11311065,  0.05461643,\n",
+       "                        -0.10694173, -0.11797076, -0.11336335, -0.10334926,  0.07756246,\n",
+       "                         0.12306441,  0.10861646],\n",
+       "                       [ 0.37422347, -0.37067974,  0.382464  ,  0.37082633, -0.37619328,\n",
+       "                         0.3700374 , -0.3775079 ,  0.369756  , -0.37618253,  0.3672613 ,\n",
+       "                         0.39667937,  0.38020003],\n",
+       "                       [ 0.30904633, -0.29189512, -0.31334987, -0.29167944, -0.31405964,\n",
+       "                        -0.28898612,  0.2923434 ,  0.30766192, -0.28573954,  0.2949249 ,\n",
+       "                        -0.29706052, -0.31455588],\n",
+       "                       [-0.1166977 , -0.09267767, -0.05344103,  0.20561723,  0.10361944,\n",
+       "                        -0.09597252, -0.11368804,  0.07374494,  0.0895981 ,  0.07990894,\n",
+       "                         0.10973554, -0.05313613]], dtype=float32)>\n",
+       "                (r_s_bias): <tf.Variable 'transformer/layer_._0/rel_attn/r_s_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "                array([[0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.]], dtype=float32)>\n",
+       "                (r_w_bias): <tf.Variable 'transformer/layer_._0/rel_attn/r_w_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "                array([[ 0.02704959,  0.02960145,  0.00974695,  0.04531549, -0.0031658 ,\n",
+       "                         0.00470249,  0.01819921,  0.01747902, -0.01848036,  0.01552903,\n",
+       "                        -0.01393487, -0.01188555],\n",
+       "                       [ 0.01097695,  0.05780909,  0.03655621, -0.02134515,  0.02434413,\n",
+       "                         0.01866677,  0.01949622, -0.01921584, -0.02902889, -0.03096105,\n",
+       "                        -0.00388369, -0.01727411],\n",
+       "                       [-0.13681485,  0.12220031,  0.07949183,  0.09230855,  0.1203526 ,\n",
+       "                         0.13126956,  0.00737103,  0.04044032,  0.13264242,  0.16051207,\n",
+       "                         0.12056144, -0.15448172],\n",
+       "                       [-0.0837023 , -0.07897114,  0.10445868,  0.09328368,  0.09781563,\n",
+       "                        -0.07505805, -0.07814854, -0.10116591,  0.11434007,  0.1039658 ,\n",
+       "                        -0.11767636, -0.10332035],\n",
+       "                       [-0.10378645,  0.07673589, -0.09991188,  0.09477323,  0.06950181,\n",
+       "                        -0.09498238,  0.11595728,  0.0818167 ,  0.09139769,  0.0908348 ,\n",
+       "                         0.09375099,  0.09006778],\n",
+       "                       [-0.07200488,  0.11039345,  0.08926661, -0.10429743,  0.10531338,\n",
+       "                        -0.13036886, -0.09732608, -0.09588756,  0.10691873,  0.069135  ,\n",
+       "                        -0.07627007, -0.09407212],\n",
+       "                       [-0.06730818,  0.0776398 , -0.07527994, -0.08677673, -0.07946926,\n",
+       "                        -0.09474014,  0.08316637, -0.10570373, -0.10657622,  0.06857269,\n",
+       "                        -0.09510182, -0.07508499],\n",
+       "                       [ 0.1272688 , -0.11871098,  0.11859486,  0.12073346,  0.15111545,\n",
+       "                         0.12950963,  0.14462966,  0.13155784,  0.14078899, -0.11819407,\n",
+       "                        -0.11242524, -0.12828752],\n",
+       "                       [ 0.10244546, -0.08281285,  0.12599547,  0.12352646, -0.08232223,\n",
+       "                         0.06362368,  0.11628054,  0.08121345, -0.09381401, -0.1017275 ,\n",
+       "                         0.1122688 , -0.0936246 ],\n",
+       "                       [ 0.06956902, -0.07016854,  0.07207846,  0.08185235,  0.07348476,\n",
+       "                        -0.07044141, -0.10483667, -0.06724312, -0.07413901, -0.08150072,\n",
+       "                         0.08842966,  0.07842822],\n",
+       "                       [-0.04902898,  0.08947049,  0.08037989,  0.06807387,  0.06831039,\n",
+       "                         0.05044439, -0.10449897,  0.05752584, -0.07764029,  0.09782408,\n",
+       "                        -0.11914786, -0.05327021],\n",
+       "                       [-0.12178728, -0.11973495, -0.08931118, -0.11802942, -0.12639539,\n",
+       "                        -0.11765701, -0.12301757,  0.09002702,  0.1099894 ,  0.10601277,\n",
+       "                         0.12055498, -0.11824764],\n",
+       "                       [-0.13013272, -0.11347592, -0.09590119, -0.04600147,  0.12135155,\n",
+       "                         0.15605357,  0.14212345,  0.12413304, -0.11489878,  0.10646964,\n",
+       "                         0.11570179,  0.13300925],\n",
+       "                       [ 0.07953635, -0.05358617,  0.06076136,  0.03857687, -0.08740384,\n",
+       "                         0.09580573, -0.11589228,  0.0530813 , -0.1262951 ,  0.12957394,\n",
+       "                         0.14165434,  0.07234689],\n",
+       "                       [ 0.00606865, -0.02865283, -0.11514653, -0.03855786, -0.03915163,\n",
+       "                        -0.04437567,  0.05897851,  0.07263748, -0.07599041,  0.02014523,\n",
+       "                        -0.0326612 , -0.05191225],\n",
+       "                       [-0.02615956,  0.00082458,  0.02219692, -0.05171375,  0.05447492,\n",
+       "                         0.06622541, -0.02247809,  0.05879986,  0.01587608,  0.09542776,\n",
+       "                         0.03455094,  0.00630618]], dtype=float32)>\n",
+       "                (seg_embed): <tf.Variable 'transformer/layer_._0/rel_attn/seg_embed:0' shape=(2, 16, 12) dtype=float32, numpy=\n",
+       "                array([[[ 6.92830980e-03, -1.91756096e-02,  2.75568711e-03,\n",
+       "                         -3.27806338e-03,  1.43940898e-03,  8.38105334e-04,\n",
+       "                         -3.17075802e-03,  4.66949260e-03,  1.29533000e-02,\n",
+       "                          6.37105154e-03, -1.42557546e-02, -1.56039307e-02],\n",
+       "                        [-5.24008507e-03,  5.83554897e-03,  5.28278288e-05,\n",
+       "                          4.41452535e-03, -5.96833415e-03,  1.97377801e-02,\n",
+       "                          6.63386192e-03, -2.70113046e-03, -1.09323701e-02,\n",
+       "                          9.40765906e-03,  8.52212869e-03,  1.27732707e-02],\n",
+       "                        [-5.47951926e-03, -6.30398374e-03, -1.88931415e-03,\n",
+       "                         -3.82627477e-03, -1.03170695e-02, -1.62921418e-02,\n",
+       "                          4.42750810e-04,  1.83049624e-03, -4.93631791e-03,\n",
+       "                          7.21302396e-03,  7.58891134e-03, -1.35076218e-04],\n",
+       "                        [-5.04115736e-03,  1.51219219e-03, -6.07239781e-04,\n",
+       "                          2.68661021e-03, -5.32567082e-03, -3.63681372e-03,\n",
+       "                         -1.47937634e-03,  1.41145978e-02,  2.44664983e-03,\n",
+       "                         -5.30580198e-03, -3.58004036e-04,  2.21235352e-03],\n",
+       "                        [ 6.63177948e-03,  7.20981602e-03, -3.34927929e-03,\n",
+       "                          1.57867242e-02, -1.06790895e-02,  4.76629054e-03,\n",
+       "                          7.01094558e-03,  2.55558966e-03,  7.01530662e-04,\n",
+       "                          1.96129885e-02, -3.47580039e-03, -4.14459547e-03],\n",
+       "                        [ 6.63608173e-03,  8.13847221e-03,  1.26328748e-02,\n",
+       "                          2.93742679e-03, -1.11131268e-02, -7.77325965e-03,\n",
+       "                         -4.69116308e-03,  5.06164553e-03,  3.31703736e-03,\n",
+       "                         -1.49551462e-02,  9.83483810e-03, -1.38381887e-02],\n",
+       "                        [-3.13207647e-03, -1.20346656e-03, -7.14240829e-04,\n",
+       "                          3.38257337e-03, -1.21155549e-02,  1.77355520e-02,\n",
+       "                         -3.78817786e-03,  4.60852869e-03,  1.38352753e-03,\n",
+       "                         -1.96225918e-03, -1.54525228e-03,  7.27207214e-03],\n",
+       "                        [-3.52438586e-03, -6.73636142e-03,  5.56267146e-03,\n",
+       "                          2.76904181e-03,  6.09423034e-03,  1.14140250e-02,\n",
+       "                          4.51555708e-03, -4.84374259e-03, -1.83317550e-02,\n",
+       "                          4.07868624e-03, -3.52122728e-03, -9.72320139e-03],\n",
+       "                        [-2.92871613e-03, -1.36275403e-03, -1.12001523e-02,\n",
+       "                          4.15648054e-03,  7.76014291e-04, -1.56104667e-04,\n",
+       "                          1.66957453e-02, -1.34978080e-02,  2.59425724e-03,\n",
+       "                          1.50437718e-02, -8.85847863e-03, -2.27058597e-04],\n",
+       "                        [-8.55377130e-03, -9.33228992e-04,  1.05962288e-02,\n",
+       "                          3.73685732e-03, -1.46479104e-02, -2.58295774e-03,\n",
+       "                         -3.21662426e-03,  8.22018459e-03, -6.62432238e-03,\n",
+       "                          5.34095289e-03, -1.60596147e-02,  1.89380813e-02],\n",
+       "                        [-3.03876121e-03, -9.45069920e-03, -1.05521297e-02,\n",
+       "                          7.64022162e-03,  1.24902911e-02,  1.32637294e-02,\n",
+       "                          1.30019896e-02,  4.11059591e-04,  1.14952738e-03,\n",
+       "                         -9.66892054e-04,  3.42015829e-03,  1.51099060e-02],\n",
+       "                        [ 9.67782363e-03,  1.13166841e-02,  1.24215791e-02,\n",
+       "                         -8.93799961e-03, -7.70286610e-03, -2.62288231e-04,\n",
+       "                         -1.25799067e-02, -2.34622974e-03, -1.37031516e-02,\n",
+       "                          7.25830998e-03,  3.48036946e-03,  8.82094260e-03],\n",
+       "                        [ 1.93330422e-02,  1.02664595e-02, -1.38892382e-02,\n",
+       "                         -4.28191572e-03, -1.71063491e-03,  2.99980305e-03,\n",
+       "                         -5.98835619e-03,  1.08044026e-02, -7.76272779e-03,\n",
+       "                         -8.02671071e-04,  6.56242890e-04,  5.36549371e-03],\n",
+       "                        [-1.00181112e-02, -1.59210637e-02, -8.38838704e-03,\n",
+       "                          4.86764265e-03, -1.79222059e-02,  3.47048254e-03,\n",
+       "                         -1.83304548e-02, -4.92845010e-03,  3.65043571e-03,\n",
+       "                          2.54237023e-03, -1.38753336e-02, -1.58153474e-02],\n",
+       "                        [-8.56178463e-04,  9.56560671e-03,  1.43071841e-02,\n",
+       "                          1.44142760e-02, -2.97402544e-03, -1.18832442e-03,\n",
+       "                          1.54865775e-02,  1.16390940e-02,  1.89097952e-02,\n",
+       "                         -1.21177221e-03, -1.57084243e-04,  1.07376613e-02],\n",
+       "                        [-1.82367454e-03,  2.21159682e-03, -3.59512377e-03,\n",
+       "                         -8.40761815e-04,  1.32178674e-02,  1.82569642e-02,\n",
+       "                         -6.03301101e-04, -5.30507276e-03,  1.09237980e-03,\n",
+       "                          1.43965418e-02, -8.32139887e-03,  4.34310501e-03]],\n",
+       "                \n",
+       "                       [[ 6.01352192e-03,  1.62515126e-03, -8.11410509e-03,\n",
+       "                         -6.86854636e-03, -6.21954072e-03, -1.00534027e-02,\n",
+       "                         -9.41478554e-03,  1.14045916e-02, -8.45357031e-03,\n",
+       "                         -2.07757368e-03, -1.37391184e-02, -4.38201270e-04],\n",
+       "                        [ 1.43431686e-02,  9.54034738e-03, -5.74651361e-03,\n",
+       "                          1.66568439e-04, -9.06508230e-03,  1.37667237e-02,\n",
+       "                          5.70776733e-03,  7.25450320e-03,  2.16021363e-05,\n",
+       "                         -5.47146471e-03, -6.25970587e-03, -3.44276486e-05],\n",
+       "                        [ 1.48183517e-02, -6.20869081e-03,  8.95625539e-03,\n",
+       "                         -9.27595049e-03, -1.83574425e-03,  2.49610422e-03,\n",
+       "                         -1.22964820e-02, -1.36222802e-02,  9.96832177e-03,\n",
+       "                         -1.19066276e-02, -7.85201322e-03, -7.36650918e-03],\n",
+       "                        [ 1.08605931e-02,  8.69748648e-03,  3.17076640e-03,\n",
+       "                         -8.42709839e-03, -1.57119669e-02, -1.40998634e-02,\n",
+       "                         -1.92577229e-03, -1.10639585e-02,  2.97422521e-03,\n",
+       "                         -1.15742059e-02,  1.63778535e-03,  9.25154146e-03],\n",
+       "                        [-4.83186170e-03, -1.48528756e-03, -6.04805397e-03,\n",
+       "                         -3.92264035e-03, -1.23623861e-02, -1.09437210e-02,\n",
+       "                         -1.96897378e-03, -6.39349746e-04,  4.56422335e-03,\n",
+       "                          1.13997767e-02,  4.75200778e-03,  7.35366624e-03],\n",
+       "                        [ 1.12166035e-03,  5.45477308e-03, -4.32490138e-03,\n",
+       "                          7.68110855e-03,  5.26575372e-04, -1.25714159e-02,\n",
+       "                         -3.77588673e-03, -1.14904623e-02,  5.39455842e-03,\n",
+       "                         -4.17162431e-03, -9.63759050e-03,  6.98206900e-03],\n",
+       "                        [ 1.96407139e-02,  1.29522821e-02, -4.13262704e-03,\n",
+       "                         -1.44496374e-02, -1.74691656e-03,  4.20865184e-03,\n",
+       "                         -1.11074317e-02,  2.64025060e-03,  1.47657096e-02,\n",
+       "                          1.23877609e-02, -2.37396988e-03, -2.93945603e-04],\n",
+       "                        [ 9.71211493e-03,  7.94302672e-03, -1.58977136e-02,\n",
+       "                         -2.76799593e-03, -5.05202217e-03, -9.76024102e-03,\n",
+       "                          1.49224671e-02, -2.76487437e-03, -7.95385893e-03,\n",
+       "                          2.28416151e-03,  8.62033758e-03, -8.03585071e-03],\n",
+       "                        [ 3.58456396e-03, -7.30898371e-03,  9.81163792e-03,\n",
+       "                          4.00693668e-03, -4.60821064e-03,  1.25033129e-02,\n",
+       "                         -7.10477680e-03, -1.87209854e-03, -1.86083149e-02,\n",
+       "                          1.13955196e-02,  3.02036270e-03,  1.86788588e-04],\n",
+       "                        [-7.39630545e-03, -3.24555533e-03, -6.80431770e-03,\n",
+       "                         -8.48817732e-03,  5.44536347e-03, -6.96611451e-03,\n",
+       "                          9.67375468e-03, -1.37550682e-02,  1.24195861e-02,\n",
+       "                         -5.80661930e-03, -8.72546516e-04, -7.87189323e-03],\n",
+       "                        [ 8.17328412e-03,  7.39035569e-03, -1.30875167e-02,\n",
+       "                          2.98461039e-03,  6.12607226e-03, -3.95844551e-03,\n",
+       "                         -4.27940721e-03, -5.09019941e-03,  9.36426129e-03,\n",
+       "                          2.17008332e-04,  9.72903217e-05,  1.09658763e-03],\n",
+       "                        [-2.05476675e-03, -6.83139719e-04, -1.89697009e-03,\n",
+       "                          1.14962943e-02,  7.20423460e-03,  1.39946323e-02,\n",
+       "                          1.07048582e-02, -6.42856723e-03, -5.79423131e-03,\n",
+       "                          1.23832189e-02, -7.18865078e-03,  1.38154672e-02],\n",
+       "                        [-1.16244173e-02,  2.05547106e-03,  9.67404339e-03,\n",
+       "                         -2.89262226e-03,  4.12624609e-03, -5.93587151e-03,\n",
+       "                         -2.06840690e-03, -3.01017077e-03, -2.76456797e-03,\n",
+       "                          1.60607956e-02,  6.62347884e-04,  8.47559713e-04],\n",
+       "                        [-1.70180527e-03,  1.20092779e-02,  1.39846858e-02,\n",
+       "                          1.87645629e-02,  3.60628217e-03, -1.03077693e-02,\n",
+       "                         -3.90187866e-04,  7.14913337e-03, -1.36780804e-02,\n",
+       "                          5.78043377e-03, -6.81782607e-03,  1.98236643e-03],\n",
+       "                        [-1.06942744e-05,  8.62054899e-03,  1.27580739e-03,\n",
+       "                          1.30051170e-02,  9.38100927e-03,  1.04769599e-02,\n",
+       "                         -1.51592251e-02,  4.45883907e-03, -2.48641265e-03,\n",
+       "                         -9.80575942e-03, -1.38305919e-03,  7.01086072e-04],\n",
+       "                        [-1.26606720e-02, -3.34550929e-03,  7.17817014e-03,\n",
+       "                         -5.29674813e-03, -5.15649887e-03,  1.82109885e-02,\n",
+       "                         -1.07203387e-02, -1.93532417e-03,  1.92708708e-02,\n",
+       "                         -2.18898524e-03, -1.15341763e-03,  5.27428696e-03]]],\n",
+       "                      dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (ff): TFXLNetFeedForward(\n",
+       "                (layer_norm): LayerNormalization(\n",
+       "                  (axis): List(\n",
+       "                    (0): 2\n",
+       "                  )\n",
+       "                  (gamma): <tf.Variable 'transformer/layer_._0/ff/layer_norm/gamma:0' shape=(192,) dtype=float32, numpy=\n",
+       "                  array([1.0379136 , 1.0441794 , 1.0282985 , 1.0300299 , 1.0497706 ,\n",
+       "                         1.0531958 , 1.0634363 , 1.0370939 , 0.97006977, 1.0404468 ,\n",
+       "                         1.0234414 , 1.0444169 , 1.016389  , 1.0636438 , 1.0183308 ,\n",
+       "                         1.0163523 , 1.0237935 , 1.0102572 , 1.017104  , 1.0147494 ,\n",
+       "                         0.99349844, 1.0893013 , 1.0604361 , 1.0118674 , 0.9946299 ,\n",
+       "                         1.0589231 , 0.96908444, 1.0519881 , 1.0418249 , 1.0343268 ,\n",
+       "                         1.0077153 , 1.0598058 , 1.0031377 , 1.0132179 , 1.0564682 ,\n",
+       "                         1.041158  , 1.0136855 , 1.0441773 , 1.0054435 , 1.0305686 ,\n",
+       "                         1.0372981 , 1.0551254 , 1.0419368 , 1.0237669 , 1.0648608 ,\n",
+       "                         0.9859887 , 1.0432713 , 0.992015  , 1.1081674 , 1.025258  ,\n",
+       "                         1.0640073 , 0.9919767 , 1.037432  , 1.045794  , 1.0330951 ,\n",
+       "                         1.0092527 , 1.0409127 , 1.0085353 , 1.0442319 , 0.99454325,\n",
+       "                         1.0313554 , 0.9998184 , 1.0338147 , 1.0133076 , 1.0005473 ,\n",
+       "                         1.0445073 , 0.9953769 , 1.0483619 , 1.0318505 , 1.0313379 ,\n",
+       "                         1.0211383 , 1.0175071 , 1.0427523 , 1.0183996 , 0.9728469 ,\n",
+       "                         1.0114137 , 1.0472678 , 1.0251293 , 0.9770746 , 0.9970426 ,\n",
+       "                         1.0212427 , 0.98568845, 1.0427203 , 1.0072767 , 1.0269111 ,\n",
+       "                         1.0186119 , 1.0205765 , 1.0080137 , 1.0402783 , 1.0055327 ,\n",
+       "                         1.0263197 , 1.011762  , 0.9943807 , 0.97362155, 1.0212238 ,\n",
+       "                         1.0551015 , 1.0413436 , 1.0225371 , 1.023914  , 1.0239075 ,\n",
+       "                         1.0248226 , 1.003032  , 1.0068135 , 1.0337843 , 1.0179108 ,\n",
+       "                         1.0402795 , 1.0472751 , 1.0388597 , 1.0047336 , 1.0077493 ,\n",
+       "                         1.0392822 , 1.0628049 , 1.0116792 , 1.0418272 , 1.0172741 ,\n",
+       "                         1.0869482 , 1.0238012 , 1.0404757 , 1.020196  , 1.0563034 ,\n",
+       "                         1.0301741 , 1.0372742 , 1.0494779 , 1.0387503 , 1.0062817 ,\n",
+       "                         1.036887  , 1.0277052 , 1.0019801 , 1.0326486 , 1.0132165 ,\n",
+       "                         1.0250734 , 1.0243207 , 1.0353926 , 1.0375448 , 1.0284371 ,\n",
+       "                         1.0279876 , 0.99319714, 1.0211086 , 1.0743738 , 1.0147293 ,\n",
+       "                         1.0403458 , 1.0320364 , 1.0163448 , 1.0086402 , 1.0668328 ,\n",
+       "                         0.9998712 , 1.0195384 , 1.0262363 , 1.0496252 , 1.0281852 ,\n",
+       "                         1.0143824 , 1.0131371 , 1.0147458 , 1.0153939 , 1.002428  ,\n",
+       "                         1.056508  , 1.0375637 , 1.0288135 , 1.0562717 , 1.0206257 ,\n",
+       "                         1.0170466 , 1.0470344 , 1.002945  , 1.0293034 , 1.0338373 ,\n",
+       "                         1.0267545 , 1.0173984 , 1.0321118 , 1.0058153 , 0.9890631 ,\n",
+       "                         1.0418366 , 1.0471084 , 1.000789  , 1.0489752 , 1.011835  ,\n",
+       "                         0.9849616 , 1.0682111 , 1.067782  , 1.0667943 , 1.0295328 ,\n",
+       "                         1.0648719 , 1.0072024 , 0.9829486 , 1.0619706 , 1.0037473 ,\n",
+       "                         1.082172  , 1.010111  , 1.0480627 , 1.0180742 , 0.9671146 ,\n",
+       "                         1.0334889 , 1.0734522 ], dtype=float32)>\n",
+       "                  (beta): <tf.Variable 'transformer/layer_._0/ff/layer_norm/beta:0' shape=(192,) dtype=float32, numpy=\n",
+       "                  array([-0.03437203,  0.05411717, -0.00093422,  0.07425429,  0.00736092,\n",
+       "                          0.11286709,  0.08217093,  0.10122769, -0.00846282,  0.07157344,\n",
+       "                         -0.05813284,  0.0454649 ,  0.02636049,  0.01231122, -0.01111093,\n",
+       "                          0.02166114, -0.00972567,  0.04515434, -0.02430212, -0.06187151,\n",
+       "                         -0.0381984 ,  0.12061298,  0.03548988,  0.04389787,  0.01137476,\n",
+       "                         -0.01380202, -0.01825755,  0.05156202, -0.07114236, -0.06216979,\n",
+       "                          0.05545609, -0.10842778, -0.02432374, -0.0060093 ,  0.03022136,\n",
+       "                         -0.00703949, -0.05032122,  0.03701846,  0.09063955,  0.0639187 ,\n",
+       "                         -0.06332532,  0.01021036, -0.01898221, -0.04602299,  0.0845482 ,\n",
+       "                          0.05272847,  0.04152165,  0.01572024,  0.0124438 ,  0.05633397,\n",
+       "                          0.04072688, -0.03248957,  0.01956263, -0.0594047 ,  0.10126687,\n",
+       "                          0.00997925, -0.03006562, -0.04982569, -0.01702003, -0.02220715,\n",
+       "                          0.0006759 , -0.00147267,  0.04309494, -0.02025459,  0.00237669,\n",
+       "                         -0.06119434,  0.06299283, -0.06787321, -0.04963538, -0.0285508 ,\n",
+       "                         -0.02115064, -0.10439228, -0.06280854, -0.02150689, -0.0087407 ,\n",
+       "                         -0.01133496, -0.05820064, -0.08399351, -0.00220406, -0.05374147,\n",
+       "                         -0.0084166 ,  0.02683506,  0.04995831, -0.04991116,  0.07378334,\n",
+       "                          0.08771855,  0.03559894,  0.04174837,  0.04986992, -0.07031458,\n",
+       "                         -0.04099566, -0.04586393, -0.04894676,  0.0452544 , -0.02901545,\n",
+       "                         -0.10887094, -0.06665391,  0.03176153, -0.07640473, -0.03704071,\n",
+       "                         -0.04572297,  0.04151303,  0.01618064,  0.05201699, -0.00598239,\n",
+       "                          0.00666859,  0.08898568,  0.04584971,  0.0312804 , -0.03132866,\n",
+       "                         -0.0066317 , -0.08492738, -0.01431052, -0.00116769,  0.02063407,\n",
+       "                          0.01227299,  0.0105425 ,  0.08164899, -0.07966555, -0.04573595,\n",
+       "                         -0.01493629, -0.06341923, -0.04441991,  0.0393707 , -0.07018486,\n",
+       "                          0.07571896,  0.01216909, -0.00044978, -0.03057809,  0.0612355 ,\n",
+       "                          0.00077983, -0.05563807, -0.10079593, -0.02951942,  0.08499622,\n",
+       "                          0.05386762, -0.06173644,  0.02608804,  0.03443969, -0.09064186,\n",
+       "                          0.0389196 , -0.07017983, -0.07173447, -0.03408198, -0.14056338,\n",
+       "                          0.01628569,  0.0268622 , -0.02475309, -0.01677444,  0.09604827,\n",
+       "                          0.02439231, -0.07903947, -0.01104342,  0.03859695,  0.00089456,\n",
+       "                         -0.00089233, -0.01680246,  0.04352787, -0.06731002, -0.02855014,\n",
+       "                          0.01585025,  0.08303126, -0.00780854,  0.01587816,  0.03930783,\n",
+       "                         -0.00718552, -0.04818885,  0.06294682,  0.02472097,  0.05720899,\n",
+       "                         -0.05400939, -0.12929952,  0.0696051 , -0.07063247,  0.02118118,\n",
+       "                          0.01647286, -0.05759468,  0.02665047, -0.00792585,  0.02348289,\n",
+       "                         -0.06724691,  0.04548252, -0.00882383,  0.02862583, -0.01595174,\n",
+       "                          0.01586641,  0.05275662, -0.05550243,  0.0463598 ,  0.02981136,\n",
+       "                         -0.02164674,  0.01641086], dtype=float32)>\n",
+       "                  (_feature_shapes): Dict()\n",
+       "                  (_feature_dtypes): Dict()\n",
+       "                )\n",
+       "                (layer_1): Dense(\n",
+       "                  768, activation=linear, use_bias=True\n",
+       "                  (kernel): <tf.Variable 'transformer/layer_._0/ff/layer_1/kernel:0' shape=(192, 768) dtype=float32, numpy=\n",
+       "                  array([[-8.7349433e-03,  1.4380505e-02, -1.8403217e-02, ...,\n",
+       "                          -1.0560994e-02, -9.8247221e-03,  3.8896156e-03],\n",
+       "                         [ 1.9794539e-02,  1.9119913e-02,  1.4701257e-03, ...,\n",
+       "                          -4.6915929e-03, -3.0279700e-03, -1.0369797e-02],\n",
+       "                         [ 2.2685794e-02, -1.1076587e-02,  2.1512689e-02, ...,\n",
+       "                          -9.3838237e-03, -1.5814094e-02,  1.2654760e-02],\n",
+       "                         ...,\n",
+       "                         [ 3.3880837e-02,  3.2771707e-02, -1.5241621e-02, ...,\n",
+       "                          -1.8954782e-02,  9.0328557e-03, -3.8368767e-03],\n",
+       "                         [ 3.4973539e-02,  7.7871266e-03, -1.2202458e-03, ...,\n",
+       "                          -1.1511138e-03, -6.7377505e-03,  1.4305637e-02],\n",
+       "                         [-5.9016286e-03,  3.0963784e-05,  4.6348446e-03, ...,\n",
+       "                          -9.7331330e-03, -9.1186212e-03, -4.0696082e-03]], dtype=float32)>\n",
+       "                  (bias): <tf.Variable 'transformer/layer_._0/ff/layer_1/bias:0' shape=(768,) dtype=float32, numpy=\n",
+       "                  array([-2.48988252e-03,  6.58203196e-03,  2.64750496e-02, -9.87772923e-03,\n",
+       "                          2.49165483e-02, -1.96873536e-03,  1.37765594e-02,  7.72468513e-03,\n",
+       "                         -1.52863916e-02, -3.80107411e-03, -1.07600829e-02,  3.38745862e-03,\n",
+       "                          1.53273325e-02, -1.19882887e-02,  5.40436618e-03,  2.19404721e-03,\n",
+       "                          2.60363892e-03,  4.26220242e-03,  2.08184868e-02,  1.22082443e-03,\n",
+       "                          1.71658359e-02,  1.61883030e-02, -1.14635089e-02,  5.40121691e-03,\n",
+       "                          5.44373458e-03,  1.77889038e-02, -5.69844851e-03,  3.11289355e-03,\n",
+       "                          1.31086144e-03, -2.80178571e-03, -3.88765195e-03, -7.58470781e-03,\n",
+       "                          1.36907427e-02,  6.45675417e-03,  2.65116412e-02,  1.58387870e-02,\n",
+       "                          1.02622213e-03,  8.93147197e-03,  2.47938349e-03, -1.99125968e-02,\n",
+       "                          2.70253327e-03, -8.58191773e-03,  1.80017427e-02,  7.24463165e-03,\n",
+       "                          9.56831127e-03,  2.74193045e-02,  1.74996982e-04, -7.05160759e-03,\n",
+       "                          2.38953568e-02,  6.30728249e-03,  2.40837168e-02,  2.80947471e-03,\n",
+       "                         -3.53719312e-04,  9.57346521e-03,  8.25208705e-03, -7.29673402e-03,\n",
+       "                         -1.38636009e-04,  4.73524723e-03,  1.45125119e-02, -1.18843932e-02,\n",
+       "                          2.11451408e-02,  2.68677399e-02,  6.18341239e-03, -6.16480596e-03,\n",
+       "                          8.34112335e-03,  4.47013066e-04, -3.05860024e-03, -9.32345074e-03,\n",
+       "                         -2.02798527e-02,  4.69490094e-03, -1.61361136e-02,  4.10681684e-03,\n",
+       "                          1.28482804e-02,  4.03247820e-03,  9.11187287e-03,  1.24189295e-02,\n",
+       "                          1.27137732e-02,  1.99195351e-02,  1.41281942e-02,  1.55547783e-02,\n",
+       "                         -1.07247783e-02,  7.05646677e-03, -1.81599881e-03,  9.94427502e-03,\n",
+       "                         -1.99749079e-02,  1.62800290e-02, -2.43168436e-02, -5.13213966e-03,\n",
+       "                          2.00566128e-02,  2.97278585e-03, -7.79949501e-03,  5.56347473e-03,\n",
+       "                          7.97226559e-03,  1.98900197e-02,  1.38633540e-02, -6.45546895e-03,\n",
+       "                          1.38269775e-02, -4.40548221e-03,  8.96899216e-03, -9.38130263e-03,\n",
+       "                         -5.15380700e-04, -2.41116602e-02,  1.52957542e-02,  1.24769453e-02,\n",
+       "                          6.28790632e-03,  5.41381445e-03,  8.18936341e-03,  1.51892807e-02,\n",
+       "                          1.11203482e-02, -4.50899825e-03, -1.44061493e-02, -2.26674285e-02,\n",
+       "                          3.10106426e-02,  2.14485563e-02,  1.03145291e-03,  1.03755528e-03,\n",
+       "                         -6.20614132e-03, -1.09666409e-02,  8.96500424e-03,  4.80830902e-03,\n",
+       "                         -7.33030727e-03,  6.25240244e-03, -9.21320729e-03,  6.77359942e-03,\n",
+       "                         -5.92142157e-03,  7.07151927e-03, -1.22634443e-02,  7.56111601e-03,\n",
+       "                          1.75033621e-02,  3.66673758e-03, -1.09480824e-02, -2.01308820e-03,\n",
+       "                         -5.92470681e-03,  2.63545513e-02,  1.99394524e-02, -4.43834206e-03,\n",
+       "                         -1.58517994e-02,  8.09705444e-03,  2.51221992e-02,  4.07058606e-03,\n",
+       "                          6.50535512e-04,  1.90216992e-02,  3.51213152e-03,  2.78372392e-02,\n",
+       "                          7.65756797e-03, -1.04906233e-02,  3.58949192e-02,  3.21657956e-02,\n",
+       "                          2.03288458e-02,  1.17718976e-03, -9.83388349e-03,  1.01774065e-02,\n",
+       "                          2.34259386e-02,  4.87414235e-03,  6.19397615e-04, -4.87850979e-03,\n",
+       "                          6.10528141e-03,  1.96777973e-02, -4.79804678e-03,  3.20185535e-03,\n",
+       "                          1.08724358e-02,  2.48679845e-03,  1.04768435e-02,  1.50508005e-02,\n",
+       "                         -2.04404313e-02,  8.93356372e-03,  3.47434171e-03,  5.11971477e-04,\n",
+       "                          1.05784240e-03,  1.37281520e-02, -1.45734590e-03,  2.07192767e-02,\n",
+       "                          4.55050357e-03,  1.93968341e-02, -6.62009744e-03, -1.97455566e-02,\n",
+       "                         -9.91699193e-03,  9.87284351e-03, -1.31387112e-03,  7.16593955e-03,\n",
+       "                          5.01987198e-03, -3.20331450e-03,  7.43561145e-03, -4.62228339e-03,\n",
+       "                          2.19815858e-02, -7.85590988e-03, -7.33769266e-03,  3.23284529e-02,\n",
+       "                          1.56302769e-02, -6.01055566e-03, -1.79425776e-02,  4.41427436e-03,\n",
+       "                         -2.07814388e-02, -6.37243548e-03, -2.83799577e-03,  5.25688939e-03,\n",
+       "                         -8.77550617e-03,  2.46067587e-02,  1.07153840e-02, -1.32179158e-02,\n",
+       "                          2.18793386e-04,  4.08930471e-03,  8.53821915e-03, -1.09368330e-02,\n",
+       "                          3.37619870e-03, -1.35646742e-02,  7.72237452e-03,  1.29408129e-02,\n",
+       "                         -1.53529420e-02, -9.28624719e-03, -1.21006239e-02,  1.54590970e-02,\n",
+       "                          2.16401205e-03,  1.04791895e-02,  5.56073198e-03,  1.37728415e-02,\n",
+       "                          1.07720145e-04,  5.28109539e-03,  1.08795706e-02, -2.47379648e-04,\n",
+       "                          3.11144930e-03, -5.73526463e-03, -5.40194986e-03,  3.43680102e-03,\n",
+       "                          6.36896258e-03,  7.28031015e-03, -7.98167568e-03,  1.46586786e-03,\n",
+       "                         -4.85271215e-03, -4.15298855e-03, -6.27090875e-03,  1.09038770e-03,\n",
+       "                          8.43349565e-03,  2.42243428e-02,  9.21734143e-03,  5.99709572e-03,\n",
+       "                          2.16714274e-02,  4.89401957e-03,  6.89816754e-03,  2.22890708e-03,\n",
+       "                          1.38756193e-04, -7.83765409e-03, -2.66516721e-03,  1.58686489e-02,\n",
+       "                          2.09250636e-02,  3.43082286e-03,  1.25900293e-02,  1.66601446e-02,\n",
+       "                          9.77085717e-03, -1.23784819e-03,  1.31846191e-02, -3.35601717e-03,\n",
+       "                          4.42687795e-03,  2.11218297e-02, -5.38641028e-03,  8.89543328e-04,\n",
+       "                          2.86574606e-02,  1.23174144e-02, -1.08364336e-02,  3.73017695e-03,\n",
+       "                         -2.47203764e-02, -4.73329565e-03,  1.31655764e-02, -6.27630530e-03,\n",
+       "                         -7.01956218e-03, -8.57002940e-03, -8.32860358e-03,  1.99239105e-02,\n",
+       "                         -4.52243630e-03,  2.18442213e-02,  2.81916582e-03,  1.94954555e-02,\n",
+       "                          1.47216879e-02,  1.14483749e-02,  9.50219017e-03,  1.93981547e-02,\n",
+       "                          1.98315759e-03,  1.17658265e-03,  8.65733624e-03, -3.82895139e-03,\n",
+       "                         -1.39406975e-02, -2.18565037e-04, -1.54521847e-02,  2.31004003e-02,\n",
+       "                         -1.43806655e-02,  1.07183242e-02, -4.23687370e-03, -8.43816437e-03,\n",
+       "                          9.99713037e-03,  1.01488354e-02,  4.36592521e-03,  4.06254223e-03,\n",
+       "                         -2.29024841e-03,  7.33671652e-04, -3.99773149e-03, -5.26233064e-03,\n",
+       "                         -5.51322009e-04,  1.99180748e-03,  2.11210479e-03, -1.47964270e-03,\n",
+       "                          1.85694620e-02, -7.09511619e-03,  1.37091307e-02,  1.77404413e-03,\n",
+       "                          3.04236803e-02,  1.63651221e-02,  1.01921558e-02,  2.87520438e-02,\n",
+       "                         -1.26408609e-02,  2.02455334e-02, -2.59257131e-03,  1.92524418e-02,\n",
+       "                         -1.05007098e-03,  8.00876645e-04, -1.07963514e-02, -1.00983009e-02,\n",
+       "                          3.39633483e-03, -5.70922857e-03,  2.50644069e-02,  1.06100654e-02,\n",
+       "                          7.89651275e-03,  9.92713869e-03, -4.23942460e-03,  8.36806651e-03,\n",
+       "                          1.46544278e-02,  9.03321337e-03, -1.24921696e-02, -4.23613749e-03,\n",
+       "                          8.12342390e-03,  2.61031408e-02,  8.26149434e-03,  1.93422493e-02,\n",
+       "                          1.59315765e-02,  4.34346450e-03, -1.92503165e-02,  7.93095399e-03,\n",
+       "                         -1.98308267e-02,  2.23907847e-02,  6.30652346e-03, -1.34924352e-02,\n",
+       "                         -7.86772370e-03,  2.03298517e-02,  1.62668228e-02,  8.84508621e-03,\n",
+       "                          1.78096499e-02,  1.08726043e-02,  9.57162119e-03,  1.47212772e-02,\n",
+       "                          2.21935660e-02, -1.45868107e-03, -8.12897284e-04, -7.34515116e-03,\n",
+       "                          8.64875689e-03,  7.40144961e-03,  6.41043903e-03,  4.63293120e-03,\n",
+       "                          4.28604428e-03,  2.04059836e-02, -8.72917753e-03,  9.75611620e-03,\n",
+       "                          1.00321267e-02,  1.31200878e-02,  2.10976950e-03,  5.71965007e-04,\n",
+       "                          1.03311744e-02, -1.68516766e-03, -1.79438982e-02, -1.74083021e-02,\n",
+       "                         -4.92391782e-03, -1.39317811e-02,  1.48546761e-02, -1.66444052e-02,\n",
+       "                         -3.73365986e-03, -1.36026256e-02,  8.19035619e-03,  4.33718460e-03,\n",
+       "                          4.58232686e-03,  7.53803365e-03,  7.45450845e-03,  7.19609112e-03,\n",
+       "                          1.62290093e-02,  1.26000466e-02, -1.52490484e-02, -2.25856341e-03,\n",
+       "                          2.89014243e-02,  9.44819208e-03,  2.67197583e-02,  6.94153551e-03,\n",
+       "                          1.24824699e-02,  1.95698701e-02, -1.01897297e-02, -1.00039514e-02,\n",
+       "                         -1.04320236e-02, -5.10433037e-03, -8.07258673e-03,  2.40934156e-02,\n",
+       "                         -1.08093852e-02,  3.51674552e-03,  1.24634281e-02,  1.61194839e-02,\n",
+       "                         -4.07268107e-03, -1.28737884e-03, -9.59544443e-04, -1.11112036e-02,\n",
+       "                          1.40558928e-03,  4.56377538e-03,  1.02128573e-02, -6.15438679e-03,\n",
+       "                         -1.33012095e-03,  1.53693510e-02,  1.19307695e-03, -3.19028762e-03,\n",
+       "                          9.25229862e-03,  9.54286443e-05,  3.19778686e-03,  3.43006453e-03,\n",
+       "                          6.68310421e-03, -2.00596638e-03,  2.85807136e-03,  1.19629130e-02,\n",
+       "                         -1.41574815e-02,  1.94316776e-03,  1.87879975e-03,  7.44125294e-03,\n",
+       "                          1.26068098e-02, -1.95779037e-02, -6.75179390e-03,  1.15828542e-02,\n",
+       "                          6.07337616e-03,  4.42268746e-03,  4.94396780e-03,  1.21988477e-02,\n",
+       "                          1.14446990e-02,  1.16123529e-02, -1.07849846e-02,  2.87843146e-03,\n",
+       "                         -1.42739005e-02, -4.04459005e-03, -9.62248445e-03, -5.20158932e-03,\n",
+       "                          6.75694225e-03, -4.65211784e-03,  8.97594448e-03,  1.08250836e-02,\n",
+       "                         -9.49004479e-03,  8.20130017e-03,  8.76851380e-03,  7.95888528e-03,\n",
+       "                          1.37145184e-02,  1.75602008e-02, -8.12873431e-03,  4.97413147e-03,\n",
+       "                         -9.14748292e-03,  1.12449210e-02,  1.59501564e-02,  2.49886438e-02,\n",
+       "                          4.06043883e-03, -6.10539550e-03,  7.11079978e-04,  3.61572509e-03,\n",
+       "                         -7.32730026e-04,  3.84381087e-03,  1.06619615e-02,  2.37780120e-02,\n",
+       "                          1.45025449e-02,  4.25680401e-03, -4.45264997e-03,  1.09784387e-03,\n",
+       "                          2.25181933e-02,  2.84491549e-03,  6.20998326e-04,  2.56988090e-02,\n",
+       "                          1.40275266e-02,  7.56263779e-03, -7.95345195e-03,  2.59988755e-02,\n",
+       "                          1.14943031e-02, -3.48383840e-03,  1.20270695e-03, -6.31895149e-03,\n",
+       "                          6.45010313e-03, -6.69839000e-03,  2.74554864e-02,  1.23840626e-02,\n",
+       "                         -7.85988197e-03,  7.35028647e-03,  1.56578515e-02,  2.94154929e-03,\n",
+       "                          3.62430466e-03, -5.50300488e-03, -4.76662040e-04,  1.59057863e-02,\n",
+       "                         -4.85554570e-03, -1.82895325e-02, -2.30622664e-03, -9.59027000e-03,\n",
+       "                          2.40675379e-02,  5.72432298e-03,  8.61885119e-03,  1.81669146e-02,\n",
+       "                         -7.79482257e-03,  8.06681905e-03,  7.92973395e-03,  8.86156689e-03,\n",
+       "                          1.07650831e-02,  1.68679189e-02,  1.77217312e-02,  1.61346719e-02,\n",
+       "                          2.15555485e-02, -4.34635347e-03, -1.01557719e-02, -7.55260175e-04,\n",
+       "                         -1.61906844e-03, -6.42401120e-03, -5.87663008e-03,  8.43080506e-03,\n",
+       "                          1.68590657e-02,  2.30838265e-02, -9.95164085e-03, -3.70766473e-04,\n",
+       "                          4.54875827e-03,  1.40316486e-02,  6.50463440e-03, -9.05440375e-03,\n",
+       "                          1.86522224e-03,  3.77172534e-03, -1.21039599e-02,  6.24031387e-03,\n",
+       "                          6.86559547e-03,  3.87154031e-03,  7.53928721e-03, -3.78697389e-03,\n",
+       "                          8.47220607e-03,  5.19724749e-03, -1.68645848e-02, -6.83352305e-03,\n",
+       "                          6.16311003e-03,  2.06075478e-02, -3.36128706e-03, -4.54347255e-03,\n",
+       "                         -4.43226658e-03,  9.47801396e-03,  1.34469452e-03, -2.78269453e-03,\n",
+       "                          1.07496325e-03,  5.72886225e-03, -4.58427705e-03,  4.34674323e-03,\n",
+       "                          1.00894533e-02,  6.01954013e-03,  1.18409786e-02,  1.02127623e-02,\n",
+       "                         -3.16850585e-03, -1.01286909e-02,  2.17334591e-02,  1.12441396e-02,\n",
+       "                         -4.21741139e-03,  5.98146534e-03,  1.92161649e-02, -9.98497382e-03,\n",
+       "                          1.02236588e-02,  3.91611643e-03,  1.38576785e-02, -4.98477183e-03,\n",
+       "                          2.07855050e-02,  1.55463815e-02,  1.42694395e-02,  1.70583408e-02,\n",
+       "                         -2.10462380e-02,  7.90667254e-03,  1.00777100e-03,  2.03150448e-05,\n",
+       "                         -9.65817273e-03,  1.48673952e-02, -4.30348329e-03,  1.13944628e-03,\n",
+       "                          2.93337228e-03, -8.70792102e-03, -1.75675575e-03,  8.86655040e-03,\n",
+       "                          1.60456393e-02,  1.19324429e-02,  9.20977350e-03,  1.57949142e-02,\n",
+       "                          3.98718752e-03,  5.14104264e-03, -2.80088722e-03,  2.14166343e-02,\n",
+       "                         -1.71560235e-02, -8.84766877e-03, -9.08766873e-03,  4.13088640e-03,\n",
+       "                          7.41530722e-03, -7.14520458e-03,  1.43901035e-02,  1.57008432e-02,\n",
+       "                          3.48176365e-03,  1.34258689e-02, -7.77519168e-03,  2.52181496e-02,\n",
+       "                          1.94994695e-02, -1.00142611e-02,  4.24301857e-03,  4.00523946e-04,\n",
+       "                          1.96565893e-02,  1.52775235e-02,  1.19475620e-02,  3.16524319e-03,\n",
+       "                          1.98126957e-02,  1.54079534e-02,  2.37543555e-03,  9.40866210e-03,\n",
+       "                          4.05140314e-03,  7.91203696e-04,  1.09335911e-02,  1.97298676e-02,\n",
+       "                         -1.93075929e-02,  1.94303587e-03,  3.35570797e-02, -2.26485580e-02,\n",
+       "                          1.55655332e-02,  7.09330058e-03,  4.23489313e-04,  9.61118191e-03,\n",
+       "                          1.63517352e-02,  1.42600127e-02, -5.09561691e-03, -3.46544152e-03,\n",
+       "                         -7.05293380e-03,  5.47119463e-03, -1.19369272e-02,  3.55220283e-03,\n",
+       "                         -6.47027092e-03, -4.66864277e-03, -1.12860324e-03,  1.57437511e-02,\n",
+       "                          8.27108324e-03,  2.43137102e-03, -1.15485163e-02, -1.33490609e-02,\n",
+       "                          1.06290532e-02,  1.28479563e-02, -1.36187626e-03,  1.18819866e-02,\n",
+       "                          1.30752167e-02, -8.14791210e-03,  1.79868210e-02, -1.14236902e-02,\n",
+       "                         -1.29655702e-02,  2.08648783e-03, -7.74235511e-03,  1.28833978e-02,\n",
+       "                          6.50411658e-03,  7.50467088e-03, -1.07559422e-02,  1.75879411e-02,\n",
+       "                         -8.50211736e-03, -1.01776710e-02,  2.42663119e-02,  1.62711286e-03,\n",
+       "                          6.88572740e-03,  5.71457949e-03,  6.17601851e-04, -1.78704094e-02,\n",
+       "                         -1.71567197e-04, -8.67385324e-03,  1.68735757e-02,  3.69164161e-03,\n",
+       "                         -1.05630793e-02,  6.74468745e-03,  1.98948095e-04,  7.28386408e-03,\n",
+       "                         -2.24167085e-03,  7.09309569e-03,  2.85558943e-02,  1.32500548e-02,\n",
+       "                          1.69137903e-02, -2.37387780e-04, -2.18597203e-02, -4.46859561e-03,\n",
+       "                          1.04082571e-02,  4.03283583e-03,  9.06235911e-03,  2.31208205e-02,\n",
+       "                          1.02282958e-02,  7.54507864e-03, -2.02157628e-03,  1.72267552e-03,\n",
+       "                          7.76690198e-04, -2.34109838e-03,  2.48324894e-03, -1.77459500e-03,\n",
+       "                          1.74034499e-02,  1.18780583e-02,  2.42147446e-02,  4.53634560e-03,\n",
+       "                         -7.13373011e-04,  6.53022528e-03,  1.31792929e-02,  3.03253159e-03,\n",
+       "                         -1.16036963e-02,  1.38841802e-02, -9.61985672e-04,  1.56072509e-02,\n",
+       "                          1.83839221e-02, -1.26425391e-02, -8.58081039e-03,  1.77578256e-02,\n",
+       "                         -1.57705601e-02,  6.07309677e-03,  1.58127826e-02, -4.43605706e-03,\n",
+       "                          3.01327799e-02,  1.62303597e-02,  1.62664112e-02,  9.25481878e-03,\n",
+       "                         -2.17470736e-03, -2.18344177e-03,  1.02113271e-02,  2.36091372e-02,\n",
+       "                          1.14256535e-02, -1.63149880e-03, -1.76011212e-02,  7.09930295e-03,\n",
+       "                          7.96853937e-03,  1.75659396e-02, -3.90994363e-03, -1.06832599e-02,\n",
+       "                         -8.94176587e-03, -1.21121760e-02,  5.23515511e-03, -1.00380024e-02,\n",
+       "                         -9.87766962e-03,  2.45441310e-02,  3.19681270e-03,  1.41334981e-02,\n",
+       "                          2.02579927e-02,  2.55680783e-03,  8.56060628e-03, -2.40424345e-03,\n",
+       "                         -1.69302542e-02, -4.54237964e-03, -1.20616211e-02,  1.82611158e-03,\n",
+       "                          2.76846206e-03,  1.38199525e-02, -1.33961961e-02,  7.89576955e-03,\n",
+       "                          1.97190102e-02,  7.84316193e-03,  1.24047138e-02, -1.47519272e-03,\n",
+       "                         -9.65619646e-03,  8.34757928e-03, -2.17827642e-03, -3.88957502e-04,\n",
+       "                          1.64355468e-02,  2.64623687e-02, -9.89953335e-03,  1.12777716e-02,\n",
+       "                         -2.95404904e-03,  8.74106493e-03,  1.55162811e-03, -3.00494349e-03,\n",
+       "                          2.69142073e-03,  2.39436403e-02, -9.84442607e-03,  1.80167556e-02],\n",
+       "                        dtype=float32)>\n",
+       "                  (_feature_shapes): Dict()\n",
+       "                  (_feature_dtypes): Dict()\n",
+       "                )\n",
+       "                (layer_2): Dense(\n",
+       "                  192, activation=linear, use_bias=True\n",
+       "                  (kernel): <tf.Variable 'transformer/layer_._0/ff/layer_2/kernel:0' shape=(768, 192) dtype=float32, numpy=\n",
+       "                  array([[ 0.03105873,  0.02197045,  0.01535711, ..., -0.02207142,\n",
+       "                          -0.00204962,  0.01233771],\n",
+       "                         [-0.00683493, -0.01493787,  0.00323838, ..., -0.00578931,\n",
+       "                           0.01483128,  0.02967459],\n",
+       "                         [-0.02099711,  0.00616769, -0.00663288, ...,  0.02499438,\n",
+       "                           0.01299867, -0.00927783],\n",
+       "                         ...,\n",
+       "                         [-0.01390732,  0.01844309, -0.01650524, ...,  0.00378714,\n",
+       "                           0.00615161,  0.00803701],\n",
+       "                         [ 0.00750632, -0.00458682, -0.01339437, ..., -0.00503869,\n",
+       "                          -0.00725265, -0.00729213],\n",
+       "                         [-0.00832169,  0.01612099, -0.02206275, ..., -0.03785598,\n",
+       "                          -0.01250057, -0.02561413]], dtype=float32)>\n",
+       "                  (bias): <tf.Variable 'transformer/layer_._0/ff/layer_2/bias:0' shape=(192,) dtype=float32, numpy=\n",
+       "                  array([-1.18231699e-02,  1.03601832e-02, -8.29804223e-03,  1.99701991e-02,\n",
+       "                          1.76643080e-04,  4.44231071e-02,  2.99130473e-02,  3.19546983e-02,\n",
+       "                         -1.12999994e-02,  3.43591869e-02, -1.61521472e-02,  1.36177503e-02,\n",
+       "                          1.15128085e-02, -1.09507621e-03, -3.37390555e-03,  6.89360220e-03,\n",
+       "                         -4.13123937e-03,  1.62499081e-02, -8.00683629e-04, -2.11246312e-02,\n",
+       "                         -1.37601141e-02,  3.46819125e-02,  9.78396088e-03, -4.11889283e-03,\n",
+       "                          5.74809080e-03,  1.44397409e-03,  3.15773301e-03,  7.75392726e-03,\n",
+       "                         -1.11424308e-02, -1.06719630e-02,  1.12653803e-02, -1.79730225e-02,\n",
+       "                          8.06322228e-03, -2.28440948e-03,  2.09859367e-02, -1.07666533e-02,\n",
+       "                         -1.69093590e-02,  1.28620099e-02,  3.85885276e-02,  2.59677637e-02,\n",
+       "                         -2.09366418e-02,  1.07704918e-03, -4.80084028e-03, -1.99089963e-02,\n",
+       "                          2.55218279e-02,  1.77786537e-02,  7.77578400e-03,  1.14584505e-03,\n",
+       "                         -1.43661699e-03,  1.05165811e-02,  4.13904246e-03, -1.51320302e-03,\n",
+       "                          7.36002252e-03, -2.05752421e-02,  5.02680764e-02,  5.19761303e-03,\n",
+       "                         -3.12606804e-04, -1.33357486e-02,  1.02019459e-02, -2.60877237e-03,\n",
+       "                          7.74074951e-03, -5.22067491e-03,  1.11552700e-02, -5.16852923e-03,\n",
+       "                          8.53748340e-03, -6.34515099e-03,  2.92164087e-02, -1.34276906e-02,\n",
+       "                         -2.07019337e-02, -6.97588595e-03, -9.50461428e-04, -5.22856563e-02,\n",
+       "                         -4.60096495e-03, -1.05865430e-02, -7.99557834e-04,  1.64804514e-03,\n",
+       "                         -1.11557161e-02, -2.90366467e-02,  1.41196838e-02, -9.79548972e-03,\n",
+       "                         -4.00953926e-03,  1.12849819e-02,  2.55571981e-03, -1.16084691e-03,\n",
+       "                          2.75370330e-02,  3.10603790e-02,  5.13396645e-03,  9.99009516e-03,\n",
+       "                          1.81308165e-02, -1.73914377e-02, -6.52272627e-03, -4.53224359e-03,\n",
+       "                         -1.50986025e-02,  1.44944564e-02, -1.71106905e-02, -3.57185379e-02,\n",
+       "                         -1.84081197e-02,  6.25483785e-03, -3.86861190e-02, -1.24735022e-02,\n",
+       "                         -3.20191239e-03, -5.15542505e-03, -2.35393108e-03,  1.86459981e-02,\n",
+       "                         -7.51753850e-03, -4.82365210e-03,  3.32103260e-02,  7.17555871e-03,\n",
+       "                          7.25519285e-03, -9.94957238e-03,  1.35318565e-04, -2.35690605e-02,\n",
+       "                         -3.16280313e-03, -1.14406820e-03,  2.74472986e-03,  6.59645908e-03,\n",
+       "                         -1.41589751e-03,  4.13854569e-02, -1.44355716e-02, -6.92052348e-03,\n",
+       "                          5.55959530e-03, -3.30252536e-02, -1.38800498e-02,  8.02037679e-03,\n",
+       "                         -2.93474011e-02,  3.47584710e-02,  9.14734043e-03, -9.73121449e-03,\n",
+       "                         -1.23930294e-02,  2.06993651e-02, -3.12827341e-03, -2.32891343e-03,\n",
+       "                         -3.46817225e-02,  6.07703906e-03,  2.06695050e-02,  1.19140390e-02,\n",
+       "                         -3.75964679e-02,  7.35174678e-03, -4.06955648e-03, -4.85159121e-02,\n",
+       "                          6.43890491e-03, -2.10845768e-02, -2.46330500e-02, -1.20099075e-03,\n",
+       "                         -4.61101271e-02,  5.49700065e-03,  4.75712121e-03, -3.62440175e-03,\n",
+       "                          1.52475038e-03,  4.00585197e-02,  1.48058282e-02, -2.08347831e-02,\n",
+       "                         -7.71040935e-03,  3.24013340e-03, -4.08119755e-04,  1.07808020e-02,\n",
+       "                         -8.54405575e-03,  1.08643081e-02, -2.49987431e-02, -9.56417341e-03,\n",
+       "                          7.06814753e-05,  1.61526855e-02,  8.29778844e-04,  5.27869863e-03,\n",
+       "                          1.83209090e-03,  5.17274626e-03, -9.73243825e-03,  1.77772976e-02,\n",
+       "                          9.07951314e-03,  2.06841063e-02, -1.68221779e-02, -3.72066498e-02,\n",
+       "                          2.13726964e-02, -2.43793298e-02,  7.82521069e-03,  1.40628982e-02,\n",
+       "                         -1.62246283e-02,  1.40211182e-02, -2.62036663e-03,  6.93138875e-03,\n",
+       "                         -1.47657488e-02,  2.04760805e-02,  2.87828641e-03,  1.40901785e-02,\n",
+       "                          5.04952762e-03,  1.17212813e-02,  2.30959542e-02, -1.17893247e-02,\n",
+       "                          1.45166460e-02,  3.32305534e-03, -7.83565454e-03, -7.87868979e-04],\n",
+       "                        dtype=float32)>\n",
+       "                  (_feature_shapes): Dict()\n",
+       "                  (_feature_dtypes): Dict()\n",
+       "                )\n",
+       "                (dropout): Dropout(\n",
+       "                  (_feature_shapes): Dict()\n",
+       "                  (_feature_dtypes): Dict()\n",
+       "                )\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (dropout): Dropout(\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "            (1): TFXLNetLayer(\n",
+       "              (rel_attn): TFXLNetRelativeAttention(\n",
+       "                (layer_norm): LayerNormalization(\n",
+       "                  (axis): List(\n",
+       "                    (0): 2\n",
+       "                  )\n",
+       "                  (gamma): <tf.Variable 'transformer/layer_._1/rel_attn/layer_norm/gamma:0' shape=(192,) dtype=float32, numpy=\n",
+       "                  array([1.0261322 , 1.0269046 , 0.9773781 , 1.0247962 , 1.0097598 ,\n",
+       "                         1.0459249 , 1.0389155 , 1.0094162 , 0.9840094 , 1.0255837 ,\n",
+       "                         1.0145838 , 1.029601  , 0.9919759 , 1.0503366 , 1.000113  ,\n",
+       "                         0.98745275, 0.9951172 , 0.98850536, 1.0047354 , 1.0157787 ,\n",
+       "                         1.0056013 , 1.0997953 , 1.0325745 , 1.0181527 , 0.9886395 ,\n",
+       "                         1.0032426 , 0.9645967 , 1.0369183 , 1.0305737 , 1.022639  ,\n",
+       "                         0.98697466, 1.0407704 , 1.0208054 , 1.0117294 , 1.0012168 ,\n",
+       "                         1.0317819 , 1.0090001 , 1.0274644 , 1.0130668 , 0.99157923,\n",
+       "                         1.032259  , 1.0095482 , 1.0317316 , 1.0250219 , 1.0415062 ,\n",
+       "                         0.99819475, 1.0200968 , 1.0049968 , 1.0128824 , 1.0352737 ,\n",
+       "                         1.0368786 , 0.96232355, 1.0403799 , 1.0008532 , 1.0264657 ,\n",
+       "                         0.9998839 , 0.97538733, 0.991134  , 1.0391068 , 0.9888234 ,\n",
+       "                         1.0180827 , 0.9775322 , 1.0192289 , 1.0150893 , 1.000222  ,\n",
+       "                         1.0049831 , 0.9870896 , 1.0674498 , 1.0196699 , 1.0082041 ,\n",
+       "                         1.0324329 , 0.99676013, 1.0091047 , 1.0248021 , 1.0044961 ,\n",
+       "                         1.0053085 , 1.0009363 , 0.9970736 , 0.94617426, 1.0338936 ,\n",
+       "                         1.0148971 , 0.96663743, 1.0128137 , 1.0034641 , 1.0319886 ,\n",
+       "                         1.0064343 , 1.0028603 , 1.002649  , 1.0243838 , 1.0064948 ,\n",
+       "                         1.0377748 , 0.9891696 , 0.9866293 , 0.99707025, 0.99078393,\n",
+       "                         1.0176572 , 1.0241402 , 1.0049547 , 1.000801  , 1.034779  ,\n",
+       "                         1.0198549 , 0.9966189 , 0.9957258 , 1.0326344 , 0.99225044,\n",
+       "                         1.0071577 , 1.0114198 , 1.0367244 , 1.0063225 , 0.9908461 ,\n",
+       "                         1.0214857 , 1.0045844 , 0.97997284, 0.98385096, 1.0132415 ,\n",
+       "                         1.0294743 , 1.0063779 , 1.0424733 , 1.0020639 , 1.0190448 ,\n",
+       "                         0.9811757 , 1.0200567 , 1.0410883 , 1.0080585 , 1.0111438 ,\n",
+       "                         1.0438564 , 1.0073017 , 1.0119686 , 1.0274266 , 1.0132748 ,\n",
+       "                         0.9857355 , 0.98808295, 1.0102935 , 1.0228415 , 0.99962467,\n",
+       "                         1.0004269 , 0.99588555, 1.0006347 , 1.0041206 , 0.990004  ,\n",
+       "                         0.9891518 , 1.0437917 , 1.0374291 , 0.99602705, 1.0428259 ,\n",
+       "                         0.97428006, 1.0055739 , 1.0196538 , 1.0008999 , 1.0310303 ,\n",
+       "                         1.002109  , 0.9910634 , 0.9972151 , 1.0127355 , 0.98564386,\n",
+       "                         1.0203615 , 1.0232209 , 1.0296504 , 0.9873712 , 1.0131739 ,\n",
+       "                         0.9984371 , 1.0343952 , 0.9563564 , 1.0268995 , 1.0328572 ,\n",
+       "                         1.002335  , 0.98883   , 1.0180264 , 0.9681929 , 0.9756003 ,\n",
+       "                         1.070814  , 1.0193576 , 0.98169804, 1.0006468 , 1.0085332 ,\n",
+       "                         0.9559967 , 1.0291041 , 1.0083201 , 1.0401794 , 0.99601644,\n",
+       "                         1.0606512 , 1.0057952 , 0.98249924, 1.0013803 , 0.9975868 ,\n",
+       "                         1.0436803 , 0.9974033 , 1.0232234 , 1.0014886 , 0.95568186,\n",
+       "                         1.0128983 , 1.0420789 ], dtype=float32)>\n",
+       "                  (beta): <tf.Variable 'transformer/layer_._1/rel_attn/layer_norm/beta:0' shape=(192,) dtype=float32, numpy=\n",
+       "                  array([ 2.52928934e-03,  2.75707990e-02, -7.46368477e-03,  2.60973740e-02,\n",
+       "                         -2.99260370e-03,  2.73417979e-02,  4.90686111e-02,  1.38162207e-02,\n",
+       "                          8.11486784e-03,  1.70336086e-02,  3.51925148e-03, -7.69003760e-03,\n",
+       "                          2.59532798e-02, -1.75180901e-02, -1.08880019e-02,  1.38446065e-02,\n",
+       "                         -2.13629357e-03,  8.55799112e-03,  8.28036014e-03,  2.36780709e-03,\n",
+       "                         -1.72654982e-05,  9.31350291e-02,  2.88223773e-02,  3.16347592e-02,\n",
+       "                         -1.64339896e-02,  2.52713393e-02, -8.71144608e-03,  4.91184108e-02,\n",
+       "                         -2.37441119e-02, -1.38560440e-02,  6.72000367e-03, -8.39894861e-02,\n",
+       "                         -1.03174821e-02, -1.49761168e-02, -1.07429633e-02,  6.57213945e-03,\n",
+       "                          2.32967455e-03,  6.64166058e-04,  1.59889422e-02, -3.34091089e-03,\n",
+       "                          3.97001253e-03,  3.76692340e-02, -3.19892950e-02,  1.11396972e-03,\n",
+       "                          3.83891873e-02,  1.59136765e-02,  1.96111146e-02, -1.42334513e-02,\n",
+       "                          3.52888145e-02,  1.33105358e-02,  5.51172113e-03,  2.60192398e-02,\n",
+       "                         -8.31306912e-03,  5.08351345e-03,  1.16162142e-02,  9.07008070e-03,\n",
+       "                         -1.77313585e-03, -1.13073476e-02, -2.63853911e-02, -7.58569455e-03,\n",
+       "                          1.23039568e-02, -9.51751322e-03,  3.47649269e-02, -8.37521441e-03,\n",
+       "                         -3.41385603e-03, -1.35939382e-02, -2.31663603e-02, -3.02777179e-02,\n",
+       "                         -1.23716239e-02, -2.14149896e-02, -2.31477581e-02, -1.99445989e-02,\n",
+       "                         -1.63127650e-02, -1.80728100e-02, -8.70492589e-03, -1.29072918e-02,\n",
+       "                         -2.68601850e-02, -6.94075646e-03, -4.48201085e-03, -3.69689763e-02,\n",
+       "                         -2.38052551e-02,  9.86985397e-03,  1.81750860e-02, -2.17389762e-02,\n",
+       "                          1.58198401e-02,  1.82335339e-02,  1.69853829e-02,  8.53019953e-03,\n",
+       "                          1.26137808e-02,  4.35138913e-03, -1.42680006e-02, -7.37039372e-03,\n",
+       "                         -9.13672987e-03,  8.27492448e-04,  2.01249495e-02, -3.34417671e-02,\n",
+       "                         -8.82770121e-03,  7.83569762e-04,  1.45847378e-02, -2.61937417e-02,\n",
+       "                         -5.73098920e-02,  2.56210603e-02,  1.96438842e-02,  1.58894695e-02,\n",
+       "                          2.79775411e-02,  4.48896922e-02,  7.81496707e-03,  3.24482359e-02,\n",
+       "                         -2.23230664e-03, -9.27990023e-03, -3.37327085e-02, -2.58272141e-02,\n",
+       "                         -2.16552466e-02,  1.95785761e-02,  1.95409935e-02,  1.11613050e-02,\n",
+       "                         -1.71062257e-02,  1.76059026e-02, -1.35756070e-02, -1.33802658e-02,\n",
+       "                          1.22849524e-04, -3.00864950e-02, -3.07294056e-02,  8.43367260e-03,\n",
+       "                          1.71686104e-03,  1.77911706e-02,  2.96829501e-03,  6.71349885e-03,\n",
+       "                         -1.27283167e-02,  1.89087614e-02,  2.34963223e-02, -8.70413706e-03,\n",
+       "                         -2.57595368e-02,  3.97355249e-03,  2.23790798e-02,  1.55618126e-02,\n",
+       "                         -1.90211681e-03,  9.54312459e-03,  1.30000506e-02, -1.60749331e-02,\n",
+       "                          1.90574955e-02, -2.48913411e-02, -1.22065293e-02, -1.17140273e-02,\n",
+       "                         -7.87160620e-02,  7.49537256e-03,  1.81484632e-02,  4.25873324e-03,\n",
+       "                         -2.96639949e-02,  9.80244949e-03, -2.01651305e-02, -2.05957796e-02,\n",
+       "                         -1.32818706e-02,  2.80134995e-02,  1.27927978e-02,  1.28203519e-02,\n",
+       "                          7.55941402e-03,  1.86280571e-02, -2.17847694e-02,  3.51456041e-03,\n",
+       "                         -9.69546381e-05,  2.68017650e-02, -1.62972324e-02,  4.14601108e-03,\n",
+       "                          1.23571977e-02,  1.97119489e-02, -7.15771178e-03,  5.23134600e-03,\n",
+       "                          3.03786639e-02, -1.63936466e-02, -3.25149409e-02, -5.39167337e-02,\n",
+       "                          3.43849994e-02, -1.77244600e-02, -8.30308069e-03, -2.26102229e-02,\n",
+       "                         -3.20713557e-02, -4.66967747e-02, -4.05329056e-02, -1.22320019e-02,\n",
+       "                         -3.25014628e-02,  5.88958384e-03, -1.72737613e-02,  3.55301984e-02,\n",
+       "                         -1.11767389e-02,  4.04588655e-02,  3.43203195e-04, -3.55312340e-02,\n",
+       "                          8.39638431e-03, -2.83913617e-03, -4.11246624e-03, -1.91871380e-03],\n",
+       "                        dtype=float32)>\n",
+       "                  (_feature_shapes): Dict()\n",
+       "                  (_feature_dtypes): Dict()\n",
+       "                )\n",
+       "                (dropout): Dropout(\n",
+       "                  (_feature_shapes): Dict()\n",
+       "                  (_feature_dtypes): Dict()\n",
+       "                )\n",
+       "                (q): <tf.Variable 'transformer/layer_._1/rel_attn/q:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "                array([[[-9.14077908e-02,  1.13878334e-02, -8.51188079e-02, ...,\n",
+       "                          7.58047625e-02,  4.81901653e-02, -1.57964990e-01],\n",
+       "                        [-3.61972786e-02, -6.05871342e-03,  4.62203361e-02, ...,\n",
+       "                          1.02220975e-01,  3.31187397e-02, -2.00551637e-02],\n",
+       "                        [-1.78344436e-02,  1.10841259e-01, -8.28037853e-04, ...,\n",
+       "                         -2.72256564e-02, -3.21121849e-02,  2.49014031e-02],\n",
+       "                        ...,\n",
+       "                        [-1.44089619e-02,  3.92392725e-02,  2.32233517e-02, ...,\n",
+       "                          3.18129919e-03, -9.68393534e-02,  7.63502344e-02],\n",
+       "                        [ 4.15719226e-02,  5.68181686e-02,  1.57067806e-01, ...,\n",
+       "                          1.03105821e-01,  7.46680945e-02, -1.58567447e-02],\n",
+       "                        [-4.14981209e-02,  1.08322926e-01,  6.22609854e-02, ...,\n",
+       "                          9.51158553e-02, -4.82069701e-03,  3.56614999e-02]],\n",
+       "                \n",
+       "                       [[ 2.21992377e-02, -5.97883500e-02,  5.15988655e-02, ...,\n",
+       "                         -1.11302346e-01,  4.72044796e-02,  5.94906546e-02],\n",
+       "                        [ 8.15225467e-02, -1.04043297e-02,  1.18145466e-01, ...,\n",
+       "                         -1.53390374e-02, -5.59366755e-02, -1.01808645e-02],\n",
+       "                        [ 5.30351363e-02, -7.88138062e-02,  5.97658455e-02, ...,\n",
+       "                          3.89603190e-02, -2.52384972e-02, -4.04863395e-02],\n",
+       "                        ...,\n",
+       "                        [ 5.18525168e-02, -1.18374228e-01,  1.22500304e-02, ...,\n",
+       "                          7.76050566e-03, -2.46625934e-02, -1.08838245e-01],\n",
+       "                        [-2.82060308e-03, -3.73417921e-02, -7.43817911e-02, ...,\n",
+       "                         -6.81613460e-02, -9.98374727e-03,  3.63878049e-02],\n",
+       "                        [-2.33192071e-02, -7.30483979e-02, -1.47890881e-01, ...,\n",
+       "                         -2.56333891e-02, -1.82271786e-02, -1.11294717e-01]],\n",
+       "                \n",
+       "                       [[ 7.07995743e-02,  1.02071442e-01, -4.62083258e-02, ...,\n",
+       "                         -3.06372382e-02, -8.96562729e-03, -1.60935847e-03],\n",
+       "                        [ 4.93399464e-02,  5.80327064e-02, -4.21695262e-02, ...,\n",
+       "                         -4.44087908e-02,  6.36480451e-02,  9.20375884e-02],\n",
+       "                        [ 2.61474848e-02,  1.04868315e-01,  8.21986571e-02, ...,\n",
+       "                          6.94721192e-02, -4.26909029e-02,  3.19289789e-02],\n",
+       "                        ...,\n",
+       "                        [ 5.12780324e-02,  2.22272910e-02,  7.36066028e-02, ...,\n",
+       "                         -1.02062506e-04, -2.78015006e-02, -2.21668612e-02],\n",
+       "                        [ 3.76984179e-02, -5.69667593e-02,  9.02416408e-02, ...,\n",
+       "                         -1.17468983e-02, -3.04301623e-02,  7.01869503e-02],\n",
+       "                        [ 1.47923687e-02,  7.80922920e-02, -8.18262398e-02, ...,\n",
+       "                         -7.04243034e-02,  1.69871803e-02, -1.93864703e-02]],\n",
+       "                \n",
+       "                       ...,\n",
+       "                \n",
+       "                       [[-7.37240771e-03, -1.19801663e-01,  6.94409460e-02, ...,\n",
+       "                         -5.98479286e-02,  1.27701059e-01,  1.34302229e-01],\n",
+       "                        [ 1.42167673e-01, -3.61821651e-02,  8.10781941e-02, ...,\n",
+       "                         -5.00151552e-02, -1.02305926e-01, -2.29969881e-02],\n",
+       "                        [ 7.70621598e-02, -3.88466418e-02,  1.30510852e-01, ...,\n",
+       "                         -2.38810554e-02,  1.85351875e-02, -7.33468086e-02],\n",
+       "                        ...,\n",
+       "                        [ 8.39333534e-02, -1.29041314e-01, -1.34542719e-01, ...,\n",
+       "                          9.67865635e-04,  8.93794596e-02, -5.52671216e-02],\n",
+       "                        [ 6.98279887e-02, -7.33840745e-04,  1.12927826e-02, ...,\n",
+       "                         -8.48613232e-02,  1.15450528e-02,  8.48317146e-02],\n",
+       "                        [-1.45672085e-02, -4.56641093e-02,  3.52248806e-03, ...,\n",
+       "                         -9.79588628e-02,  1.43803144e-02, -1.96329392e-02]],\n",
+       "                \n",
+       "                       [[-2.24300846e-02, -9.70121622e-02, -5.53180464e-02, ...,\n",
+       "                          1.14226513e-01, -1.15935691e-01, -8.40203557e-03],\n",
+       "                        [ 2.19793785e-02,  2.20347419e-02,  3.52332145e-02, ...,\n",
+       "                         -4.72014174e-02, -4.09451835e-02, -1.41605914e-01],\n",
+       "                        [-7.50652626e-02, -4.78943847e-02, -2.94669345e-02, ...,\n",
+       "                         -2.04580035e-02,  2.83687301e-02,  7.36517832e-02],\n",
+       "                        ...,\n",
+       "                        [ 6.45165937e-03, -5.17790206e-02,  6.01154417e-02, ...,\n",
+       "                         -6.84089139e-02,  2.98251119e-02,  1.11601777e-01],\n",
+       "                        [ 1.68807507e-02,  4.85507809e-02, -5.92818707e-02, ...,\n",
+       "                         -3.60055789e-02, -1.57371853e-02,  3.19426693e-02],\n",
+       "                        [-2.77272481e-02, -3.94149087e-02,  1.89277288e-02, ...,\n",
+       "                          7.10227247e-03, -1.24480035e-02,  1.21919438e-01]],\n",
+       "                \n",
+       "                       [[-1.07383234e-02,  2.83993669e-02, -7.25662708e-02, ...,\n",
+       "                         -1.08398020e-01,  5.89501522e-02, -2.39164885e-02],\n",
+       "                        [-5.66680133e-02, -1.15045384e-01,  1.19717479e-01, ...,\n",
+       "                         -7.25880936e-02, -8.00165460e-02,  2.48625781e-02],\n",
+       "                        [-5.32022268e-02, -6.84107393e-02, -4.79449611e-03, ...,\n",
+       "                          1.19777806e-02, -6.41888380e-02, -1.23907752e-01],\n",
+       "                        ...,\n",
+       "                        [ 1.39709413e-01, -1.15669481e-02,  1.02200054e-01, ...,\n",
+       "                          3.99158709e-02, -3.26740108e-02, -4.94181402e-02],\n",
+       "                        [-1.52411321e-02,  6.57810271e-02, -1.58718899e-01, ...,\n",
+       "                          5.38997818e-03, -2.09698156e-01,  6.31303014e-03],\n",
+       "                        [-6.14385307e-03, -3.01341526e-04, -3.58580053e-02, ...,\n",
+       "                          2.14667432e-02,  2.57892162e-02, -1.59396425e-01]]],\n",
+       "                      dtype=float32)>\n",
+       "                (k): <tf.Variable 'transformer/layer_._1/rel_attn/k:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "                array([[[-0.02706272, -0.01475603,  0.01799243, ..., -0.01109189,\n",
+       "                         -0.10876201,  0.0518376 ],\n",
+       "                        [-0.0031296 , -0.02590217, -0.02579277, ..., -0.05076121,\n",
+       "                          0.01024422, -0.0047144 ],\n",
+       "                        [ 0.01895484, -0.03475295, -0.03113441, ..., -0.00184126,\n",
+       "                          0.01880827,  0.00846547],\n",
+       "                        ...,\n",
+       "                        [-0.0230201 , -0.00894863,  0.00495793, ..., -0.00316434,\n",
+       "                          0.04121248,  0.00622395],\n",
+       "                        [-0.05963105,  0.01012768, -0.03366488, ...,  0.00041262,\n",
+       "                          0.00683424, -0.01068041],\n",
+       "                        [ 0.02895327, -0.02416312,  0.01993154, ..., -0.01618524,\n",
+       "                         -0.01545478,  0.00205119]],\n",
+       "                \n",
+       "                       [[-0.04576638,  0.04656557, -0.01677025, ...,  0.02344459,\n",
+       "                         -0.12276172, -0.00676864],\n",
+       "                        [-0.00978681,  0.04487051, -0.08663532, ..., -0.03004673,\n",
+       "                          0.01007075,  0.03550502],\n",
+       "                        [ 0.02785692,  0.02792483,  0.00051675, ...,  0.00370448,\n",
+       "                          0.00668171,  0.04424441],\n",
+       "                        ...,\n",
+       "                        [-0.02920452,  0.02893456, -0.02343769, ..., -0.04401347,\n",
+       "                         -0.02856454,  0.03050387],\n",
+       "                        [ 0.04369762, -0.03524409,  0.04656316, ...,  0.00108793,\n",
+       "                         -0.02215741,  0.01845626],\n",
+       "                        [-0.01543178,  0.01866272,  0.01845369, ..., -0.02931005,\n",
+       "                          0.03298638,  0.01737015]],\n",
+       "                \n",
+       "                       [[-0.135364  , -0.0664507 ,  0.01112893, ..., -0.00859859,\n",
+       "                          0.00755295,  0.01676364],\n",
+       "                        [-0.02737699, -0.04769333,  0.05760125, ...,  0.02541748,\n",
+       "                         -0.03828989, -0.06387301],\n",
+       "                        [-0.01690764, -0.0606076 , -0.01655304, ..., -0.02443056,\n",
+       "                          0.04120573, -0.04320288],\n",
+       "                        ...,\n",
+       "                        [-0.00565883,  0.04010722,  0.00216758, ...,  0.02029311,\n",
+       "                          0.039828  ,  0.01575541],\n",
+       "                        [ 0.00487086,  0.0582353 , -0.0297171 , ..., -0.01682885,\n",
+       "                         -0.00391845, -0.0216135 ],\n",
+       "                        [ 0.00531683, -0.01306163,  0.04055905, ...,  0.02679659,\n",
+       "                         -0.05756253,  0.01769848]],\n",
+       "                \n",
+       "                       ...,\n",
+       "                \n",
+       "                       [[ 0.00473029,  0.0232644 , -0.0174927 , ...,  0.01263051,\n",
+       "                         -0.10177041, -0.03314629],\n",
+       "                        [-0.05181501,  0.01826319, -0.00387804, ...,  0.00019099,\n",
+       "                          0.0264037 ,  0.00855082],\n",
+       "                        [-0.02973071,  0.01030848, -0.01891961, ...,  0.05118888,\n",
+       "                         -0.08611775,  0.08852727],\n",
+       "                        ...,\n",
+       "                        [-0.02925289,  0.04309483,  0.04216203, ...,  0.00242066,\n",
+       "                         -0.05256388,  0.00049124],\n",
+       "                        [-0.01112139,  0.01980946, -0.03196227, ...,  0.03356062,\n",
+       "                         -0.010408  , -0.02198589],\n",
+       "                        [-0.03535127, -0.00773543, -0.00885877, ...,  0.02874871,\n",
+       "                          0.00311856,  0.02825575]],\n",
+       "                \n",
+       "                       [[ 0.04659694,  0.07548056,  0.01092906, ..., -0.0534005 ,\n",
+       "                          0.09931507,  0.01606977],\n",
+       "                        [-0.01193147,  0.00658854, -0.01162503, ...,  0.05445072,\n",
+       "                         -0.00323939,  0.06076182],\n",
+       "                        [ 0.01014838,  0.02871931,  0.01193392, ...,  0.03308337,\n",
+       "                         -0.01210698, -0.05587041],\n",
+       "                        ...,\n",
+       "                        [-0.00237026, -0.00477155, -0.02654402, ...,  0.05717536,\n",
+       "                         -0.00253815, -0.04528459],\n",
+       "                        [-0.00140787, -0.03180642,  0.03757759, ...,  0.00683571,\n",
+       "                          0.01135639, -0.00226221],\n",
+       "                        [ 0.0223318 ,  0.02836771, -0.00715415, ...,  0.00253245,\n",
+       "                         -0.000718  , -0.0467924 ]],\n",
+       "                \n",
+       "                       [[ 0.00486831, -0.03448185,  0.03256648, ...,  0.01382556,\n",
+       "                         -0.07196326,  0.02667288],\n",
+       "                        [ 0.02565878,  0.04478304, -0.08682576, ...,  0.01990675,\n",
+       "                          0.03794343, -0.01332447],\n",
+       "                        [ 0.03825634,  0.01602439, -0.01602452, ..., -0.00877481,\n",
+       "                          0.0457263 ,  0.05769112],\n",
+       "                        ...,\n",
+       "                        [-0.05350161,  0.00859326, -0.06572261, ..., -0.04210747,\n",
+       "                          0.00275381,  0.01149508],\n",
+       "                        [ 0.01882138, -0.10080525,  0.04411182, ...,  0.00712686,\n",
+       "                          0.05586889, -0.01648431],\n",
+       "                        [ 0.03689698,  0.0139469 ,  0.01361012, ..., -0.00313812,\n",
+       "                         -0.06611379,  0.05732429]]], dtype=float32)>\n",
+       "                (v): <tf.Variable 'transformer/layer_._1/rel_attn/v:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "                array([[[ 5.67087531e-02, -1.12824850e-01, -1.23196626e-02, ...,\n",
+       "                          1.13645149e-02,  3.56883346e-03,  8.45598057e-02],\n",
+       "                        [-5.77752071e-04, -3.07194218e-02, -3.13357264e-02, ...,\n",
+       "                          1.41118700e-03,  6.12614527e-02,  2.55001243e-02],\n",
+       "                        [-1.70748532e-02,  2.77932920e-02,  5.13067888e-03, ...,\n",
+       "                         -3.03416830e-02, -1.18992000e-03, -9.29238871e-02],\n",
+       "                        ...,\n",
+       "                        [ 6.08567186e-02, -3.09913028e-02,  6.24712817e-02, ...,\n",
+       "                          2.55415663e-02,  5.63996136e-02,  5.12658581e-02],\n",
+       "                        [-3.21428478e-03,  3.66793349e-02, -1.32496789e-01, ...,\n",
+       "                          4.32726927e-02,  3.97490151e-02, -9.73474830e-02],\n",
+       "                        [-1.93562526e-02, -8.61222204e-03, -3.43473293e-02, ...,\n",
+       "                         -7.81473890e-02,  2.80602742e-02, -2.07295921e-02]],\n",
+       "                \n",
+       "                       [[ 8.56459141e-02,  7.02582160e-03, -3.84326689e-02, ...,\n",
+       "                         -3.87096703e-02,  5.14100343e-02, -1.08823977e-01],\n",
+       "                        [ 3.11664082e-02,  5.39870076e-02, -3.77238803e-02, ...,\n",
+       "                         -7.26625845e-02, -8.51336494e-03,  2.42818613e-03],\n",
+       "                        [-9.49790236e-03, -2.87521519e-02,  7.47229755e-02, ...,\n",
+       "                         -3.13882641e-02,  3.28157991e-02, -8.38298276e-02],\n",
+       "                        ...,\n",
+       "                        [-5.39512420e-03,  2.12775674e-02, -8.39983523e-02, ...,\n",
+       "                          6.08833181e-03,  1.98775176e-02,  5.47741689e-02],\n",
+       "                        [ 1.73927955e-02, -1.89691111e-02, -7.81969577e-02, ...,\n",
+       "                         -1.51080592e-02, -1.12658530e-01,  3.66142765e-03],\n",
+       "                        [ 2.85869651e-02, -7.98759833e-02, -2.40408368e-02, ...,\n",
+       "                         -4.39561494e-02, -1.08551057e-02,  6.84287250e-02]],\n",
+       "                \n",
+       "                       [[-8.98210257e-02, -8.23260564e-03, -7.24420995e-02, ...,\n",
+       "                         -8.25054646e-02,  8.48042034e-03, -3.15508172e-02],\n",
+       "                        [-2.38543581e-02, -5.01328148e-02,  8.82579293e-03, ...,\n",
+       "                          1.87256172e-01,  3.01636308e-02,  1.17524453e-01],\n",
+       "                        [ 3.30534093e-02,  5.23727853e-03, -7.37811029e-02, ...,\n",
+       "                         -7.10760653e-02, -2.29823533e-02, -2.13149209e-02],\n",
+       "                        ...,\n",
+       "                        [-2.47698408e-02,  9.20365751e-02, -3.46506089e-02, ...,\n",
+       "                          5.87393865e-02, -1.65056158e-02, -5.69600463e-02],\n",
+       "                        [ 2.32015271e-02, -5.16756326e-02,  1.28099397e-01, ...,\n",
+       "                          1.12314336e-01,  2.16532238e-02, -6.47730455e-02],\n",
+       "                        [ 2.03323364e-02, -7.36131817e-02,  1.41372532e-02, ...,\n",
+       "                          1.25761315e-01,  4.53136163e-03,  3.45687717e-02]],\n",
+       "                \n",
+       "                       ...,\n",
+       "                \n",
+       "                       [[-9.56907310e-03, -9.95358732e-03,  3.63281965e-02, ...,\n",
+       "                          2.58678198e-02,  4.62427326e-02, -6.91857040e-02],\n",
+       "                        [-9.87947453e-03,  8.94671008e-02, -8.27581808e-03, ...,\n",
+       "                          3.94476205e-02,  5.41206822e-02, -1.00297781e-04],\n",
+       "                        [ 1.17582083e-02,  7.56660998e-02, -1.23020314e-01, ...,\n",
+       "                          4.89301793e-02, -9.47242454e-02,  3.28166457e-03],\n",
+       "                        ...,\n",
+       "                        [ 1.15716793e-01,  3.90926264e-02, -4.99027520e-02, ...,\n",
+       "                          8.36827308e-02,  2.90968139e-02, -1.35319196e-02],\n",
+       "                        [ 9.96496007e-02,  4.21701605e-03, -9.55350790e-03, ...,\n",
+       "                          2.05535050e-02, -5.73687628e-02, -4.45158668e-02],\n",
+       "                        [ 1.23274401e-02,  4.88903075e-02, -2.19891965e-02, ...,\n",
+       "                          2.60861218e-02,  5.44191115e-02,  5.99674210e-02]],\n",
+       "                \n",
+       "                       [[-1.65354963e-02,  6.05088361e-02, -1.34862944e-01, ...,\n",
+       "                         -5.98663576e-02,  3.65664996e-02, -1.03359101e-02],\n",
+       "                        [-9.25186276e-03, -2.66341027e-02,  1.94170848e-02, ...,\n",
+       "                          2.30957083e-02, -4.58738953e-02, -4.78612706e-02],\n",
+       "                        [ 2.87209991e-02,  1.50819980e-02,  2.55784392e-02, ...,\n",
+       "                          3.31534520e-02, -3.39708515e-02,  6.50511608e-02],\n",
+       "                        ...,\n",
+       "                        [-2.69539766e-02,  4.67734933e-02, -2.07383726e-02, ...,\n",
+       "                          2.51334589e-02,  7.85554647e-02, -4.04318161e-02],\n",
+       "                        [-5.97617403e-02, -5.09780608e-02, -4.87654544e-02, ...,\n",
+       "                          7.31536280e-03, -2.58004926e-02, -1.06805447e-03],\n",
+       "                        [ 6.96763117e-03, -2.40809843e-03,  5.32752043e-03, ...,\n",
+       "                          1.89656429e-02, -2.77937427e-02, -4.43040021e-03]],\n",
+       "                \n",
+       "                       [[ 1.08559877e-01,  5.06516881e-02,  4.46610991e-03, ...,\n",
+       "                          2.41088998e-02, -5.01579493e-02, -1.30853996e-01],\n",
+       "                        [ 2.72694021e-03,  4.16806415e-02,  2.18579862e-02, ...,\n",
+       "                          8.55507031e-02,  2.64558773e-02, -2.36834567e-02],\n",
+       "                        [ 9.53411013e-02, -2.69163363e-02,  4.98878472e-02, ...,\n",
+       "                          1.33439843e-02,  6.63656220e-02,  1.11669907e-02],\n",
+       "                        ...,\n",
+       "                        [ 1.26299094e-02, -9.85859185e-02, -1.44153526e-02, ...,\n",
+       "                         -1.92226265e-02,  7.13283569e-02, -1.10161053e-02],\n",
+       "                        [ 6.45558536e-02, -7.60441087e-03,  1.30066760e-02, ...,\n",
+       "                         -3.82443629e-02,  1.06134437e-01, -1.21100806e-01],\n",
+       "                        [-4.24301848e-02, -1.86020695e-02,  1.10428683e-01, ...,\n",
+       "                          2.61989217e-02, -1.09599389e-01,  8.63663629e-02]]],\n",
+       "                      dtype=float32)>\n",
+       "                (o): <tf.Variable 'transformer/layer_._1/rel_attn/o:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "                array([[[ 8.66029318e-03, -1.14577517e-01,  2.51828320e-03, ...,\n",
+       "                         -9.27881300e-02, -1.15491651e-01,  1.76676996e-02],\n",
+       "                        [-7.61712566e-02, -4.53079939e-02, -3.83440144e-02, ...,\n",
+       "                         -6.27577379e-02,  2.21626088e-03, -5.94992712e-02],\n",
+       "                        [-2.56332336e-03,  5.90471923e-02, -4.72475886e-02, ...,\n",
+       "                          3.67398188e-02, -7.33544538e-03,  3.78904641e-02],\n",
+       "                        ...,\n",
+       "                        [-2.13392675e-02,  2.53363270e-02,  6.85974360e-02, ...,\n",
+       "                          3.40457745e-02,  8.49376842e-02,  5.36587182e-03],\n",
+       "                        [ 1.60655994e-02, -7.56803527e-02,  4.73908894e-02, ...,\n",
+       "                          3.05386297e-02,  5.41357175e-02,  7.49823898e-02],\n",
+       "                        [ 4.58855778e-02,  3.71842496e-02,  7.53282160e-02, ...,\n",
+       "                          3.70172504e-03, -3.53820138e-02, -5.28645553e-02]],\n",
+       "                \n",
+       "                       [[-3.55167175e-03, -2.94522091e-04, -3.51395980e-02, ...,\n",
+       "                          3.41055691e-02,  3.03370338e-02, -5.06093465e-02],\n",
+       "                        [ 2.40699574e-02,  5.95200136e-02, -6.21140413e-02, ...,\n",
+       "                          1.14351902e-02,  1.85474288e-02,  9.06990189e-03],\n",
+       "                        [-1.19964657e-02,  8.26470368e-03,  7.37269372e-02, ...,\n",
+       "                         -1.01896927e-01, -1.25561088e-01,  5.12074912e-03],\n",
+       "                        ...,\n",
+       "                        [-1.59163550e-02,  4.47448492e-02, -5.62733822e-02, ...,\n",
+       "                         -1.58314186e-03,  3.07480115e-02,  2.12907395e-03],\n",
+       "                        [ 5.29436469e-02,  8.85004643e-03, -5.96460328e-03, ...,\n",
+       "                          3.14378440e-02, -4.15493660e-02, -2.16497947e-02],\n",
+       "                        [ 2.48335098e-04, -2.38254899e-03, -8.83876067e-03, ...,\n",
+       "                          1.26072252e-02, -3.53750363e-02,  3.07404995e-03]],\n",
+       "                \n",
+       "                       [[-8.30164403e-02, -2.34115589e-02, -4.61669937e-02, ...,\n",
+       "                         -6.64920658e-02,  6.33270964e-02, -1.78227499e-02],\n",
+       "                        [-7.69058391e-02, -7.60177821e-02,  3.90506051e-02, ...,\n",
+       "                          1.22973844e-02,  8.64065159e-03,  1.01280168e-01],\n",
+       "                        [-6.82748621e-04, -2.65821535e-02, -3.84966880e-02, ...,\n",
+       "                         -1.80162862e-02,  9.76960920e-03,  3.76105122e-02],\n",
+       "                        ...,\n",
+       "                        [-5.84762208e-02,  5.76327890e-02, -1.74372140e-02, ...,\n",
+       "                         -7.67533854e-02, -1.02110216e-02, -3.60212587e-02],\n",
+       "                        [-3.30317393e-02,  1.38184456e-02,  6.58438280e-02, ...,\n",
+       "                          1.21754026e-02,  1.70937050e-02, -1.40107097e-02],\n",
+       "                        [-5.16036898e-02, -6.22054636e-02,  1.16310194e-02, ...,\n",
+       "                          6.95217699e-02,  8.53841566e-03,  4.68714796e-02]],\n",
+       "                \n",
+       "                       ...,\n",
+       "                \n",
+       "                       [[ 1.17255980e-02,  7.38588301e-03,  2.76839491e-02, ...,\n",
+       "                          1.90327652e-02,  5.16140573e-02, -1.37946710e-01],\n",
+       "                        [ 2.57208347e-02,  1.09104672e-02,  3.15251462e-02, ...,\n",
+       "                          4.07493114e-02,  5.25305085e-02,  3.15010697e-02],\n",
+       "                        [ 1.89815201e-02,  6.16960227e-02,  3.34828347e-02, ...,\n",
+       "                         -1.66332368e-02, -9.41335633e-02, -3.90448980e-02],\n",
+       "                        ...,\n",
+       "                        [ 8.98937732e-02, -3.22609837e-03, -6.63657114e-02, ...,\n",
+       "                          3.03167403e-02, -6.76293130e-05,  5.02400473e-03],\n",
+       "                        [ 5.70965782e-02,  7.24036619e-03,  3.85382585e-03, ...,\n",
+       "                          9.01868120e-02, -5.91169717e-03, -6.02913462e-02],\n",
+       "                        [-5.98075092e-02, -3.06096841e-02, -1.54292081e-02, ...,\n",
+       "                          6.55795634e-02,  3.12577635e-02,  9.34221670e-02]],\n",
+       "                \n",
+       "                       [[-3.18901590e-03,  1.63269453e-02, -3.31503851e-03, ...,\n",
+       "                         -8.52069855e-02,  5.58818225e-03,  4.01768200e-02],\n",
+       "                        [ 1.10879391e-02,  3.53012718e-02,  6.00853097e-03, ...,\n",
+       "                          8.96103773e-03, -2.04980783e-02, -1.00578843e-02],\n",
+       "                        [ 6.01615310e-02,  7.26685487e-03, -1.52228177e-02, ...,\n",
+       "                          1.37231862e-02, -2.04465948e-02, -1.61056891e-02],\n",
+       "                        ...,\n",
+       "                        [-5.08951209e-02,  1.84552092e-02, -5.32345055e-03, ...,\n",
+       "                         -2.72054737e-03,  6.48149550e-02,  7.55127743e-02],\n",
+       "                        [ 1.13570224e-02, -1.89477820e-02,  2.59459894e-02, ...,\n",
+       "                         -3.25487554e-02, -5.39538898e-02, -4.34179567e-02],\n",
+       "                        [-1.20608704e-02, -5.62019320e-03, -1.85313057e-02, ...,\n",
+       "                          2.01634150e-02,  1.00505576e-02, -1.57885384e-02]],\n",
+       "                \n",
+       "                       [[-4.44078520e-02,  6.07606210e-03, -2.59394348e-02, ...,\n",
+       "                         -7.71517456e-02, -8.42755064e-02, -1.66165549e-02],\n",
+       "                        [ 1.88575257e-02,  3.10134366e-02,  3.20087746e-02, ...,\n",
+       "                          4.75202836e-02,  2.75874902e-02,  5.98586611e-02],\n",
+       "                        [ 1.48858996e-02, -2.13626288e-02, -1.11806169e-01, ...,\n",
+       "                         -3.95744778e-02, -1.11924306e-01, -4.32251021e-02],\n",
+       "                        ...,\n",
+       "                        [-3.16806063e-02,  6.08082600e-02,  5.26219085e-02, ...,\n",
+       "                         -2.04716958e-02,  3.42884101e-02,  1.69068556e-02],\n",
+       "                        [ 9.24186129e-03,  2.30468120e-02,  1.84935275e-02, ...,\n",
+       "                          3.59074026e-02,  5.17238043e-02,  1.21195316e-02],\n",
+       "                        [-2.55695079e-02,  2.09787451e-02, -8.66606180e-03, ...,\n",
+       "                          5.14007397e-02, -2.81591658e-02,  8.15731846e-03]]],\n",
+       "                      dtype=float32)>\n",
+       "                (r): <tf.Variable 'transformer/layer_._1/rel_attn/r:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "                array([[[-1.46897674e-01,  1.74011409e-01, -2.07041457e-01, ...,\n",
+       "                          2.09365278e-01,  7.04047009e-02, -1.94730520e-01],\n",
+       "                        [-1.91919565e-01, -1.88010305e-01, -1.38464078e-01, ...,\n",
+       "                          1.75045997e-01,  1.83993801e-01, -1.66332796e-01],\n",
+       "                        [-1.87968820e-01,  1.81354731e-01, -1.86937690e-01, ...,\n",
+       "                         -1.73305765e-01,  1.42847419e-01,  1.37066424e-01],\n",
+       "                        ...,\n",
+       "                        [-1.81287214e-01,  1.93034187e-01,  2.10268214e-01, ...,\n",
+       "                          2.11266726e-01,  2.23274544e-01,  2.13569388e-01],\n",
+       "                        [-1.77906901e-01,  1.88187703e-01,  2.09059939e-01, ...,\n",
+       "                          2.07140788e-01,  2.14991555e-01, -2.00226620e-01],\n",
+       "                        [ 1.72938675e-01,  1.84366092e-01,  2.02027947e-01, ...,\n",
+       "                          1.92545146e-01, -1.70009255e-01,  1.74475133e-01]],\n",
+       "                \n",
+       "                       [[-9.72831920e-02,  1.58304572e-01, -1.73237279e-01, ...,\n",
+       "                          1.58044904e-01,  5.10960259e-02, -1.99876621e-01],\n",
+       "                        [-1.29664943e-01, -1.37299687e-01, -1.13309212e-01, ...,\n",
+       "                          1.44313514e-01,  1.40009508e-01, -1.26466140e-01],\n",
+       "                        [-1.62108094e-01,  1.70799494e-01, -1.40059158e-01, ...,\n",
+       "                         -1.51002154e-01,  8.46845284e-02,  1.36088893e-01],\n",
+       "                        ...,\n",
+       "                        [-1.32899761e-01,  1.71471238e-01,  1.51986942e-01, ...,\n",
+       "                          1.66069463e-01,  1.65516198e-01,  1.63684517e-01],\n",
+       "                        [-1.30655318e-01,  1.75758496e-01,  1.73514783e-01, ...,\n",
+       "                          1.73679933e-01,  1.55112520e-01, -1.70741528e-01],\n",
+       "                        [ 1.23091467e-01,  1.46520704e-01,  1.53373584e-01, ...,\n",
+       "                          1.40420586e-01, -1.25283971e-01,  1.81063727e-01]],\n",
+       "                \n",
+       "                       [[-8.82046670e-02,  1.20563805e-01, -1.54819176e-01, ...,\n",
+       "                          1.37534931e-01,  7.11622387e-02, -1.69938922e-01],\n",
+       "                        [-1.27852052e-01, -1.35840997e-01, -8.00763592e-02, ...,\n",
+       "                          1.18804909e-01,  1.17752388e-01, -6.82469532e-02],\n",
+       "                        [-1.27978489e-01,  1.30864084e-01, -1.21015176e-01, ...,\n",
+       "                         -1.36511073e-01,  9.61252674e-02,  8.98678079e-02],\n",
+       "                        ...,\n",
+       "                        [-1.27951488e-01,  1.54330939e-01,  1.37083441e-01, ...,\n",
+       "                          1.36708304e-01,  1.42049015e-01,  1.24714136e-01],\n",
+       "                        [-8.22131708e-02,  8.92748907e-02,  1.30160138e-01, ...,\n",
+       "                          1.36945337e-01,  1.26669794e-01, -1.22825712e-01],\n",
+       "                        [ 1.11137711e-01,  1.09357782e-01,  1.39476791e-01, ...,\n",
+       "                          1.16972752e-01, -1.02480344e-01,  1.31967843e-01]],\n",
+       "                \n",
+       "                       ...,\n",
+       "                \n",
+       "                       [[ 9.53109644e-04,  2.36279629e-02,  2.00178288e-03, ...,\n",
+       "                          5.88640803e-03,  3.05523304e-03, -7.16660544e-03],\n",
+       "                        [-1.66137051e-02,  2.43202504e-02,  1.39665473e-02, ...,\n",
+       "                          1.29140597e-02,  3.85063398e-03,  8.05215444e-03],\n",
+       "                        [-1.17559778e-03,  1.35235796e-02,  1.29539445e-02, ...,\n",
+       "                          1.29707437e-02,  5.79934474e-03, -1.83496403e-03],\n",
+       "                        ...,\n",
+       "                        [-4.06753412e-03,  5.26591064e-03, -8.99039581e-03, ...,\n",
+       "                          4.24702466e-02,  2.50355471e-02, -1.18161682e-02],\n",
+       "                        [ 1.86481122e-02,  4.72524873e-04, -2.97491509e-03, ...,\n",
+       "                         -7.89663754e-04,  1.45817995e-02,  1.99292991e-02],\n",
+       "                        [ 6.24428876e-03,  4.76739649e-03, -2.52191699e-03, ...,\n",
+       "                          1.14012184e-03,  1.34989284e-02,  2.64687147e-02]],\n",
+       "                \n",
+       "                       [[ 1.98490229e-02,  1.32721895e-02,  2.04636739e-03, ...,\n",
+       "                         -1.59615539e-02,  3.51932757e-02,  1.42656248e-02],\n",
+       "                        [-4.00670309e-04, -3.32874944e-04,  2.40566581e-02, ...,\n",
+       "                          1.08023062e-02, -1.90807581e-02, -5.00886608e-03],\n",
+       "                        [-1.52654015e-02,  1.49440160e-02, -2.63901725e-02, ...,\n",
+       "                         -1.51216965e-02,  6.56380411e-03, -1.47011476e-02],\n",
+       "                        ...,\n",
+       "                        [-2.04982725e-03, -1.84093118e-02, -8.56019929e-03, ...,\n",
+       "                         -5.50516229e-03, -1.67570729e-02,  1.74919405e-04],\n",
+       "                        [-9.94952582e-03, -4.25786190e-02, -1.12591460e-02, ...,\n",
+       "                         -1.10278605e-02, -1.64491571e-02,  8.36265925e-03],\n",
+       "                        [ 2.35332940e-02, -4.40680422e-03, -1.85185752e-03, ...,\n",
+       "                          1.28285857e-02, -3.74334864e-02, -6.49360567e-03]],\n",
+       "                \n",
+       "                       [[-4.03778590e-02,  3.10220500e-03, -3.23167108e-02, ...,\n",
+       "                          1.71264191e-03,  5.96588850e-03, -2.12317165e-02],\n",
+       "                        [-2.02080980e-02, -7.53459148e-03, -4.10040235e-03, ...,\n",
+       "                          3.79406707e-03,  2.68777627e-02, -1.61216389e-02],\n",
+       "                        [-4.50483896e-03,  7.15539558e-03, -9.55935009e-03, ...,\n",
+       "                         -4.80790297e-03,  2.41799094e-03, -3.76463821e-03],\n",
+       "                        ...,\n",
+       "                        [-1.57353263e-02,  8.99432600e-03,  5.29706152e-03, ...,\n",
+       "                          1.19281923e-02,  9.35687870e-03, -2.13156436e-02],\n",
+       "                        [ 8.13638791e-03,  9.65433847e-03, -9.12594423e-03, ...,\n",
+       "                          2.02135020e-03, -4.37395182e-03, -6.05759968e-04],\n",
+       "                        [-2.53979210e-02,  8.30472796e-04,  1.21758673e-02, ...,\n",
+       "                          8.98340251e-03,  2.04570275e-02,  8.64630472e-03]]],\n",
+       "                      dtype=float32)>\n",
+       "                (r_r_bias): <tf.Variable 'transformer/layer_._1/rel_attn/r_r_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "                array([[ 0.14899914, -0.34153602,  0.3803297 ,  0.36917952, -0.38786203,\n",
+       "                        -0.13080384,  0.344216  , -0.35379156, -0.3844165 , -0.36286288,\n",
+       "                        -0.08941454,  0.37458393],\n",
+       "                       [ 0.33911064,  0.32911122,  0.31310028,  0.29833585, -0.30792385,\n",
+       "                         0.33739606, -0.32293308,  0.3369534 , -0.31201705, -0.3280124 ,\n",
+       "                        -0.32297572,  0.3089489 ],\n",
+       "                       [ 0.36541435, -0.36004987,  0.35938582, -0.36907914,  0.3486618 ,\n",
+       "                        -0.0593513 , -0.34139338,  0.35678086, -0.36190793,  0.34279796,\n",
+       "                        -0.31591862, -0.29939887],\n",
+       "                       [-0.28541145, -0.28479883,  0.2857083 ,  0.29083747, -0.28382772,\n",
+       "                        -0.27742648,  0.27382922, -0.262767  , -0.28953055,  0.22580072,\n",
+       "                         0.2792229 ,  0.26833603],\n",
+       "                       [-0.31788912,  0.32046515,  0.30290008,  0.31088528, -0.31547454,\n",
+       "                         0.30249548, -0.26167852,  0.30141065, -0.32778227,  0.30795413,\n",
+       "                        -0.31171426, -0.25726327],\n",
+       "                       [ 0.314079  , -0.30792624, -0.3221542 , -0.30551824,  0.24594624,\n",
+       "                         0.31892028, -0.3053024 , -0.00082669,  0.29853317, -0.29422322,\n",
+       "                         0.30099693,  0.2978344 ],\n",
+       "                       [-0.37505603,  0.3527668 , -0.35440302,  0.30887768,  0.35537973,\n",
+       "                         0.34240764, -0.36563224, -0.32328182,  0.3066197 ,  0.3783165 ,\n",
+       "                         0.36704957, -0.07152183],\n",
+       "                       [-0.24481814, -0.25152895, -0.26902637, -0.25899634,  0.26075813,\n",
+       "                         0.25052536, -0.18769039,  0.24073453, -0.23911558, -0.264942  ,\n",
+       "                        -0.24604012, -0.25978062],\n",
+       "                       [ 0.3448066 ,  0.35508814,  0.3277917 , -0.36480623, -0.36373508,\n",
+       "                         0.34252417, -0.26490748, -0.3698438 , -0.37082767, -0.38157573,\n",
+       "                        -0.35605282, -0.34466416],\n",
+       "                       [ 0.30798635,  0.36460385, -0.3754039 ,  0.3400862 , -0.35259473,\n",
+       "                         0.34701774,  0.18916364, -0.3498748 , -0.356646  , -0.36569807,\n",
+       "                        -0.36399728, -0.30652383],\n",
+       "                       [ 0.25416747, -0.27864173,  0.24143916,  0.2589485 ,  0.26826364,\n",
+       "                        -0.276374  ,  0.28044358, -0.26923546, -0.23912592, -0.272487  ,\n",
+       "                        -0.26509777,  0.27066582],\n",
+       "                       [-0.2960118 , -0.29988503, -0.29283497,  0.2847119 ,  0.30326426,\n",
+       "                        -0.29098433,  0.29103255, -0.29597896,  0.27998862,  0.29750696,\n",
+       "                         0.3016155 , -0.2862795 ],\n",
+       "                       [-0.33974963, -0.3114596 , -0.3245498 , -0.33191413, -0.26564565,\n",
+       "                        -0.31937695,  0.32511777, -0.3418174 ,  0.3280482 , -0.32252905,\n",
+       "                         0.31764168, -0.3219256 ],\n",
+       "                       [ 0.36129203, -0.3835813 , -0.34948146, -0.38187614, -0.10551658,\n",
+       "                        -0.35736713,  0.36742166, -0.10739829,  0.3812859 , -0.38279817,\n",
+       "                        -0.38232875, -0.37825328],\n",
+       "                       [ 0.3321833 , -0.33618993, -0.35035315, -0.11618523, -0.31958073,\n",
+       "                        -0.34353533, -0.3631967 , -0.32926843, -0.3406108 , -0.40713176,\n",
+       "                        -0.35072395,  0.3597266 ],\n",
+       "                       [-0.35400867, -0.35107192, -0.37232462, -0.37361598,  0.36000717,\n",
+       "                        -0.33463717,  0.38095737, -0.34364143, -0.33852988, -0.35104772,\n",
+       "                         0.2981984 , -0.3554742 ]], dtype=float32)>\n",
+       "                (r_s_bias): <tf.Variable 'transformer/layer_._1/rel_attn/r_s_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "                array([[0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.]], dtype=float32)>\n",
+       "                (r_w_bias): <tf.Variable 'transformer/layer_._1/rel_attn/r_w_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "                array([[-4.62216102e-02,  1.16589062e-01, -1.36763275e-01,\n",
+       "                        -1.22126430e-01,  1.48961708e-01,  1.45974793e-02,\n",
+       "                        -1.61591738e-01,  1.87203407e-01,  2.07243934e-01,\n",
+       "                         1.52396217e-01,  2.49146335e-02, -2.02902481e-01],\n",
+       "                       [-1.07586920e-01, -1.06996477e-01, -7.84136206e-02,\n",
+       "                        -5.37643544e-02,  8.04927945e-02, -1.09561071e-01,\n",
+       "                         1.08106196e-01, -1.32538766e-01,  9.16128457e-02,\n",
+       "                         6.15168475e-02,  6.16029464e-02, -6.31495491e-02],\n",
+       "                       [-1.13178924e-01,  1.40476599e-01, -1.35648683e-01,\n",
+       "                         1.80651262e-01, -9.42587331e-02,  4.49052267e-02,\n",
+       "                         1.27758279e-01, -3.65762338e-02,  1.44819573e-01,\n",
+       "                        -1.08886130e-01,  7.25614876e-02,  5.72540285e-03],\n",
+       "                       [ 1.28033966e-01,  4.27292474e-02, -5.35008721e-02,\n",
+       "                        -1.09917521e-01,  4.55539674e-02,  9.57781374e-02,\n",
+       "                        -1.04749307e-01,  5.18838726e-02,  8.35832134e-02,\n",
+       "                        -1.41942231e-02, -7.90465996e-02, -1.42346501e-01],\n",
+       "                       [ 7.61313289e-02, -4.59336676e-02, -1.19175784e-01,\n",
+       "                        -8.25000405e-02,  1.09469183e-01, -1.36095643e-01,\n",
+       "                         2.47284826e-02, -2.28797179e-02,  1.37981102e-01,\n",
+       "                        -1.14949889e-01,  4.44846004e-02,  3.99738923e-02],\n",
+       "                       [-1.65838182e-01,  9.48740020e-02,  1.44404322e-01,\n",
+       "                         8.53616223e-02, -2.70830076e-02, -6.19642437e-02,\n",
+       "                         8.94338936e-02,  7.70374341e-03, -8.17450806e-02,\n",
+       "                         1.17244996e-01, -7.69629925e-02, -1.09416604e-01],\n",
+       "                       [ 1.57854617e-01, -1.56897545e-01,  1.29691288e-01,\n",
+       "                        -8.42681080e-02, -8.85965973e-02, -1.28146768e-01,\n",
+       "                         8.91689807e-02,  1.08561374e-01, -9.64733809e-02,\n",
+       "                        -1.55561730e-01, -8.79286975e-02, -1.13232369e-02],\n",
+       "                       [ 7.38919228e-02,  1.09030314e-01,  6.82480931e-02,\n",
+       "                         5.55296168e-02, -6.17072172e-02, -1.04720660e-01,\n",
+       "                        -6.92145200e-03, -3.91406119e-02,  4.73909490e-02,\n",
+       "                         7.34069794e-02,  5.68175763e-02,  4.85593155e-02],\n",
+       "                       [-1.74990490e-01, -1.20659910e-01, -1.35730013e-01,\n",
+       "                         1.51203781e-01,  1.48414791e-01, -7.34399632e-02,\n",
+       "                         7.54770786e-02,  2.29218081e-01,  9.63332728e-02,\n",
+       "                         1.05563387e-01,  1.79456845e-01,  1.29063517e-01],\n",
+       "                       [-4.34173606e-02, -1.30563438e-01,  1.60625249e-01,\n",
+       "                        -1.41897142e-01,  1.51958242e-01, -6.46752417e-02,\n",
+       "                         1.28286381e-04,  5.29836081e-02,  1.19528137e-01,\n",
+       "                         2.21275479e-01,  1.76483870e-01,  5.65731786e-02],\n",
+       "                       [ 7.86350667e-03,  1.22386105e-01, -3.76115479e-02,\n",
+       "                        -3.60284224e-02, -9.76402089e-02,  1.65668249e-01,\n",
+       "                        -8.34911838e-02,  7.12872595e-02,  3.44360694e-02,\n",
+       "                         7.70075917e-02,  6.81297109e-02, -3.08290645e-02],\n",
+       "                       [ 1.20040596e-01,  6.12675473e-02,  1.29310817e-01,\n",
+       "                        -7.74290562e-02, -7.78047889e-02,  8.89190733e-02,\n",
+       "                        -3.96793000e-02,  7.09067658e-02, -7.84836560e-02,\n",
+       "                        -5.97045012e-02, -5.77512644e-02,  1.05530277e-01],\n",
+       "                       [ 5.21370508e-02,  9.81653333e-02,  1.14423938e-01,\n",
+       "                         1.14286542e-01,  5.82821295e-02,  1.18820079e-01,\n",
+       "                        -8.86438638e-02,  5.43031134e-02, -8.52945074e-02,\n",
+       "                         8.23517442e-02, -9.12688896e-02,  3.97731513e-02],\n",
+       "                       [-9.26975161e-02,  1.76723376e-01,  1.12929732e-01,\n",
+       "                         1.46531433e-01,  9.49880015e-03,  1.27589166e-01,\n",
+       "                        -2.04214618e-01,  3.05328611e-03, -1.69557929e-01,\n",
+       "                         1.36818811e-01,  9.52240303e-02,  2.15536699e-01],\n",
+       "                       [-5.74819483e-02,  5.62564880e-02,  1.98273271e-01,\n",
+       "                        -1.17968698e-03,  1.26326323e-01,  1.54033735e-01,\n",
+       "                         1.18295722e-01,  4.89505827e-02,  1.98732257e-01,\n",
+       "                         1.31851271e-01,  1.58291176e-01, -1.05149098e-01],\n",
+       "                       [ 8.80631879e-02,  1.58400908e-01,  1.52702242e-01,\n",
+       "                         1.10614061e-01, -8.25159028e-02,  2.31264345e-02,\n",
+       "                        -1.75350800e-01,  9.48455557e-02,  8.91729742e-02,\n",
+       "                         1.68625101e-01, -4.55371849e-02,  1.06890120e-01]], dtype=float32)>\n",
+       "                (seg_embed): <tf.Variable 'transformer/layer_._1/rel_attn/seg_embed:0' shape=(2, 16, 12) dtype=float32, numpy=\n",
+       "                array([[[ 7.61602633e-03, -1.85396653e-02,  1.41175482e-02,\n",
+       "                          1.02747520e-02, -1.02692777e-02, -5.79114538e-03,\n",
+       "                         -2.25887215e-03,  1.97049114e-03,  5.02155814e-03,\n",
+       "                         -6.39485754e-03, -4.06287983e-03,  1.60969961e-02],\n",
+       "                        [-1.68735627e-02, -4.82341414e-03,  6.73457189e-03,\n",
+       "                          9.00006853e-04, -2.81745940e-03, -5.75073343e-03,\n",
+       "                          6.85399212e-03, -3.11884983e-03,  1.24747735e-02,\n",
+       "                         -5.00333635e-03,  1.04523534e-02, -9.33902338e-03],\n",
+       "                        [ 3.03338887e-03,  1.81995309e-03, -4.44657216e-03,\n",
+       "                         -6.89545879e-04,  8.68439456e-05,  4.08066344e-03,\n",
+       "                          6.55966694e-04, -1.95205770e-02, -2.45983759e-03,\n",
+       "                          2.33589532e-03,  3.92747996e-03, -1.79917943e-02],\n",
+       "                        [-7.01340672e-04,  1.79661233e-02, -1.47282165e-02,\n",
+       "                         -1.05006841e-03,  1.18477382e-02,  4.56858613e-03,\n",
+       "                         -1.35715781e-02,  1.63909830e-02, -1.83726789e-03,\n",
+       "                         -4.62263270e-05, -1.51350088e-02,  1.84442364e-02],\n",
+       "                        [ 3.17642442e-03, -1.64884496e-02,  1.18464208e-03,\n",
+       "                          6.03873935e-03,  1.23784514e-02, -6.32783957e-03,\n",
+       "                          3.94236110e-03,  7.08509982e-03,  1.44205999e-03,\n",
+       "                          8.04485381e-03,  3.18194245e-04, -3.99992894e-03],\n",
+       "                        [-1.37944268e-02, -4.84130438e-03,  1.68232359e-02,\n",
+       "                          1.21006211e-02,  1.01589188e-02, -8.44671298e-03,\n",
+       "                         -1.34035468e-03, -2.33793142e-03,  1.44077949e-02,\n",
+       "                          1.12157769e-03,  9.63134400e-04, -1.19164761e-03],\n",
+       "                        [-5.74960979e-03,  6.86749723e-03,  1.20431418e-02,\n",
+       "                         -4.14077239e-03, -1.14332717e-02,  1.46603184e-02,\n",
+       "                         -2.92793987e-03, -5.18011584e-05,  5.89169236e-03,\n",
+       "                          5.62065002e-03, -1.54455882e-02, -1.93359759e-02],\n",
+       "                        [-1.32184587e-02, -8.09574313e-03,  1.73612162e-02,\n",
+       "                          1.75058469e-02,  1.21301925e-02,  1.62602477e-02,\n",
+       "                         -1.33753968e-02,  3.75581020e-03, -4.20281896e-03,\n",
+       "                          1.55054042e-02, -1.15841664e-02, -2.08650995e-03],\n",
+       "                        [ 7.34686246e-03,  1.02794832e-02,  1.31241558e-03,\n",
+       "                          2.87566753e-03,  5.84390247e-03,  3.02153081e-03,\n",
+       "                         -7.33443536e-03, -7.87269603e-03,  4.51662997e-03,\n",
+       "                          2.32343981e-03,  9.98496637e-03, -9.53329075e-03],\n",
+       "                        [ 9.44391824e-03, -1.56681787e-03,  5.64246729e-04,\n",
+       "                          8.50769039e-03, -5.61839016e-03,  1.00806393e-02,\n",
+       "                          4.45341272e-03,  1.17781861e-02, -9.62750241e-03,\n",
+       "                          1.01322914e-02,  1.13904784e-02, -2.56038038e-03],\n",
+       "                        [-6.31258730e-03, -7.30622979e-03, -4.83252574e-03,\n",
+       "                          1.29672261e-02, -2.86618783e-03, -6.99736294e-04,\n",
+       "                          8.63193162e-03,  1.24630332e-02, -1.86973754e-02,\n",
+       "                          9.60467104e-03,  4.52060765e-03,  7.15382455e-04],\n",
+       "                        [ 6.44308235e-03,  9.21295118e-03, -1.06562199e-02,\n",
+       "                          5.58915641e-03,  5.59847150e-03, -1.35788438e-03,\n",
+       "                         -9.19332448e-03, -2.69832183e-03, -3.68528347e-03,\n",
+       "                          1.15745421e-02, -1.17136361e-02, -1.45567106e-02],\n",
+       "                        [ 2.83513777e-03,  3.74191441e-04, -1.22113694e-02,\n",
+       "                          6.28614333e-03,  7.08920229e-03, -8.08887556e-03,\n",
+       "                          1.31595219e-02,  1.39163062e-03, -3.51439044e-03,\n",
+       "                         -4.80555138e-03,  1.24805709e-02,  4.39498993e-03],\n",
+       "                        [-6.46104245e-03, -1.21651953e-02,  4.77740867e-03,\n",
+       "                          1.86753627e-02,  6.51393831e-03,  5.62973600e-03,\n",
+       "                         -8.28108564e-03, -4.60683648e-03, -2.26973137e-03,\n",
+       "                          1.69612304e-03,  1.37645304e-02,  4.08384204e-03],\n",
+       "                        [ 1.00966161e-02,  4.48917999e-04, -7.04559498e-03,\n",
+       "                          8.03261995e-03, -8.51394236e-03, -1.22877944e-03,\n",
+       "                          1.14519382e-02,  1.36096608e-02,  1.72907033e-03,\n",
+       "                          7.85259437e-03,  1.05255041e-02,  8.69190600e-03],\n",
+       "                        [-8.03734455e-03, -1.39566569e-03,  2.11605406e-03,\n",
+       "                         -1.92271248e-02,  6.85958471e-03,  4.88640182e-03,\n",
+       "                         -1.38192775e-03, -1.90305218e-04,  4.97502321e-03,\n",
+       "                         -2.50085886e-03, -7.32155377e-03, -1.67938080e-02]],\n",
+       "                \n",
+       "                       [[ 1.62638456e-03,  2.68377247e-03,  3.17260344e-03,\n",
+       "                          5.79241151e-03, -7.17955036e-03,  8.01912975e-03,\n",
+       "                         -1.63808875e-02, -9.24083032e-03,  3.45636159e-03,\n",
+       "                         -1.23387324e-02, -7.20368931e-04, -9.56835225e-03],\n",
+       "                        [ 9.82169900e-03,  1.30084464e-02, -8.22803937e-03,\n",
+       "                          6.71537360e-04,  9.21022613e-03,  1.52312005e-02,\n",
+       "                         -5.26927318e-03,  1.06863305e-02,  2.06984673e-03,\n",
+       "                         -3.76264495e-03,  7.69555243e-07, -4.93265106e-04],\n",
+       "                        [ 2.69030291e-03,  1.87809858e-02,  6.67323358e-03,\n",
+       "                         -4.26321942e-03,  4.72564157e-03, -1.31812878e-02,\n",
+       "                         -7.40861241e-03, -2.29317695e-03, -1.57082290e-03,\n",
+       "                         -1.32690351e-02, -1.30699258e-02,  1.92320778e-03],\n",
+       "                        [ 9.12022125e-03, -5.23217348e-03, -2.81146332e-03,\n",
+       "                         -4.00763704e-03,  5.03227348e-03,  5.72717097e-03,\n",
+       "                          2.91952444e-03,  1.11247518e-03,  9.63956481e-05,\n",
+       "                         -4.55610408e-03, -8.37675110e-03,  1.22519284e-02],\n",
+       "                        [-1.25213778e-02,  8.71963392e-04,  5.76882577e-03,\n",
+       "                         -9.85392556e-03,  5.49371168e-03, -1.67311262e-02,\n",
+       "                          5.46998065e-03,  4.39474359e-03,  2.89234682e-03,\n",
+       "                          6.99596014e-03,  6.47728844e-03, -1.53464787e-02],\n",
+       "                        [-1.01970322e-02, -1.51678976e-02,  6.84761163e-03,\n",
+       "                         -1.76049639e-02, -6.48754463e-03, -7.78641377e-04,\n",
+       "                         -1.47116324e-02,  5.12523763e-03, -2.96233199e-03,\n",
+       "                          7.93477241e-03,  1.36973644e-02,  1.22740660e-02],\n",
+       "                        [-3.13485460e-03, -1.59246139e-02, -2.70899059e-03,\n",
+       "                          5.44029754e-03,  7.52424821e-03,  7.31652137e-03,\n",
+       "                          8.10533017e-03, -1.90883912e-02,  5.15720714e-03,\n",
+       "                          3.53280571e-04,  6.17373036e-03,  1.06591405e-03],\n",
+       "                        [-1.56332664e-02,  1.97712099e-04,  2.64872634e-03,\n",
+       "                          3.45370430e-03, -4.22930811e-03,  1.24690169e-02,\n",
+       "                          5.05634700e-04,  1.37720944e-03, -6.16728095e-03,\n",
+       "                         -7.40552146e-04,  1.39584523e-02, -7.06139440e-03],\n",
+       "                        [ 9.77421529e-04,  3.80252837e-03, -7.89496861e-03,\n",
+       "                         -1.29530979e-02,  1.14574879e-02, -2.45792069e-03,\n",
+       "                          3.06926225e-03,  4.14119754e-03,  8.37595493e-04,\n",
+       "                         -6.71465555e-03,  1.04225632e-02,  8.42171349e-03],\n",
+       "                        [ 1.56976059e-02, -4.26411582e-03, -1.29620070e-02,\n",
+       "                          1.14640398e-02, -1.17234429e-02, -2.09121429e-03,\n",
+       "                          5.49160130e-03,  9.51116718e-03, -2.61860876e-03,\n",
+       "                          1.29721547e-03,  5.72805619e-03, -1.54486364e-02],\n",
+       "                        [-3.25736636e-03,  1.26759680e-02,  1.27404844e-02,\n",
+       "                          1.17001981e-02, -1.16444677e-02, -9.64581780e-03,\n",
+       "                         -2.40927562e-03, -5.55342529e-03,  9.27424431e-03,\n",
+       "                         -1.71160791e-04,  1.56472288e-02, -6.92155631e-03],\n",
+       "                        [ 7.27083022e-03, -4.46589151e-03,  1.09822885e-03,\n",
+       "                          2.19783024e-03, -8.46979953e-03, -1.37587897e-02,\n",
+       "                          8.10799282e-03, -7.17377802e-03,  8.80086981e-03,\n",
+       "                         -7.99593702e-03,  6.07788330e-03, -7.93825951e-04],\n",
+       "                        [ 1.49642804e-03, -1.11999689e-02,  4.39703232e-03,\n",
+       "                          4.85239923e-03,  1.54058973e-03, -1.47980507e-02,\n",
+       "                         -6.85563916e-03,  6.63761189e-03, -1.56310081e-04,\n",
+       "                         -6.49932865e-03,  3.30587942e-03, -1.08573148e-02],\n",
+       "                        [-2.20668572e-03,  4.14557988e-03, -1.93234999e-02,\n",
+       "                         -5.82999643e-03,  3.43196769e-03,  5.27025107e-03,\n",
+       "                          8.35015997e-03, -4.63553797e-03, -6.61056815e-03,\n",
+       "                         -3.66679509e-03,  4.02782438e-03, -3.52020166e-03],\n",
+       "                        [ 6.47542719e-03,  9.46311373e-03, -5.95815713e-03,\n",
+       "                         -3.98951210e-03, -1.26922242e-02, -8.83757137e-04,\n",
+       "                         -5.64072188e-03,  1.16748745e-02,  2.87583284e-03,\n",
+       "                         -2.04839162e-03, -9.87775158e-03,  8.34393501e-03],\n",
+       "                        [-5.55553939e-03, -2.07615201e-03, -5.13571315e-03,\n",
+       "                         -1.45472540e-02, -1.17446017e-02, -1.51618780e-03,\n",
+       "                         -2.92225089e-03, -1.33080781e-02, -6.99464139e-03,\n",
+       "                         -1.41988527e-02, -1.21150836e-02,  1.95427015e-02]]],\n",
+       "                      dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (ff): TFXLNetFeedForward(\n",
+       "                (layer_norm): LayerNormalization(\n",
+       "                  (axis): List(\n",
+       "                    (0): 2\n",
+       "                  )\n",
+       "                  (gamma): <tf.Variable 'transformer/layer_._1/ff/layer_norm/gamma:0' shape=(192,) dtype=float32, numpy=\n",
+       "                  array([1.0242676 , 1.0201554 , 0.981655  , 1.022025  , 1.007073  ,\n",
+       "                         1.045315  , 1.0340022 , 1.0059034 , 0.99349135, 1.0217655 ,\n",
+       "                         1.0187205 , 1.025378  , 0.994724  , 1.0449401 , 0.9978945 ,\n",
+       "                         0.9911819 , 1.0020549 , 0.9941773 , 1.0036273 , 1.0188001 ,\n",
+       "                         1.0051787 , 1.1197566 , 1.02651   , 1.0183053 , 0.98811615,\n",
+       "                         0.99960953, 0.9662069 , 1.023346  , 1.0210128 , 1.0216892 ,\n",
+       "                         0.9806572 , 1.0309644 , 1.0199112 , 1.0103893 , 0.9986699 ,\n",
+       "                         1.0303093 , 1.0149937 , 1.0205405 , 1.0189662 , 0.9963332 ,\n",
+       "                         1.0298607 , 1.0065924 , 1.0308235 , 1.0236278 , 1.0338595 ,\n",
+       "                         0.9944997 , 1.0148902 , 1.0015576 , 1.0081712 , 1.0300711 ,\n",
+       "                         1.0326444 , 0.9802065 , 1.031543  , 1.0039631 , 1.025484  ,\n",
+       "                         1.0000758 , 0.9787232 , 0.99785537, 1.0325978 , 0.9884796 ,\n",
+       "                         1.018895  , 0.98055667, 1.0263902 , 1.0205623 , 1.0014325 ,\n",
+       "                         1.0014066 , 0.98294795, 1.0587208 , 1.0157356 , 1.0120552 ,\n",
+       "                         1.0324315 , 1.0007839 , 0.99985874, 1.0201912 , 1.0071391 ,\n",
+       "                         1.00749   , 0.9991882 , 1.0052526 , 0.9652451 , 1.0244923 ,\n",
+       "                         1.0113801 , 0.9739409 , 0.9995484 , 1.0089414 , 1.0357728 ,\n",
+       "                         1.0092472 , 1.0074127 , 0.99813294, 1.0280186 , 0.99566907,\n",
+       "                         1.033792  , 0.99090743, 0.98742676, 1.00218   , 0.9944762 ,\n",
+       "                         1.0180073 , 1.0204257 , 0.9978386 , 1.0030422 , 1.0376201 ,\n",
+       "                         1.0196778 , 1.0020446 , 0.9946544 , 1.0287017 , 1.0023233 ,\n",
+       "                         1.0151851 , 1.0085427 , 1.0258116 , 1.0106041 , 0.9923284 ,\n",
+       "                         1.0228347 , 1.0039704 , 0.99091953, 0.9823107 , 1.016947  ,\n",
+       "                         1.0215237 , 1.0077496 , 1.0370032 , 0.9993619 , 1.0059168 ,\n",
+       "                         0.9826532 , 1.0285178 , 1.0367659 , 1.0070248 , 1.0034032 ,\n",
+       "                         1.0442673 , 0.99493504, 1.004249  , 1.0280426 , 1.0017502 ,\n",
+       "                         0.988515  , 0.9967804 , 1.0113221 , 1.0154219 , 1.0005659 ,\n",
+       "                         1.0015084 , 0.99482644, 1.0037222 , 1.009357  , 1.0022448 ,\n",
+       "                         0.9883776 , 1.0405829 , 1.0310917 , 0.9933524 , 1.0433357 ,\n",
+       "                         0.9818653 , 1.0083051 , 1.0214539 , 0.9923552 , 1.0301536 ,\n",
+       "                         1.0080968 , 0.9818375 , 0.9923027 , 1.0172874 , 0.98352754,\n",
+       "                         1.0107327 , 1.0151389 , 1.0274394 , 0.983884  , 1.0131593 ,\n",
+       "                         0.99889815, 1.0262815 , 0.96433216, 1.0211636 , 1.0312902 ,\n",
+       "                         1.0047783 , 0.9924638 , 1.0092816 , 0.9730608 , 0.9828258 ,\n",
+       "                         1.0578774 , 1.0200232 , 0.98963594, 0.9977363 , 1.0138032 ,\n",
+       "                         0.9713009 , 1.0304941 , 1.0180733 , 1.0288314 , 0.9973552 ,\n",
+       "                         1.0352954 , 1.0003406 , 0.98862803, 1.0030655 , 0.9941499 ,\n",
+       "                         1.0280615 , 1.0016365 , 1.0180489 , 1.0040277 , 0.9607358 ,\n",
+       "                         1.0037141 , 1.0396017 ], dtype=float32)>\n",
+       "                  (beta): <tf.Variable 'transformer/layer_._1/ff/layer_norm/beta:0' shape=(192,) dtype=float32, numpy=\n",
+       "                  array([ 3.43603594e-03,  2.67952736e-02, -3.19796521e-03,  2.77959052e-02,\n",
+       "                         -2.27564160e-05,  3.00053079e-02,  4.48617749e-02,  1.97070669e-02,\n",
+       "                          1.02396915e-02,  1.72215980e-02, -2.75892112e-03, -2.48206849e-03,\n",
+       "                          2.81982850e-02, -1.42260175e-02, -5.90529153e-03,  1.90874767e-02,\n",
+       "                         -2.45346106e-03,  9.29297972e-03,  4.25612368e-03, -1.09480857e-03,\n",
+       "                         -9.13006626e-03,  9.24918726e-02,  2.37285383e-02,  2.87201833e-02,\n",
+       "                         -1.14277247e-02,  1.90680362e-02, -5.39551210e-03,  4.02982607e-02,\n",
+       "                         -2.37562824e-02, -1.89014245e-02,  6.41179970e-03, -8.68414938e-02,\n",
+       "                         -1.77674480e-02, -1.51537284e-02, -3.89129203e-03,  8.26284010e-03,\n",
+       "                          3.10518011e-03,  4.06105816e-03,  2.47969031e-02,  2.05240212e-03,\n",
+       "                          3.35611892e-03,  3.25422660e-02, -3.05853598e-02, -4.77116788e-03,\n",
+       "                          3.65033038e-02,  1.88807324e-02,  2.03111116e-02, -8.56510364e-03,\n",
+       "                          2.65865661e-02,  1.14510898e-02,  1.09779397e-02,  2.67214663e-02,\n",
+       "                         -4.07271273e-03, -2.48218258e-03,  1.46750696e-02,  1.35427015e-02,\n",
+       "                         -4.20185179e-03, -2.13467292e-02, -2.53253579e-02, -5.92954690e-03,\n",
+       "                          1.69605445e-02, -1.05276778e-02,  4.37114276e-02, -1.17301363e-02,\n",
+       "                          2.32506916e-03, -1.35039715e-02, -2.17513070e-02, -3.11144497e-02,\n",
+       "                         -1.43129388e-02, -1.83722116e-02, -1.85610689e-02, -1.80336367e-02,\n",
+       "                         -2.43042596e-02, -1.66123174e-02, -2.11378951e-02, -7.68155232e-03,\n",
+       "                         -2.80298945e-02, -1.23204431e-02, -7.89987575e-03, -3.82007994e-02,\n",
+       "                         -1.71284825e-02,  1.24480464e-02,  2.00545415e-02, -2.08343454e-02,\n",
+       "                          1.72695480e-02,  2.07619276e-02,  2.32151970e-02,  1.25586363e-02,\n",
+       "                          1.58736091e-02, -1.25755509e-03, -2.24005152e-02, -1.52119324e-02,\n",
+       "                         -1.03766266e-02,  1.39645461e-04,  2.10134406e-02, -3.91801484e-02,\n",
+       "                         -1.45232119e-02,  7.89888389e-03,  1.21645015e-02, -2.37555783e-02,\n",
+       "                         -5.84158637e-02,  1.74354929e-02,  1.84537917e-02,  2.19647903e-02,\n",
+       "                          2.39719935e-02,  4.19057608e-02,  1.49248559e-02,  2.69626584e-02,\n",
+       "                          2.89687188e-03, -1.89197827e-02, -3.71705405e-02, -2.37737875e-02,\n",
+       "                         -1.55493245e-02,  2.42294502e-02,  2.57444680e-02,  6.11581467e-03,\n",
+       "                         -2.08301488e-02,  1.96516458e-02, -1.59827378e-02, -8.61831009e-03,\n",
+       "                         -8.13416112e-03, -3.82699817e-02, -3.71116959e-02,  1.84831508e-02,\n",
+       "                          2.84379604e-03,  2.33847219e-02,  6.22194773e-03,  1.49291959e-02,\n",
+       "                         -1.83297582e-02,  1.81909986e-02,  2.15157811e-02, -1.39271868e-02,\n",
+       "                         -2.89638322e-02,  1.10881520e-03,  2.82157250e-02,  1.69136934e-02,\n",
+       "                         -8.84730276e-03,  1.59577336e-02,  2.03611460e-02, -1.65258385e-02,\n",
+       "                          1.78473722e-02, -2.39159130e-02, -1.36998538e-02, -1.71729792e-02,\n",
+       "                         -8.58519524e-02,  5.03670378e-03,  2.72648726e-02, -3.53694940e-03,\n",
+       "                         -3.04428395e-02,  1.27652185e-02, -2.31311023e-02, -2.26891320e-02,\n",
+       "                         -1.19382478e-02,  2.88316160e-02,  1.76204331e-02,  8.55787750e-03,\n",
+       "                          7.90143199e-03,  1.71625689e-02, -2.07985323e-02, -3.48045398e-03,\n",
+       "                          5.18445577e-03,  2.67593451e-02, -1.53288562e-02,  1.13617973e-02,\n",
+       "                          2.61260439e-02,  2.27058493e-02, -9.55688581e-03,  1.24905221e-02,\n",
+       "                          3.68422344e-02, -1.28372628e-02, -3.99196036e-02, -5.12610860e-02,\n",
+       "                          4.03299890e-02, -3.13749239e-02, -4.93869931e-03, -2.10509915e-02,\n",
+       "                         -3.29953581e-02, -5.14064655e-02, -3.82981487e-02, -1.65885733e-03,\n",
+       "                         -2.91457716e-02,  9.37298220e-03, -1.69041883e-02,  3.74249443e-02,\n",
+       "                         -1.32612139e-02,  3.82047258e-02,  8.21203087e-03, -2.99716964e-02,\n",
+       "                          1.45867635e-02,  1.26736856e-03, -8.91199056e-03, -6.25200244e-03],\n",
+       "                        dtype=float32)>\n",
+       "                  (_feature_shapes): Dict()\n",
+       "                  (_feature_dtypes): Dict()\n",
+       "                )\n",
+       "                (layer_1): Dense(\n",
+       "                  768, activation=linear, use_bias=True\n",
+       "                  (kernel): <tf.Variable 'transformer/layer_._1/ff/layer_1/kernel:0' shape=(192, 768) dtype=float32, numpy=\n",
+       "                  array([[-0.01936796, -0.01727297,  0.02798706, ..., -0.00043308,\n",
+       "                          -0.01548608,  0.01052339],\n",
+       "                         [ 0.0217678 ,  0.00543513, -0.0440179 , ...,  0.01921584,\n",
+       "                          -0.00281928, -0.00167585],\n",
+       "                         [-0.02762845,  0.01751809, -0.01518949, ..., -0.00809754,\n",
+       "                          -0.03134314, -0.02594296],\n",
+       "                         ...,\n",
+       "                         [-0.04703904, -0.06811567, -0.04486849, ...,  0.00712049,\n",
+       "                           0.04625429, -0.03096718],\n",
+       "                         [ 0.01649503, -0.0038292 ,  0.03609787, ...,  0.0124039 ,\n",
+       "                          -0.01003346, -0.00525536],\n",
+       "                         [-0.01172524, -0.03267535, -0.0185673 , ...,  0.03373903,\n",
+       "                          -0.01304786, -0.035545  ]], dtype=float32)>\n",
+       "                  (bias): <tf.Variable 'transformer/layer_._1/ff/layer_1/bias:0' shape=(768,) dtype=float32, numpy=\n",
+       "                  array([-2.02730969e-02, -1.72163453e-02, -3.96374911e-02,  9.25439177e-04,\n",
+       "                         -4.36484031e-02, -2.00147685e-02, -1.71882827e-02, -3.47368903e-02,\n",
+       "                          5.66399482e-04, -3.84117700e-02, -9.10965260e-03,  2.74756015e-03,\n",
+       "                         -1.80025201e-03,  9.61851515e-03,  4.73078527e-03,  4.82578995e-03,\n",
+       "                         -1.18976750e-03, -3.83619703e-02, -1.34952469e-02, -1.35540264e-02,\n",
+       "                         -1.20289333e-03, -6.07461929e-02, -2.38492060e-02, -7.87904486e-04,\n",
+       "                          9.72030219e-03, -2.31057182e-02,  1.04524931e-02,  6.30092947e-03,\n",
+       "                         -5.97665533e-02, -1.25674810e-03,  7.68401567e-03, -2.56892614e-04,\n",
+       "                          4.59111482e-03, -1.09384181e-02,  4.45268257e-03, -1.41052697e-02,\n",
+       "                         -1.63422208e-02,  4.66172909e-03,  8.07574391e-03, -4.54686359e-02,\n",
+       "                          1.60025507e-02, -9.59658623e-03,  8.28578882e-03, -2.48896070e-02,\n",
+       "                         -2.15898622e-02, -1.55484192e-02,  5.97327203e-03, -2.75620334e-02,\n",
+       "                         -4.66338173e-02, -3.95550160e-07,  8.05350486e-04, -2.27461364e-02,\n",
+       "                         -1.24393404e-02,  8.30512773e-03, -3.38091608e-03, -5.77073358e-03,\n",
+       "                         -2.96839513e-02, -4.13544625e-02,  2.24601105e-03, -1.36652626e-02,\n",
+       "                         -1.96060464e-02, -3.98634113e-02, -1.41905267e-02,  1.77390352e-02,\n",
+       "                         -1.33622885e-02, -6.83417497e-03,  3.87142715e-03, -1.46481190e-02,\n",
+       "                         -7.40471156e-03, -2.74524000e-02, -2.04818901e-02, -6.72868500e-03,\n",
+       "                         -2.39155442e-02, -4.22676764e-02, -1.39555512e-02, -5.67868992e-04,\n",
+       "                         -3.41841839e-02,  2.03465912e-02,  4.76055406e-03, -6.00655982e-03,\n",
+       "                          1.05688032e-02, -4.46136780e-02, -5.22093195e-03, -3.42974998e-02,\n",
+       "                         -4.84602014e-03, -1.54305240e-02, -2.88315918e-02, -2.42710151e-02,\n",
+       "                          6.89190486e-03, -1.06102470e-02,  1.16604185e-02, -6.36164285e-03,\n",
+       "                          1.76626742e-02, -2.76263505e-02, -1.81746799e-02,  1.68347117e-02,\n",
+       "                         -2.11666878e-02, -2.66354941e-02, -1.48490481e-02,  4.81047761e-03,\n",
+       "                          4.19533439e-03, -7.29140267e-03,  5.83578832e-03,  1.83147267e-02,\n",
+       "                         -2.89011337e-02,  1.99224800e-02,  2.33192053e-02, -1.17651206e-02,\n",
+       "                         -9.48132947e-03, -3.80671844e-02, -6.97254250e-03, -5.80234174e-03,\n",
+       "                         -2.95534590e-03, -1.68973021e-02,  6.81369333e-03, -2.98659261e-02,\n",
+       "                         -4.21552286e-02, -6.81099389e-03, -8.78395606e-03, -1.27584357e-02,\n",
+       "                         -2.28257608e-02,  1.10510215e-02, -9.74175520e-03, -5.33285458e-03,\n",
+       "                          2.30560894e-03,  1.34414751e-02, -1.65234245e-02, -3.12085904e-04,\n",
+       "                         -2.15259232e-02,  2.44667870e-03, -4.03293176e-04, -2.27069166e-02,\n",
+       "                         -2.79640649e-02, -1.86381284e-02, -2.70746183e-02, -3.35429721e-02,\n",
+       "                         -1.51718426e-02, -8.92117992e-03,  1.50545919e-02, -1.28146186e-02,\n",
+       "                         -2.84793153e-02,  1.30716702e-02,  1.73362158e-02,  1.04466139e-03,\n",
+       "                         -1.12203090e-02, -5.85076399e-02, -4.21808520e-03,  1.34438546e-02,\n",
+       "                         -1.10811321e-03,  1.77231431e-02, -2.33806157e-03,  2.92738043e-02,\n",
+       "                         -8.34393501e-03,  4.49858513e-03, -9.37382691e-03, -9.02433135e-03,\n",
+       "                         -8.02938081e-03, -1.90042872e-02, -3.04585975e-02, -3.98852862e-02,\n",
+       "                         -4.17789333e-02, -1.66377705e-02, -9.60725360e-03, -1.49319484e-03,\n",
+       "                          1.98501945e-02, -1.57562755e-02, -5.30303158e-02, -6.36109523e-03,\n",
+       "                         -2.39910167e-02,  1.18866307e-03, -1.68753341e-02, -8.01526383e-02,\n",
+       "                         -4.10544388e-02,  7.16660218e-03, -5.72163565e-03, -1.77054796e-02,\n",
+       "                         -3.42064979e-03, -1.32517936e-02,  2.85892412e-02,  2.75228405e-03,\n",
+       "                         -1.05867181e-02, -8.94123688e-03, -7.82309752e-03, -1.23709049e-02,\n",
+       "                          3.22665437e-03,  8.23641941e-03, -1.72391906e-02,  4.11677780e-03,\n",
+       "                         -1.57788415e-02,  2.83235274e-02,  1.20825451e-02,  9.10627469e-03,\n",
+       "                         -1.31589000e-03, -3.31720822e-02, -3.95477414e-02, -1.60696432e-02,\n",
+       "                          1.00599974e-03, -4.13404442e-02,  9.88238957e-03, -2.03417242e-02,\n",
+       "                         -2.17924453e-03, -2.85398886e-02,  5.66473557e-03,  1.53433271e-02,\n",
+       "                          1.60060227e-02, -1.68967023e-02, -2.83081476e-02, -2.64291056e-02,\n",
+       "                         -1.57325342e-02,  9.99413617e-03, -1.07601415e-02, -4.59073186e-02,\n",
+       "                         -7.32598477e-04,  2.11031605e-02, -2.77611818e-02,  1.44040724e-02,\n",
+       "                         -2.24381872e-02, -1.91908900e-03, -4.10638936e-02,  4.44361009e-04,\n",
+       "                         -2.92663351e-02,  2.04936545e-02,  6.32207748e-03, -3.43109742e-02,\n",
+       "                         -1.34509047e-02, -5.81239350e-02,  1.67944189e-02, -2.27752663e-02,\n",
+       "                          5.27992845e-03, -2.44366862e-02, -3.37892435e-02, -8.63631908e-03,\n",
+       "                         -3.40979779e-03, -2.28613541e-02,  1.03544090e-02, -1.03079081e-02,\n",
+       "                         -2.27480102e-02, -8.28197040e-03,  3.05404793e-03,  6.86701527e-03,\n",
+       "                          1.70611078e-03, -6.15844736e-04, -2.25477908e-02, -1.91879030e-02,\n",
+       "                         -1.09220268e-02, -1.05120335e-02,  7.52746407e-03, -6.16745558e-03,\n",
+       "                         -4.02863923e-04,  5.69625199e-03, -4.14612219e-02,  6.82809995e-03,\n",
+       "                          5.11092553e-03, -3.99447940e-02, -1.39821991e-02, -6.75095897e-03,\n",
+       "                         -1.76455695e-02, -3.17825340e-02, -2.47324333e-02, -1.16888667e-02,\n",
+       "                         -4.36839722e-02, -1.80751383e-02, -3.45760658e-02, -1.67294051e-02,\n",
+       "                          1.48514751e-02, -1.07286517e-02,  1.06422873e-02, -4.75126877e-03,\n",
+       "                         -1.78854894e-02, -1.26997447e-02,  1.95242390e-02,  8.47190060e-03,\n",
+       "                         -1.91945845e-04, -9.36024543e-03, -2.00828295e-02, -1.21161118e-02,\n",
+       "                         -4.84504132e-03,  1.75416321e-02, -1.37205329e-02, -2.43347771e-02,\n",
+       "                          4.87131439e-03,  5.27615938e-03, -1.47305001e-02, -2.15904955e-02,\n",
+       "                         -2.33575199e-02, -6.61554048e-03, -2.56092777e-03, -1.26826074e-02,\n",
+       "                          6.26714528e-03,  2.45168898e-03,  1.62922833e-02, -2.74149259e-03,\n",
+       "                         -5.68998680e-02,  1.56744905e-02, -9.12281312e-03,  1.78000834e-02,\n",
+       "                         -3.62905003e-02,  7.11219618e-03, -8.98136874e-04, -1.32871466e-02,\n",
+       "                         -1.43234096e-02,  2.74861394e-03, -4.30019433e-03, -3.29636261e-02,\n",
+       "                         -9.63856187e-03, -1.89240500e-02, -2.61130854e-02, -4.91014943e-02,\n",
+       "                         -1.34954117e-02, -2.40241829e-02, -3.60400975e-03,  8.44172947e-03,\n",
+       "                          2.74142437e-03,  4.92954510e-04,  8.39409605e-03, -1.02594271e-02,\n",
+       "                          1.24602579e-02, -1.07601611e-02, -1.88089907e-02, -6.94376091e-03,\n",
+       "                          1.07152490e-02, -2.51998808e-02, -3.05384048e-04, -2.22030841e-02,\n",
+       "                          2.27522459e-02,  4.93783038e-03,  4.13542788e-04, -5.84202865e-03,\n",
+       "                         -3.55486609e-02,  6.57991180e-03,  2.02657469e-02, -8.46680067e-03,\n",
+       "                          1.85093528e-03, -4.74362914e-03,  1.63280349e-02, -1.74182784e-02,\n",
+       "                          1.33596628e-03,  2.01811492e-02, -2.63537467e-02, -3.98929492e-02,\n",
+       "                          1.01095112e-03,  1.42210315e-03, -1.06787616e-02, -5.45299938e-03,\n",
+       "                         -4.68486287e-02, -1.30118029e-02, -2.19423864e-02, -1.33587964e-04,\n",
+       "                          3.92357528e-04, -8.55443031e-02, -1.89563315e-02, -1.14462031e-02,\n",
+       "                         -6.67757262e-03, -1.09370230e-02, -6.51147170e-03,  2.61508133e-02,\n",
+       "                         -3.04248054e-02, -1.70873217e-02, -3.45333070e-02,  1.14384610e-02,\n",
+       "                          3.57219647e-03,  2.35397834e-03, -1.16945207e-02,  7.03913299e-03,\n",
+       "                         -2.15787832e-02, -2.59910841e-02,  7.86962267e-03, -1.90627389e-02,\n",
+       "                         -9.06899385e-03, -1.13378987e-02, -1.59990210e-02, -2.40502376e-02,\n",
+       "                          7.58200511e-03, -2.38405541e-03, -1.56799629e-02, -6.49033580e-03,\n",
+       "                         -1.45801324e-02, -1.07867159e-02,  5.38399536e-03, -2.63710693e-02,\n",
+       "                          9.06795356e-03, -2.23380048e-02,  6.40973798e-04, -2.08435990e-02,\n",
+       "                         -3.54930665e-03, -2.61892695e-02, -2.43403837e-02,  1.45022171e-02,\n",
+       "                         -1.11294333e-02,  2.22975109e-02, -2.88649276e-02,  8.83427728e-03,\n",
+       "                         -1.71264182e-04, -2.00522859e-02, -2.22262572e-02, -2.64064576e-02,\n",
+       "                         -3.25897448e-02,  3.27128638e-03, -2.39347070e-02, -4.62485291e-02,\n",
+       "                         -2.10695155e-02,  1.28054693e-02, -7.54281729e-02,  4.13044542e-03,\n",
+       "                         -3.69404964e-02, -1.50013510e-02, -3.06449854e-03, -2.17315014e-02,\n",
+       "                          1.08699258e-02, -6.91265427e-03, -2.96049239e-03, -3.04010976e-02,\n",
+       "                         -1.17014181e-02, -1.68799460e-02,  1.65505484e-02, -2.11988632e-02,\n",
+       "                         -5.35056321e-03, -1.93487015e-02, -2.19009928e-02,  9.98965185e-03,\n",
+       "                         -4.48127203e-02, -1.70589089e-02, -1.49650453e-02, -3.53463888e-02,\n",
+       "                          1.08261164e-02,  8.66322126e-03,  1.09988675e-02,  5.07105980e-03,\n",
+       "                         -1.09785991e-02, -8.24725349e-03, -7.05766352e-03, -2.93953102e-02,\n",
+       "                         -1.99896973e-02,  1.87788866e-02,  7.44108669e-03, -1.36157889e-02,\n",
+       "                         -2.46517863e-02, -5.10792900e-03, -3.37912096e-03, -5.00590242e-02,\n",
+       "                         -3.30806077e-02,  3.06895375e-03, -1.39247607e-02, -1.32991076e-02,\n",
+       "                         -2.84706913e-02, -2.39872653e-02, -1.41443796e-02, -2.87217030e-04,\n",
+       "                         -5.37853176e-03, -2.31699413e-03,  1.24481134e-02,  2.81007700e-02,\n",
+       "                          1.63598135e-02, -5.36525249e-03,  4.11947863e-03, -8.87962710e-03,\n",
+       "                          7.01108202e-03, -2.79064216e-02,  1.86030604e-02, -1.84345972e-02,\n",
+       "                          9.82684270e-03, -3.05190459e-02, -1.66466013e-02,  7.72549713e-04,\n",
+       "                          1.54814508e-03,  3.96430143e-04,  3.52570880e-03, -2.07410306e-02,\n",
+       "                         -4.09877440e-03,  2.37259106e-03, -2.46705618e-02,  6.25023479e-03,\n",
+       "                         -1.99402794e-02,  1.34928676e-03,  1.01430779e-02, -3.21491691e-03,\n",
+       "                          6.11917814e-03, -1.14797940e-02, -6.87398063e-03,  1.76550762e-04,\n",
+       "                          1.37082450e-02,  1.26474327e-03,  1.39204646e-02, -2.22524889e-02,\n",
+       "                          8.97681457e-05,  1.88891031e-02, -1.98963750e-02, -2.37500835e-02,\n",
+       "                         -1.45162186e-02, -1.76579468e-02, -4.85126860e-03,  2.73216609e-03,\n",
+       "                         -2.76307054e-02,  1.23566557e-02,  7.31245056e-03,  1.25627527e-02,\n",
+       "                         -5.04276110e-03, -1.19638499e-02, -1.18406191e-02,  6.97168894e-03,\n",
+       "                          1.20525099e-02, -2.73218355e-03, -4.18124301e-03, -1.69247333e-02,\n",
+       "                         -3.16366227e-03, -4.72069159e-03, -3.73938009e-02, -1.98564995e-02,\n",
+       "                         -2.44545266e-02, -2.88034491e-02,  9.98098217e-03,  5.21743670e-03,\n",
+       "                          1.93960182e-02,  8.70525651e-03, -2.18096245e-02, -1.38377806e-03,\n",
+       "                         -4.20307964e-02, -2.30455790e-02, -2.23685917e-03, -3.45625132e-02,\n",
+       "                          2.33609974e-02,  8.25913530e-03, -6.18917309e-03, -2.46669389e-02,\n",
+       "                         -1.78897451e-03,  3.98437865e-03, -8.35600216e-03,  5.77223767e-03,\n",
+       "                         -2.84034549e-03, -3.58642917e-03, -6.18770486e-03, -8.90398864e-03,\n",
+       "                          5.72477176e-04,  1.38246790e-02, -1.21220071e-02, -1.20190228e-03,\n",
+       "                          9.34968051e-03, -2.07452327e-02, -3.20062190e-02, -2.53834538e-02,\n",
+       "                         -1.34317875e-02, -1.97784398e-02, -4.15071892e-03, -2.73645706e-02,\n",
+       "                         -1.25424266e-02,  7.18894880e-03, -2.15254407e-02, -2.59364340e-02,\n",
+       "                         -3.32168043e-02, -5.32375872e-02,  4.73892782e-03, -3.15329432e-02,\n",
+       "                          1.17336446e-03,  1.20503269e-02,  8.81805178e-03, -1.79140083e-02,\n",
+       "                         -6.54526567e-03,  1.82500295e-03,  1.05281603e-02,  1.61723625e-02,\n",
+       "                          2.05972083e-02, -1.97964087e-02,  6.55350232e-06,  1.87991858e-02,\n",
+       "                          2.06013061e-02, -1.17481954e-03,  5.10920864e-03, -6.09265687e-03,\n",
+       "                         -1.72222387e-02, -7.33022811e-04, -1.90670881e-02, -3.63333821e-02,\n",
+       "                         -1.54390512e-02,  7.49356346e-03,  2.69417036e-02, -1.88536178e-02,\n",
+       "                          9.53572243e-03, -8.18822626e-03,  2.66291890e-02, -3.50175761e-02,\n",
+       "                         -1.75517949e-03, -3.63707147e-03, -2.96578407e-02,  4.85087978e-03,\n",
+       "                          2.29683891e-02, -1.07311681e-02, -5.93151152e-03, -6.43233676e-03,\n",
+       "                         -9.02256090e-03,  5.71041647e-03, -1.11940848e-02, -7.63751753e-03,\n",
+       "                         -2.96609430e-03, -1.74308917e-03, -5.73345507e-03, -4.00085747e-02,\n",
+       "                         -1.08280014e-02,  2.45840847e-03, -1.65827647e-02, -3.04641202e-02,\n",
+       "                         -1.91303175e-02, -6.34902045e-02, -2.71443985e-02, -8.48556217e-03,\n",
+       "                         -5.78744244e-03, -1.78982951e-02, -1.84806883e-02, -1.90523081e-02,\n",
+       "                          4.01735492e-03,  2.23109615e-03, -1.74209196e-02,  1.19515928e-03,\n",
+       "                          1.03071714e-02, -8.02234039e-02,  1.24981962e-02, -1.32194627e-02,\n",
+       "                         -6.72617368e-03,  2.29350757e-03,  2.68838392e-03, -1.07558258e-02,\n",
+       "                         -7.45773548e-03, -3.24521516e-03, -3.60023528e-02, -5.36000133e-02,\n",
+       "                          5.89652080e-03, -3.65445241e-02,  1.57442577e-02, -1.11889504e-02,\n",
+       "                          2.01796740e-02, -1.89142656e-02,  3.69664375e-03, -9.64444969e-03,\n",
+       "                         -1.99025124e-02, -5.27735911e-02, -6.18071482e-03,  1.96429584e-02,\n",
+       "                          9.04919766e-03, -2.44172849e-03,  2.42983419e-02,  7.77297560e-03,\n",
+       "                          1.86291113e-02,  1.43718664e-02,  4.88520274e-03, -1.74652059e-02,\n",
+       "                         -3.91945206e-02, -2.85394844e-02, -6.52817870e-03, -4.53838333e-03,\n",
+       "                          5.24704205e-03, -3.72513458e-02, -2.26468854e-02,  2.32792087e-03,\n",
+       "                          1.88641832e-03,  5.58300922e-03, -9.78803448e-03,  2.33869310e-02,\n",
+       "                         -4.18912135e-02, -3.19908485e-02, -8.90049245e-03, -1.94256715e-02,\n",
+       "                          6.74062036e-03, -1.12374388e-02,  1.40834944e-02, -1.58932773e-04,\n",
+       "                         -3.85522889e-03, -2.52304543e-02,  1.09773213e-02, -3.49628739e-02,\n",
+       "                          2.02956498e-02, -1.83961205e-02, -9.16141830e-03, -6.89430069e-03,\n",
+       "                         -1.82250026e-03,  3.91215971e-03, -3.02790329e-02,  4.85412357e-03,\n",
+       "                          5.21492213e-03, -2.76922695e-02,  7.46305939e-03,  4.57040616e-04,\n",
+       "                         -2.80272998e-02,  5.70539059e-03, -2.35484336e-02,  5.97323524e-03,\n",
+       "                         -3.80400121e-02, -2.14953162e-03, -5.47003699e-03, -2.85517797e-03,\n",
+       "                          1.21851694e-02,  1.71587861e-03, -2.77664978e-02, -2.20162105e-02,\n",
+       "                          8.68351292e-03, -2.04854421e-02,  3.65737732e-03, -4.93340136e-04,\n",
+       "                         -6.58130087e-03,  8.45880434e-03,  9.36099607e-03, -6.69793831e-03,\n",
+       "                         -1.45707000e-02, -1.48070045e-02,  2.04449962e-03,  2.96859490e-03,\n",
+       "                         -2.96394285e-02,  1.08581251e-02, -1.75250992e-02,  1.53381256e-02,\n",
+       "                         -2.64075790e-02,  1.73933804e-02,  6.86512422e-03, -1.24971373e-02,\n",
+       "                          9.37248301e-03, -8.76329548e-04, -2.70201601e-02, -1.37452129e-02,\n",
+       "                         -2.48217899e-02, -2.12847032e-02, -2.02346016e-02,  4.97383205e-03,\n",
+       "                         -1.45821357e-02, -6.21638354e-03,  1.60615034e-02,  8.42541736e-03,\n",
+       "                         -1.73121586e-03,  1.84763055e-02,  1.38618983e-02,  6.79083809e-04,\n",
+       "                         -3.76517028e-02, -5.53824613e-03, -1.61262881e-02,  2.18251087e-02,\n",
+       "                         -1.41914962e-02, -2.67606135e-03, -9.26637370e-03,  1.47592397e-02,\n",
+       "                         -8.86621326e-03,  1.54802157e-02,  3.15189059e-03,  9.82165709e-03,\n",
+       "                          3.27752903e-03,  2.13089865e-02, -2.70583443e-02, -7.42953736e-03,\n",
+       "                         -2.50007659e-02, -1.14361225e-02, -9.81700886e-03, -8.11999850e-03,\n",
+       "                         -1.84244197e-02, -2.75552347e-02, -2.94755609e-03, -6.37403829e-03,\n",
+       "                         -1.25843631e-02, -3.07683572e-02, -3.49259959e-03,  7.75923207e-03,\n",
+       "                          1.38970942e-03, -2.76233349e-02,  6.77595520e-03,  1.63823506e-03,\n",
+       "                          5.47163363e-05, -2.44897380e-02, -6.46863133e-03, -7.09528523e-03,\n",
+       "                         -1.90487560e-02, -1.02440035e-02,  4.92857816e-03, -5.28441332e-02],\n",
+       "                        dtype=float32)>\n",
+       "                  (_feature_shapes): Dict()\n",
+       "                  (_feature_dtypes): Dict()\n",
+       "                )\n",
+       "                (layer_2): Dense(\n",
+       "                  192, activation=linear, use_bias=True\n",
+       "                  (kernel): <tf.Variable 'transformer/layer_._1/ff/layer_2/kernel:0' shape=(768, 192) dtype=float32, numpy=\n",
+       "                  array([[-0.01873498,  0.02679233, -0.07056118, ...,  0.00398566,\n",
+       "                           0.02154048,  0.01009107],\n",
+       "                         [ 0.0023489 ,  0.03306963, -0.01094123, ..., -0.01874584,\n",
+       "                           0.02311078, -0.03246025],\n",
+       "                         [ 0.01395899, -0.01199064,  0.03589186, ..., -0.00253369,\n",
+       "                           0.00015564,  0.01200298],\n",
+       "                         ...,\n",
+       "                         [-0.0110327 ,  0.01484329, -0.02025447, ..., -0.01528619,\n",
+       "                          -0.00044155, -0.00768675],\n",
+       "                         [-0.00518769, -0.0190341 ,  0.00541804, ..., -0.04019772,\n",
+       "                           0.00462436,  0.00114423],\n",
+       "                         [-0.01649309, -0.022153  ,  0.00116507, ...,  0.00092028,\n",
+       "                           0.0192393 , -0.00191616]], dtype=float32)>\n",
+       "                  (bias): <tf.Variable 'transformer/layer_._1/ff/layer_2/bias:0' shape=(192,) dtype=float32, numpy=\n",
+       "                  array([-0.00875727,  0.00844772, -0.00638411,  0.00979791,  0.00631264,\n",
+       "                          0.01925564,  0.01764304,  0.01935392, -0.00319467,  0.00851334,\n",
+       "                         -0.00302966,  0.0017067 ,  0.01643271,  0.00013498,  0.01369039,\n",
+       "                          0.0075578 , -0.00901533,  0.00556126,  0.00525395,  0.00601836,\n",
+       "                         -0.00113361,  0.06682169,  0.01941927,  0.02516656, -0.00994125,\n",
+       "                          0.01200988, -0.01820031,  0.02928668, -0.02253202, -0.02094638,\n",
+       "                         -0.00215082, -0.04950898, -0.01214268, -0.00775701, -0.00567762,\n",
+       "                          0.00155565, -0.00412368,  0.01876251,  0.01938802,  0.01385835,\n",
+       "                         -0.00753018,  0.01650311, -0.01765283, -0.0175887 ,  0.01734858,\n",
+       "                          0.02780465,  0.01827991, -0.00259388,  0.00857305,  0.00877466,\n",
+       "                          0.01454839,  0.0185861 ,  0.00305506, -0.01850432,  0.00327083,\n",
+       "                          0.01592625, -0.02423782, -0.02307841, -0.02633888, -0.0118603 ,\n",
+       "                          0.00033595, -0.01579602,  0.03260851, -0.01295588,  0.00152569,\n",
+       "                         -0.01920031, -0.02093989, -0.00928893, -0.01716848,  0.00329048,\n",
+       "                         -0.03092022, -0.00813805, -0.02732819, -0.02910862, -0.00923078,\n",
+       "                         -0.02219846, -0.00552739, -0.01209938, -0.01768913, -0.03044659,\n",
+       "                          0.00433539,  0.01937628,  0.02478183, -0.01579314,  0.02210511,\n",
+       "                          0.02426847,  0.03000535,  0.02216269,  0.00996924, -0.01001132,\n",
+       "                         -0.01479168, -0.02210437, -0.01065945, -0.00187033,  0.00778272,\n",
+       "                         -0.03885601, -0.0236426 , -0.0003459 ,  0.00390934, -0.01730723,\n",
+       "                         -0.04346146,  0.00464112,  0.0187731 ,  0.02091447,  0.00887477,\n",
+       "                          0.03617691,  0.01600332,  0.01941076, -0.00550917, -0.02156864,\n",
+       "                         -0.02627692, -0.02292657, -0.0195347 ,  0.00989026,  0.01694178,\n",
+       "                         -0.00581628, -0.01517762,  0.02600943, -0.01791165, -0.00931305,\n",
+       "                         -0.01767998, -0.01953321, -0.0226922 ,  0.02001677, -0.00639939,\n",
+       "                          0.03065447,  0.0072672 ,  0.01034329, -0.01980901,  0.01084015,\n",
+       "                          0.01425455, -0.01764459, -0.02957735, -0.00409907,  0.0226249 ,\n",
+       "                          0.02194628, -0.01227286,  0.01358387,  0.02082218, -0.02336786,\n",
+       "                          0.01717109, -0.01016011, -0.01469659, -0.01017225, -0.05480007,\n",
+       "                          0.00403081,  0.02459577,  0.00297031, -0.01252157,  0.0100858 ,\n",
+       "                         -0.02109952, -0.01984255,  0.0088863 ,  0.02306723,  0.00677673,\n",
+       "                          0.00027088,  0.00272076,  0.01193484, -0.00655524, -0.02220269,\n",
+       "                          0.00476494,  0.02373325, -0.00927185,  0.0072583 ,  0.021671  ,\n",
+       "                          0.00589487, -0.00776884,  0.01278425,  0.024796  , -0.00481928,\n",
+       "                         -0.02029314, -0.03756877,  0.03063949, -0.0084965 ,  0.00194776,\n",
+       "                         -0.02170036, -0.03632088, -0.02481564, -0.02177641,  0.0025987 ,\n",
+       "                         -0.01534427,  0.01370342, -0.0128414 ,  0.02587708, -0.01888825,\n",
+       "                          0.02439466,  0.01731913, -0.00958412,  0.01613715,  0.01427922,\n",
+       "                         -0.01684757, -0.00175023], dtype=float32)>\n",
+       "                  (_feature_shapes): Dict()\n",
+       "                  (_feature_dtypes): Dict()\n",
+       "                )\n",
+       "                (dropout): Dropout(\n",
+       "                  (_feature_shapes): Dict()\n",
+       "                  (_feature_dtypes): Dict()\n",
+       "                )\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (dropout): Dropout(\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "            (2): TFXLNetLayer(\n",
+       "              (rel_attn): TFXLNetRelativeAttention(\n",
+       "                (layer_norm): LayerNormalization(\n",
+       "                  (axis): List(\n",
+       "                    (0): 2\n",
+       "                  )\n",
+       "                  (gamma): <tf.Variable 'transformer/layer_._2/rel_attn/layer_norm/gamma:0' shape=(192,) dtype=float32, numpy=\n",
+       "                  array([1.0217174 , 1.0251529 , 1.0009836 , 1.0462228 , 1.0023384 ,\n",
+       "                         1.0702455 , 1.0446848 , 1.0141752 , 1.016957  , 1.033185  ,\n",
+       "                         1.0181712 , 1.0153837 , 0.9992023 , 1.0347466 , 1.0211351 ,\n",
+       "                         1.0018849 , 1.0121537 , 0.99940306, 1.0072032 , 1.0192038 ,\n",
+       "                         1.0209839 , 1.187853  , 1.0392752 , 1.0235384 , 1.0065316 ,\n",
+       "                         1.022949  , 1.0093213 , 1.0211647 , 1.0060023 , 1.0248559 ,\n",
+       "                         1.0059446 , 1.0761709 , 1.0173205 , 1.0236268 , 0.98880196,\n",
+       "                         1.0349165 , 1.0256321 , 1.0104129 , 1.0246964 , 0.9955374 ,\n",
+       "                         1.0396379 , 1.0044645 , 1.028682  , 1.0409732 , 1.0322639 ,\n",
+       "                         1.0058585 , 1.0145588 , 0.99829394, 1.0104554 , 1.0500244 ,\n",
+       "                         1.0286031 , 1.0021374 , 1.0364661 , 0.9966459 , 1.022384  ,\n",
+       "                         1.017586  , 0.98369807, 1.0039334 , 1.0339525 , 1.0041248 ,\n",
+       "                         1.0204359 , 0.98249644, 1.032949  , 1.0197221 , 1.0263952 ,\n",
+       "                         0.9926133 , 0.99735445, 1.0876801 , 1.0224211 , 1.0198096 ,\n",
+       "                         1.0506258 , 1.0010437 , 0.99980325, 1.0300628 , 1.0086097 ,\n",
+       "                         1.0204959 , 1.0012923 , 1.0035007 , 0.9980045 , 1.0441691 ,\n",
+       "                         1.0204487 , 0.9990266 , 0.9966284 , 1.0186629 , 1.0485342 ,\n",
+       "                         1.0253004 , 1.0131625 , 1.0052114 , 1.0252738 , 1.0075058 ,\n",
+       "                         1.0343914 , 1.0002061 , 0.9924983 , 1.0421573 , 1.0040683 ,\n",
+       "                         1.0187975 , 1.0190364 , 1.0011268 , 0.99671876, 1.0547765 ,\n",
+       "                         1.025715  , 1.0177215 , 1.0108784 , 1.0226917 , 1.0155568 ,\n",
+       "                         0.9973636 , 1.0079739 , 1.0572509 , 1.0273353 , 1.0160165 ,\n",
+       "                         1.0249956 , 1.0097992 , 1.0126355 , 0.99393314, 1.0213517 ,\n",
+       "                         1.0287503 , 1.0278797 , 1.0104443 , 1.0232205 , 1.005057  ,\n",
+       "                         0.9942467 , 1.033091  , 1.0228969 , 1.007807  , 1.0081193 ,\n",
+       "                         1.0374564 , 0.9998273 , 1.0164163 , 1.0237519 , 1.0112252 ,\n",
+       "                         1.0251505 , 0.99518573, 1.0173032 , 1.017753  , 1.0192963 ,\n",
+       "                         1.0150547 , 0.99565893, 1.0140896 , 1.003712  , 1.000266  ,\n",
+       "                         1.001154  , 1.0525979 , 1.0441524 , 1.0055293 , 1.0802695 ,\n",
+       "                         1.003204  , 1.0219046 , 1.0287489 , 0.9960544 , 1.0255774 ,\n",
+       "                         1.026497  , 0.98832685, 0.9979249 , 1.0186322 , 1.0093694 ,\n",
+       "                         1.0192312 , 1.0199887 , 1.0398    , 0.9829798 , 1.0415385 ,\n",
+       "                         1.0186274 , 1.0384295 , 0.983487  , 1.0242232 , 1.0270193 ,\n",
+       "                         1.0064057 , 0.9939754 , 1.0075631 , 1.0031563 , 0.99732876,\n",
+       "                         1.0779532 , 1.0452689 , 1.0039006 , 0.98994976, 1.015347  ,\n",
+       "                         0.9903972 , 1.0386693 , 1.0151427 , 1.0464522 , 1.0083725 ,\n",
+       "                         1.038116  , 0.99612683, 1.0135477 , 1.0054603 , 1.0062294 ,\n",
+       "                         1.028863  , 1.0152918 , 1.0330389 , 1.0156182 , 0.9869547 ,\n",
+       "                         1.0048147 , 1.0276642 ], dtype=float32)>\n",
+       "                  (beta): <tf.Variable 'transformer/layer_._2/rel_attn/layer_norm/beta:0' shape=(192,) dtype=float32, numpy=\n",
+       "                  array([ 3.06162308e-03,  1.86115298e-02, -1.31628076e-02,  1.06461560e-02,\n",
+       "                         -4.11694031e-03,  3.30818594e-02,  4.02924716e-02,  6.59284927e-03,\n",
+       "                          3.38024739e-03,  4.59420588e-03,  4.78615239e-03,  6.62528677e-04,\n",
+       "                          6.70902058e-03, -2.52860878e-02, -1.48927094e-02,  4.62446781e-03,\n",
+       "                          6.38968835e-04,  7.71211181e-03,  7.99407065e-03,  1.95953436e-02,\n",
+       "                          7.16714747e-03,  9.20696408e-02,  2.76485197e-02,  5.97401522e-03,\n",
+       "                         -1.40910083e-02,  1.01603949e-02,  6.01712102e-03,  2.28405371e-02,\n",
+       "                         -7.97405839e-03, -1.86992937e-03,  5.27088996e-04, -7.22015649e-02,\n",
+       "                         -1.31994477e-02, -1.27156395e-02,  1.02564795e-02,  1.32799195e-02,\n",
+       "                         -1.20413559e-03, -4.15205443e-03, -9.66252945e-03, -1.11156877e-03,\n",
+       "                          1.75651070e-02,  2.47061532e-02, -3.22925635e-02,  6.95932051e-03,\n",
+       "                          9.56356898e-03, -1.50442692e-02,  1.64015479e-02,  5.24280732e-03,\n",
+       "                          3.17716822e-02, -5.53713785e-03, -1.06571664e-04,  9.43160616e-03,\n",
+       "                          9.63144936e-03, -5.56897651e-03,  1.13199570e-03,  1.25727803e-02,\n",
+       "                         -6.73677167e-03, -1.04960650e-02,  9.34011885e-04, -1.03336098e-02,\n",
+       "                          1.40871098e-02, -1.59239639e-02,  2.29182914e-02,  6.17692422e-05,\n",
+       "                         -3.35305231e-03,  7.19197124e-05, -1.17311468e-02, -3.22010480e-02,\n",
+       "                          5.37329866e-03, -9.16972011e-03, -4.40349337e-03, -1.91465244e-02,\n",
+       "                         -4.95484797e-03, -2.49018818e-02, -1.20322015e-02, -1.08357696e-02,\n",
+       "                         -1.00547625e-02, -2.94450088e-03,  5.77213243e-03, -1.24915829e-02,\n",
+       "                         -1.69879310e-02,  1.47916187e-04, -3.30431107e-03,  3.74537683e-03,\n",
+       "                         -6.71420526e-03,  2.85739498e-03, -5.88525691e-05,  4.38376237e-03,\n",
+       "                          8.50109477e-03,  5.33880573e-03, -1.12952897e-02, -8.53516534e-03,\n",
+       "                         -2.40853615e-03, -3.99530260e-03,  1.60534661e-02, -5.62854763e-03,\n",
+       "                         -3.77693970e-04,  1.23287737e-02,  2.00105105e-02, -1.42252818e-02,\n",
+       "                         -3.90752554e-02, -5.64790098e-03, -5.97694074e-04,  1.19732199e-02,\n",
+       "                          1.37916040e-02,  4.39003063e-03,  1.62776583e-03,  6.12852676e-03,\n",
+       "                         -2.70602433e-03, -1.48238158e-02, -2.96681095e-02, -1.44181950e-02,\n",
+       "                          8.72193649e-03,  1.24358824e-02,  1.52108464e-02,  1.06202485e-02,\n",
+       "                         -8.53042875e-05, -9.98889934e-03, -5.43701509e-03,  8.10975954e-03,\n",
+       "                          3.15054669e-03, -5.17641008e-03, -7.31557794e-03,  3.30039300e-03,\n",
+       "                          2.07848335e-03,  1.37262873e-03, -5.56092802e-03,  1.41495364e-02,\n",
+       "                         -1.32099232e-02,  1.03573129e-03,  1.63320545e-02, -6.14388322e-04,\n",
+       "                         -9.34190303e-03,  7.67122116e-03,  6.12509670e-04,  2.17823172e-03,\n",
+       "                         -5.67103876e-03,  1.09491777e-02,  6.37806486e-03,  5.85651305e-03,\n",
+       "                          2.79139308e-03, -3.87229025e-03, -3.13691562e-03, -4.91503440e-03,\n",
+       "                         -6.06452599e-02,  9.29491594e-03,  9.19607189e-03,  3.91248288e-03,\n",
+       "                         -1.18186893e-02,  2.82759406e-03, -9.46957152e-03, -1.18294284e-02,\n",
+       "                         -2.55618896e-03,  6.68200152e-03,  6.41459227e-03,  1.52630685e-02,\n",
+       "                          9.96001530e-03,  5.96510945e-03, -7.90067762e-03,  4.33216989e-03,\n",
+       "                          7.29350885e-03,  6.58101402e-03, -4.42307536e-03,  4.33848379e-03,\n",
+       "                          6.38639415e-03,  1.33568821e-02, -1.26913534e-02,  3.80871398e-03,\n",
+       "                          1.93254575e-02, -1.42886303e-02, -7.10068271e-03, -3.35032977e-02,\n",
+       "                          9.40572284e-03, -1.38211465e-02, -1.02185896e-02, -1.26630822e-02,\n",
+       "                         -2.23257244e-02, -1.92523561e-02, -3.01279314e-02,  2.53150007e-03,\n",
+       "                         -1.12993028e-02,  9.79227107e-03, -7.08208373e-03,  2.55916603e-02,\n",
+       "                          2.86390772e-03,  3.20686027e-02, -2.30147969e-03, -1.51887033e-02,\n",
+       "                          1.19875781e-02, -1.32277906e-02, -2.15940084e-03,  5.77947544e-03],\n",
+       "                        dtype=float32)>\n",
+       "                  (_feature_shapes): Dict()\n",
+       "                  (_feature_dtypes): Dict()\n",
+       "                )\n",
+       "                (dropout): Dropout(\n",
+       "                  (_feature_shapes): Dict()\n",
+       "                  (_feature_dtypes): Dict()\n",
+       "                )\n",
+       "                (q): <tf.Variable 'transformer/layer_._2/rel_attn/q:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "                array([[[-4.81137522e-02,  1.51717179e-02,  1.91733846e-03, ...,\n",
+       "                         -2.15504169e-02, -8.80663171e-02, -5.14865741e-02],\n",
+       "                        [-2.29916703e-02, -5.24781160e-02, -6.03806712e-02, ...,\n",
+       "                         -8.62903253e-05, -4.47642431e-03,  7.90688917e-02],\n",
+       "                        [ 1.12126365e-01,  3.48391198e-02, -5.96038513e-02, ...,\n",
+       "                          1.68225244e-02,  2.80025396e-02, -1.32860793e-02],\n",
+       "                        ...,\n",
+       "                        [ 6.81161508e-03,  5.21353967e-02,  2.45775543e-02, ...,\n",
+       "                          2.16543674e-02,  8.77359789e-03, -2.10702680e-02],\n",
+       "                        [ 1.58886798e-02,  1.51693877e-02, -9.94204450e-03, ...,\n",
+       "                          9.39156860e-03,  1.01508182e-02, -3.07718641e-03],\n",
+       "                        [-2.86811162e-02, -2.62935236e-02,  1.51471458e-02, ...,\n",
+       "                          1.70202483e-03,  3.09125576e-02, -4.09694621e-03]],\n",
+       "                \n",
+       "                       [[ 3.37063894e-02, -1.63897295e-02,  6.96284231e-03, ...,\n",
+       "                         -7.82956369e-03,  5.46475984e-02, -4.21468318e-02],\n",
+       "                        [ 3.24924961e-02,  2.07625646e-02, -6.96102679e-02, ...,\n",
+       "                         -6.44863173e-02, -7.28632137e-02,  4.93840724e-02],\n",
+       "                        [ 3.49648520e-02,  4.40866686e-02,  4.10161763e-02, ...,\n",
+       "                          3.23176309e-02,  5.57911135e-02,  4.16656248e-02],\n",
+       "                        ...,\n",
+       "                        [ 3.62646729e-02, -2.21277811e-02,  1.90648821e-03, ...,\n",
+       "                          3.49440463e-02, -5.95782511e-02,  4.22822535e-02],\n",
+       "                        [-3.51860039e-02, -2.13885438e-02,  4.00259346e-02, ...,\n",
+       "                         -4.20402475e-02, -1.41877644e-02,  4.43436131e-02],\n",
+       "                        [ 2.43175644e-02,  1.39741208e-02,  3.49960700e-02, ...,\n",
+       "                          1.55997453e-02, -1.60364714e-02,  2.10535321e-02]],\n",
+       "                \n",
+       "                       [[ 3.32882740e-02, -1.96926738e-03, -1.55992284e-02, ...,\n",
+       "                          8.14008191e-02,  1.38205756e-02, -1.51603227e-03],\n",
+       "                        [ 3.59372562e-03,  2.50430964e-03,  2.58572530e-02, ...,\n",
+       "                          3.24064456e-02,  2.29581203e-02, -1.92896519e-02],\n",
+       "                        [ 1.43919000e-02,  1.51500767e-02, -2.80712657e-02, ...,\n",
+       "                          5.12368865e-02,  9.74925887e-03, -5.37651917e-03],\n",
+       "                        ...,\n",
+       "                        [ 3.90181039e-03,  3.26900743e-02,  9.40683577e-03, ...,\n",
+       "                          8.45516333e-04,  8.35157279e-03, -1.66299427e-03],\n",
+       "                        [ 3.23605747e-03, -6.58250833e-03,  1.32873598e-02, ...,\n",
+       "                          1.53540606e-02, -2.06754059e-02,  1.22069884e-02],\n",
+       "                        [ 3.42889782e-03, -5.71477169e-04, -1.83276646e-02, ...,\n",
+       "                          2.04541571e-02, -1.27389310e-02,  1.50542082e-02]],\n",
+       "                \n",
+       "                       ...,\n",
+       "                \n",
+       "                       [[ 3.72777767e-02, -5.42798452e-02,  3.09000630e-03, ...,\n",
+       "                         -2.05895375e-03,  4.08504084e-02, -3.67017463e-02],\n",
+       "                        [ 2.81978864e-02,  2.46209782e-02, -5.35734519e-02, ...,\n",
+       "                         -9.81846265e-03, -6.76249191e-02,  4.47309017e-02],\n",
+       "                        [-1.71915013e-02, -1.91664733e-02, -3.03540640e-02, ...,\n",
+       "                         -1.37790563e-02,  8.39917455e-03,  1.95486043e-02],\n",
+       "                        ...,\n",
+       "                        [ 4.39666398e-03,  1.65959522e-02,  4.79898555e-03, ...,\n",
+       "                          3.13505344e-03,  4.33057360e-03, -4.27076186e-04],\n",
+       "                        [ 1.57838222e-02,  2.59035290e-03,  1.50174825e-02, ...,\n",
+       "                         -5.15849795e-04, -3.30348127e-03,  6.75350800e-03],\n",
+       "                        [ 1.95149593e-02, -9.67641245e-04,  9.85140260e-03, ...,\n",
+       "                          1.70841943e-02, -2.58299336e-02,  7.08191376e-03]],\n",
+       "                \n",
+       "                       [[-1.05452873e-02,  2.40855291e-02, -3.36844176e-02, ...,\n",
+       "                         -4.62573469e-02, -1.49153080e-03,  6.79138154e-02],\n",
+       "                        [ 4.84222826e-03,  1.13523463e-02,  3.25595327e-02, ...,\n",
+       "                         -2.86528356e-02,  3.52971703e-02, -3.56208794e-02],\n",
+       "                        [-1.18880443e-01, -3.07634361e-02,  2.19099987e-02, ...,\n",
+       "                         -5.25062606e-02, -4.03628685e-02, -4.92011150e-03],\n",
+       "                        ...,\n",
+       "                        [-1.91243179e-02, -4.92599839e-03, -8.33099522e-03, ...,\n",
+       "                         -3.46056446e-02,  3.18350689e-03, -8.50734068e-04],\n",
+       "                        [ 3.76518033e-02,  3.41102369e-02, -5.76552041e-02, ...,\n",
+       "                          1.96692292e-02,  4.78661954e-02, -4.84392270e-02],\n",
+       "                        [-3.47922626e-03, -1.39467446e-02,  2.18370315e-02, ...,\n",
+       "                         -2.02156343e-02,  1.19114574e-02, -2.46745106e-02]],\n",
+       "                \n",
+       "                       [[ 6.54376950e-03,  3.02088279e-02, -5.81995286e-02, ...,\n",
+       "                         -7.68325403e-02,  6.12843484e-02,  3.78722101e-02],\n",
+       "                        [ 9.42414347e-03, -5.04070967e-02, -2.94177290e-02, ...,\n",
+       "                         -5.24935313e-03, -6.23170584e-02,  4.45930520e-03],\n",
+       "                        [-4.07862365e-02, -3.37571464e-02,  2.19498202e-02, ...,\n",
+       "                          7.29233166e-03, -5.56845069e-02, -2.92345323e-02],\n",
+       "                        ...,\n",
+       "                        [ 2.81625874e-02, -1.72678512e-02, -2.19437256e-02, ...,\n",
+       "                          8.62976443e-03, -4.02266011e-02,  2.57315841e-02],\n",
+       "                        [-8.77696928e-03, -1.04554817e-02,  6.81386003e-03, ...,\n",
+       "                         -2.19753687e-03,  5.88407274e-03, -7.93407857e-03],\n",
+       "                        [-1.05217602e-02,  9.43640154e-03, -6.24175705e-02, ...,\n",
+       "                         -3.55250388e-02, -6.71412144e-03,  2.17702035e-02]]],\n",
+       "                      dtype=float32)>\n",
+       "                (k): <tf.Variable 'transformer/layer_._2/rel_attn/k:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "                array([[[-0.00293928, -0.0109784 , -0.00407117, ...,  0.06720299,\n",
+       "                          0.00220658, -0.01070606],\n",
+       "                        [ 0.02917756,  0.01057504,  0.0149243 , ..., -0.02115533,\n",
+       "                         -0.03522046,  0.00336731],\n",
+       "                        [ 0.0072771 ,  0.00142857, -0.00595553, ..., -0.01464644,\n",
+       "                         -0.02712567, -0.00692069],\n",
+       "                        ...,\n",
+       "                        [ 0.00619581,  0.00026811,  0.03295753, ..., -0.04673641,\n",
+       "                          0.00351168, -0.01507777],\n",
+       "                        [ 0.00376089,  0.0103442 , -0.0184721 , ..., -0.01987653,\n",
+       "                          0.01558526, -0.00548268],\n",
+       "                        [-0.00744516, -0.00281895, -0.01078221, ...,  0.00610567,\n",
+       "                         -0.01862272,  0.00915155]],\n",
+       "                \n",
+       "                       [[-0.02782594, -0.0039578 ,  0.07950357, ..., -0.02373442,\n",
+       "                         -0.05951536, -0.01053701],\n",
+       "                        [-0.00720376,  0.01994296,  0.05216808, ...,  0.00521234,\n",
+       "                          0.04455427, -0.03069338],\n",
+       "                        [ 0.00991428,  0.02514814,  0.03120906, ..., -0.03899101,\n",
+       "                          0.017482  ,  0.02697489],\n",
+       "                        ...,\n",
+       "                        [-0.05309541, -0.00619643, -0.05110249, ..., -0.0535032 ,\n",
+       "                          0.04024338, -0.0384163 ],\n",
+       "                        [-0.02037921, -0.01771634,  0.03101053, ..., -0.00896538,\n",
+       "                          0.00090393,  0.01484353],\n",
+       "                        [-0.00921424,  0.0160069 , -0.00579366, ...,  0.02471853,\n",
+       "                         -0.01938148, -0.00959876]],\n",
+       "                \n",
+       "                       [[ 0.00509293, -0.02846905, -0.06832287, ...,  0.01379875,\n",
+       "                          0.01978015,  0.00669768],\n",
+       "                        [-0.00238889, -0.03830735, -0.07192513, ...,  0.02121064,\n",
+       "                         -0.02788975,  0.04276541],\n",
+       "                        [ 0.01299973, -0.02591552, -0.03836127, ..., -0.0018938 ,\n",
+       "                         -0.0080095 , -0.04260714],\n",
+       "                        ...,\n",
+       "                        [-0.00532516,  0.0437762 , -0.01197581, ..., -0.00461747,\n",
+       "                          0.02074965, -0.03320842],\n",
+       "                        [ 0.01869402,  0.00926195, -0.03418873, ...,  0.01149853,\n",
+       "                          0.00745646, -0.01764916],\n",
+       "                        [-0.00859777, -0.03077263,  0.02499374, ..., -0.03628961,\n",
+       "                          0.02713079, -0.02098218]],\n",
+       "                \n",
+       "                       ...,\n",
+       "                \n",
+       "                       [[-0.00255963, -0.00792341, -0.01311781, ..., -0.01471253,\n",
+       "                          0.00773418,  0.0028765 ],\n",
+       "                        [-0.01693467, -0.01684431,  0.01218338, ..., -0.00594166,\n",
+       "                          0.01953993, -0.00055485],\n",
+       "                        [ 0.00725681, -0.01396647, -0.01421928, ..., -0.02032903,\n",
+       "                          0.00128055, -0.01244337],\n",
+       "                        ...,\n",
+       "                        [ 0.04216336, -0.01187535,  0.03545079, ...,  0.05167695,\n",
+       "                         -0.03074895,  0.02474623],\n",
+       "                        [ 0.01909629,  0.00693916,  0.00172379, ...,  0.0171647 ,\n",
+       "                          0.01141954, -0.00754204],\n",
+       "                        [ 0.03014773,  0.00731963,  0.05709034, ...,  0.02683626,\n",
+       "                         -0.02091517,  0.02028517]],\n",
+       "                \n",
+       "                       [[ 0.0074964 , -0.00856717,  0.02979018, ...,  0.03537965,\n",
+       "                          0.00690144, -0.0624721 ],\n",
+       "                        [-0.00064552, -0.02535983, -0.01051644, ..., -0.00985349,\n",
+       "                          0.00672527,  0.04417474],\n",
+       "                        [ 0.06582981,  0.01555467,  0.0155565 , ...,  0.03326725,\n",
+       "                          0.01875504, -0.01086921],\n",
+       "                        ...,\n",
+       "                        [ 0.01764918,  0.02719252,  0.02960117, ...,  0.03690163,\n",
+       "                          0.02842108, -0.02001433],\n",
+       "                        [-0.03356929, -0.02933718,  0.04107409, ..., -0.02876418,\n",
+       "                         -0.03791892,  0.05297501],\n",
+       "                        [ 0.04199879,  0.03726116,  0.02551803, ...,  0.02520091,\n",
+       "                         -0.0426075 ,  0.04186616]],\n",
+       "                \n",
+       "                       [[-0.03414296,  0.00657422,  0.04984473, ..., -0.02375824,\n",
+       "                         -0.05163334, -0.02703283],\n",
+       "                        [-0.00742817,  0.03634953, -0.00377172, ..., -0.01132715,\n",
+       "                          0.03730771, -0.01465937],\n",
+       "                        [-0.02270306,  0.00535163, -0.02442615, ..., -0.06195223,\n",
+       "                          0.00054794,  0.0272242 ],\n",
+       "                        ...,\n",
+       "                        [-0.0495413 ,  0.02071496, -0.01031443, ..., -0.08232274,\n",
+       "                          0.0433554 , -0.05423561],\n",
+       "                        [ 0.02054976,  0.02180232, -0.00914375, ...,  0.02327339,\n",
+       "                          0.01977414, -0.02690084],\n",
+       "                        [ 0.00422481,  0.00880208,  0.04090318, ...,  0.03197616,\n",
+       "                          0.00156149, -0.00067797]]], dtype=float32)>\n",
+       "                (v): <tf.Variable 'transformer/layer_._2/rel_attn/v:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "                array([[[ 0.00665421, -0.00124323,  0.00077421, ...,  0.03188131,\n",
+       "                          0.0309326 , -0.01376203],\n",
+       "                        [ 0.05372431,  0.03682763, -0.01067041, ..., -0.00807943,\n",
+       "                         -0.00639856,  0.01343099],\n",
+       "                        [ 0.01893931, -0.01041871, -0.0559322 , ...,  0.01476059,\n",
+       "                         -0.02740676,  0.00521749],\n",
+       "                        ...,\n",
+       "                        [ 0.01157789, -0.00384533,  0.01601262, ...,  0.03651634,\n",
+       "                         -0.02067197,  0.02215986],\n",
+       "                        [ 0.03778082, -0.01276081,  0.03520799, ..., -0.00878477,\n",
+       "                          0.01457549, -0.02071035],\n",
+       "                        [ 0.00282983, -0.03704467,  0.02245468, ...,  0.04747025,\n",
+       "                         -0.03342215, -0.00695839]],\n",
+       "                \n",
+       "                       [[ 0.01376876, -0.03680427, -0.02725985, ...,  0.00445622,\n",
+       "                         -0.01388015, -0.05727502],\n",
+       "                        [ 0.04148179,  0.01627039, -0.03839501, ..., -0.01536803,\n",
+       "                          0.02744391, -0.00661899],\n",
+       "                        [-0.01462931, -0.00733666,  0.00704345, ..., -0.01936535,\n",
+       "                          0.00024902,  0.00248078],\n",
+       "                        ...,\n",
+       "                        [ 0.00872552, -0.01589725,  0.00721518, ...,  0.01352625,\n",
+       "                         -0.03614037, -0.00738423],\n",
+       "                        [-0.01501117, -0.00353953,  0.03562136, ..., -0.01327041,\n",
+       "                          0.01113886,  0.02501536],\n",
+       "                        [-0.00858908,  0.04791915,  0.01760549, ...,  0.0177771 ,\n",
+       "                         -0.00661571, -0.03333431]],\n",
+       "                \n",
+       "                       [[-0.01187906, -0.04443332,  0.04576288, ...,  0.00167149,\n",
+       "                         -0.00927628,  0.00616596],\n",
+       "                        [-0.01270569,  0.02138975, -0.05224277, ...,  0.00306947,\n",
+       "                          0.00871206, -0.05778804],\n",
+       "                        [ 0.01868859, -0.05713747, -0.0174821 , ..., -0.03733874,\n",
+       "                          0.02836852, -0.04284712],\n",
+       "                        ...,\n",
+       "                        [ 0.0349387 ,  0.03672682, -0.02753093, ...,  0.00166308,\n",
+       "                         -0.01772935,  0.00616858],\n",
+       "                        [-0.0030303 , -0.00437067, -0.0290189 , ...,  0.01580735,\n",
+       "                         -0.01613746, -0.03987672],\n",
+       "                        [ 0.01220608, -0.08185615,  0.02158659, ..., -0.02559558,\n",
+       "                          0.01645808, -0.03744602]],\n",
+       "                \n",
+       "                       ...,\n",
+       "                \n",
+       "                       [[ 0.0013312 , -0.05324713,  0.00172486, ..., -0.04377612,\n",
+       "                          0.05795961, -0.02054776],\n",
+       "                        [-0.01609062, -0.01902576,  0.00800247, ..., -0.02614984,\n",
+       "                          0.03733749,  0.00026225],\n",
+       "                        [-0.00247638, -0.01931726, -0.01522283, ...,  0.00588738,\n",
+       "                         -0.00190235, -0.00399782],\n",
+       "                        ...,\n",
+       "                        [ 0.06571385, -0.00344569, -0.00669769, ...,  0.001024  ,\n",
+       "                          0.03480022, -0.01587555],\n",
+       "                        [ 0.02889877,  0.03159959,  0.02333231, ..., -0.00581144,\n",
+       "                         -0.02998798, -0.03450729],\n",
+       "                        [-0.02668998, -0.0034108 , -0.0105373 , ..., -0.02762248,\n",
+       "                          0.00860727,  0.02687717]],\n",
+       "                \n",
+       "                       [[ 0.01648841, -0.01285174,  0.01358325, ..., -0.08152249,\n",
+       "                          0.04437737, -0.03391603],\n",
+       "                        [ 0.07113062, -0.0359729 , -0.01348723, ..., -0.0176398 ,\n",
+       "                          0.03200765,  0.06134365],\n",
+       "                        [ 0.01156471, -0.06770372,  0.02843059, ..., -0.01153438,\n",
+       "                         -0.01228396,  0.01346244],\n",
+       "                        ...,\n",
+       "                        [-0.00569895,  0.00055908,  0.06838486, ...,  0.08354934,\n",
+       "                          0.05700811,  0.00101427],\n",
+       "                        [ 0.01807693, -0.01333605, -0.00154606, ...,  0.01078754,\n",
+       "                          0.02314062,  0.01037679],\n",
+       "                        [-0.02781903, -0.05354921, -0.06595469, ..., -0.05279655,\n",
+       "                          0.01851269, -0.00904128]],\n",
+       "                \n",
+       "                       [[ 0.00583097,  0.04983573,  0.03094061, ..., -0.02316775,\n",
+       "                         -0.02365098,  0.01838909],\n",
+       "                        [-0.02851329,  0.01512148,  0.02271658, ..., -0.03578778,\n",
+       "                          0.0036391 , -0.01013733],\n",
+       "                        [-0.10941688, -0.05352794, -0.03661714, ...,  0.01911658,\n",
+       "                         -0.0331871 ,  0.01334788],\n",
+       "                        ...,\n",
+       "                        [ 0.02926285, -0.00778401, -0.00936453, ...,  0.05407878,\n",
+       "                         -0.02920299, -0.00677245],\n",
+       "                        [ 0.00341181, -0.01542326, -0.00013787, ...,  0.00919122,\n",
+       "                         -0.00327538,  0.00982734],\n",
+       "                        [ 0.04222366, -0.00887216,  0.04550539, ..., -0.03900504,\n",
+       "                          0.02140583, -0.05328723]]], dtype=float32)>\n",
+       "                (o): <tf.Variable 'transformer/layer_._2/rel_attn/o:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "                array([[[-0.0459144 ,  0.04068733, -0.01355186, ..., -0.01989118,\n",
+       "                         -0.03472243,  0.01304346],\n",
+       "                        [-0.03370773, -0.03767217,  0.01916665, ...,  0.02566565,\n",
+       "                          0.01706363,  0.0169379 ],\n",
+       "                        [ 0.02327448,  0.02124598, -0.00851453, ...,  0.04678395,\n",
+       "                         -0.03150146,  0.02959211],\n",
+       "                        ...,\n",
+       "                        [ 0.02368829,  0.03962338,  0.01558492, ...,  0.0044567 ,\n",
+       "                         -0.0315103 ,  0.04004923],\n",
+       "                        [ 0.01133197, -0.01993851,  0.027225  , ..., -0.02620822,\n",
+       "                          0.00454007,  0.01773539],\n",
+       "                        [-0.03604782, -0.03206643,  0.01872083, ...,  0.06024332,\n",
+       "                         -0.00716398,  0.0511735 ]],\n",
+       "                \n",
+       "                       [[ 0.00405366, -0.04948125,  0.03672703, ..., -0.00733926,\n",
+       "                         -0.01024133, -0.0456225 ],\n",
+       "                        [ 0.04979887,  0.01724279, -0.01421242, ..., -0.00306262,\n",
+       "                          0.02512117,  0.02159863],\n",
+       "                        [-0.03722695,  0.00468144,  0.0289183 , ..., -0.05651103,\n",
+       "                          0.02156329, -0.00495635],\n",
+       "                        ...,\n",
+       "                        [ 0.01668868,  0.01374733,  0.00024095, ...,  0.02230918,\n",
+       "                         -0.03669459, -0.01169418],\n",
+       "                        [-0.01635886, -0.00344317,  0.01114676, ..., -0.02080308,\n",
+       "                          0.01682055,  0.00250151],\n",
+       "                        [-0.01110393, -0.02011649,  0.01129264, ...,  0.02056844,\n",
+       "                         -0.02213018, -0.00444395]],\n",
+       "                \n",
+       "                       [[-0.00764826, -0.01075712, -0.065015  , ..., -0.00079673,\n",
+       "                         -0.04441076,  0.02999873],\n",
+       "                        [ 0.02219415, -0.04028346, -0.03506127, ...,  0.01997649,\n",
+       "                          0.00269448, -0.02619188],\n",
+       "                        [-0.04424787, -0.01318666, -0.00114819, ..., -0.04353184,\n",
+       "                          0.05100081, -0.00196214],\n",
+       "                        ...,\n",
+       "                        [-0.00140231,  0.04148398, -0.02321989, ..., -0.02140379,\n",
+       "                          0.00641817, -0.00452846],\n",
+       "                        [-0.00375441, -0.01005294,  0.00477563, ...,  0.03219246,\n",
+       "                         -0.0210044 , -0.00747442],\n",
+       "                        [ 0.01919622, -0.03384344,  0.02077735, ..., -0.01202968,\n",
+       "                          0.02690425,  0.01807844]],\n",
+       "                \n",
+       "                       ...,\n",
+       "                \n",
+       "                       [[-0.01119938, -0.01464343,  0.00398871, ...,  0.00364551,\n",
+       "                          0.00344581, -0.00462025],\n",
+       "                        [ 0.06504844, -0.01730673,  0.02013603, ..., -0.02582743,\n",
+       "                         -0.03860147, -0.0139975 ],\n",
+       "                        [-0.04559997,  0.00583538, -0.00664801, ..., -0.0149008 ,\n",
+       "                          0.03558432, -0.01965741],\n",
+       "                        ...,\n",
+       "                        [ 0.00025523,  0.00819261, -0.0307526 , ..., -0.01076851,\n",
+       "                          0.02486686, -0.02093521],\n",
+       "                        [ 0.02401941,  0.03498043,  0.0014439 , ...,  0.01171041,\n",
+       "                         -0.00058519, -0.02835972],\n",
+       "                        [ 0.00732349, -0.00456121, -0.03796291, ..., -0.03865096,\n",
+       "                         -0.01785722, -0.04314538]],\n",
+       "                \n",
+       "                       [[ 0.00726655,  0.03450558,  0.02211844, ..., -0.03010445,\n",
+       "                         -0.02838681, -0.0039719 ],\n",
+       "                        [-0.01016848,  0.01256592,  0.07358556, ..., -0.0117584 ,\n",
+       "                          0.04732952, -0.02382375],\n",
+       "                        [-0.02834523,  0.01466386,  0.03074974, ..., -0.00940978,\n",
+       "                         -0.00022519, -0.07195798],\n",
+       "                        ...,\n",
+       "                        [ 0.01355847,  0.01601157,  0.02397542, ...,  0.03484057,\n",
+       "                          0.04077799, -0.03013852],\n",
+       "                        [ 0.00740167,  0.02471284, -0.0393412 , ...,  0.02263542,\n",
+       "                          0.01461129,  0.01385937],\n",
+       "                        [ 0.02695005, -0.00959161, -0.01261136, ..., -0.00971951,\n",
+       "                          0.03261755,  0.00980215]],\n",
+       "                \n",
+       "                       [[ 0.02489883, -0.02117315, -0.01708841, ...,  0.02682983,\n",
+       "                          0.02765293, -0.03892074],\n",
+       "                        [ 0.00359684,  0.02647137, -0.0155964 , ..., -0.02545275,\n",
+       "                         -0.01858809, -0.01930472],\n",
+       "                        [-0.01306243,  0.00480867,  0.00555033, ...,  0.00739669,\n",
+       "                         -0.02284159, -0.00387958],\n",
+       "                        ...,\n",
+       "                        [ 0.01714972, -0.00192116,  0.00112109, ..., -0.01120449,\n",
+       "                         -0.02290132, -0.00165214],\n",
+       "                        [-0.02095219, -0.00792485,  0.00188622, ...,  0.01830022,\n",
+       "                          0.00613669, -0.02693458],\n",
+       "                        [-0.05250171, -0.0118492 , -0.01927755, ..., -0.01943363,\n",
+       "                          0.01223021, -0.01266978]]], dtype=float32)>\n",
+       "                (r): <tf.Variable 'transformer/layer_._2/rel_attn/r:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "                array([[[-1.74154818e-01,  1.71483576e-01, -1.57918856e-01, ...,\n",
+       "                         -1.09398648e-01, -1.66214570e-01,  1.69107735e-01],\n",
+       "                        [-1.34248465e-01, -1.37429506e-01,  1.49386033e-01, ...,\n",
+       "                          1.27640173e-01,  1.43373027e-01, -1.56313241e-01],\n",
+       "                        [-1.09571531e-01, -1.28932819e-01, -1.36733443e-01, ...,\n",
+       "                         -1.53899968e-01, -1.61415860e-01, -1.55967340e-01],\n",
+       "                        ...,\n",
+       "                        [-2.67540216e-02,  9.91882980e-02, -5.10194190e-02, ...,\n",
+       "                         -3.43626109e-03,  3.33151408e-02, -3.82135659e-02],\n",
+       "                        [ 6.43306673e-02,  4.39539142e-02, -2.82719377e-02, ...,\n",
+       "                          5.20758294e-02,  4.51205000e-02, -1.25731584e-02],\n",
+       "                        [-1.54505864e-01, -1.45732820e-01, -1.48832098e-01, ...,\n",
+       "                         -1.36694744e-01,  1.42165855e-01, -1.38038144e-01]],\n",
+       "                \n",
+       "                       [[-1.34223402e-01,  1.29062846e-01, -1.10095568e-01, ...,\n",
+       "                         -4.56332713e-02, -1.35236993e-01,  1.25871733e-01],\n",
+       "                        [-1.04855791e-01, -9.51494128e-02,  1.04910910e-01, ...,\n",
+       "                          1.04753070e-01,  1.28032610e-01, -1.11456059e-01],\n",
+       "                        [-9.41539183e-02, -1.49656698e-01, -1.33008048e-01, ...,\n",
+       "                         -1.56195447e-01, -1.33284256e-01, -1.50071308e-01],\n",
+       "                        ...,\n",
+       "                        [-1.65088084e-02,  7.33572915e-02, -3.98807749e-02, ...,\n",
+       "                          2.30416749e-02,  1.75641049e-02, -4.62100022e-02],\n",
+       "                        [ 3.67465951e-02,  4.43068817e-02, -1.63640715e-02, ...,\n",
+       "                          4.77316864e-02,  4.48581763e-02,  1.15232123e-03],\n",
+       "                        [-1.06183678e-01, -9.87367705e-02, -1.01419248e-01, ...,\n",
+       "                         -8.46716315e-02,  8.80824402e-02, -1.13163486e-01]],\n",
+       "                \n",
+       "                       [[-9.73633751e-02,  8.78513753e-02, -1.10944688e-01, ...,\n",
+       "                         -5.38534336e-02, -9.78744626e-02,  1.34479314e-01],\n",
+       "                        [-8.19151998e-02, -9.94543955e-02,  5.58716655e-02, ...,\n",
+       "                          9.10466388e-02,  8.79919752e-02, -7.91056827e-02],\n",
+       "                        [-1.07165791e-01, -1.16330668e-01, -1.04530655e-01, ...,\n",
+       "                         -1.26266211e-01, -1.14166744e-01, -1.32683665e-01],\n",
+       "                        ...,\n",
+       "                        [-6.09156210e-03,  5.80127090e-02, -3.35601829e-02, ...,\n",
+       "                         -1.27315565e-04,  1.89231914e-02, -1.03578214e-02],\n",
+       "                        [ 3.55091467e-02,  3.06853075e-02, -3.44112329e-02, ...,\n",
+       "                          4.85388599e-02,  9.87971947e-03, -2.19964515e-02],\n",
+       "                        [-6.60627335e-02, -6.56424835e-02, -8.05212483e-02, ...,\n",
+       "                         -7.00480193e-02,  7.31544569e-02, -6.39438108e-02]],\n",
+       "                \n",
+       "                       ...,\n",
+       "                \n",
+       "                       [[-1.48311350e-02, -1.23089608e-02,  3.57820955e-03, ...,\n",
+       "                         -2.04090904e-02,  1.94556732e-03, -1.02494638e-02],\n",
+       "                        [ 4.35499102e-03, -6.63030194e-04,  1.95456371e-02, ...,\n",
+       "                         -6.83242688e-03, -1.00761633e-02, -1.73593359e-03],\n",
+       "                        [-1.80752464e-02, -1.66376941e-02, -1.10558709e-02, ...,\n",
+       "                         -2.73382664e-02,  1.69053709e-03, -1.61816720e-02],\n",
+       "                        ...,\n",
+       "                        [ 1.91931371e-02, -7.00070197e-03,  2.42002066e-02, ...,\n",
+       "                          3.97639628e-03, -8.44740868e-03,  1.29894456e-02],\n",
+       "                        [-8.07208288e-03, -4.40871762e-03,  4.02785353e-02, ...,\n",
+       "                         -2.72978912e-03, -2.89322101e-02,  1.82679240e-02],\n",
+       "                        [-2.15032008e-02, -2.35424191e-02, -3.08847502e-02, ...,\n",
+       "                         -2.68492289e-02,  9.08977166e-03, -2.62664557e-02]],\n",
+       "                \n",
+       "                       [[ 4.63743974e-03,  8.47169757e-03, -1.44635988e-02, ...,\n",
+       "                         -1.65978130e-02,  1.24762636e-02,  2.84114317e-03],\n",
+       "                        [ 2.10315473e-02,  3.91109427e-03,  1.73604600e-02, ...,\n",
+       "                         -2.32025096e-03,  5.87290479e-03,  9.85332299e-05],\n",
+       "                        [-2.55174581e-02, -5.42022474e-03,  4.37739212e-03, ...,\n",
+       "                         -2.30460241e-03,  3.03133507e-03, -1.33659486e-02],\n",
+       "                        ...,\n",
+       "                        [-1.23453815e-03, -1.62221733e-02,  1.88910943e-02, ...,\n",
+       "                         -2.35769432e-02,  1.02529228e-02,  9.97068919e-03],\n",
+       "                        [ 1.09659694e-02,  4.10200097e-03, -3.22548039e-02, ...,\n",
+       "                          9.11346730e-03,  1.90772861e-02, -2.13330518e-02],\n",
+       "                        [ 8.70900694e-03,  3.51738883e-03, -1.52583178e-02, ...,\n",
+       "                         -3.99373658e-03, -7.65542360e-03,  1.30024115e-02]],\n",
+       "                \n",
+       "                       [[-1.07049560e-02,  2.16062423e-02, -2.15930026e-02, ...,\n",
+       "                          1.26719456e-02,  7.11302564e-05,  8.03572778e-03],\n",
+       "                        [ 1.24141166e-04,  7.36288028e-03, -6.79872115e-04, ...,\n",
+       "                          2.49428093e-03, -1.16298664e-02,  2.27960074e-04],\n",
+       "                        [-9.86421760e-03, -2.49710362e-02, -2.40540970e-02, ...,\n",
+       "                         -4.42250725e-03, -2.89662927e-02, -1.20275375e-02],\n",
+       "                        ...,\n",
+       "                        [ 3.12622730e-03, -6.99984375e-03, -2.77643427e-02, ...,\n",
+       "                         -1.10041993e-02, -2.18351595e-02,  2.90531025e-05],\n",
+       "                        [-3.10673728e-03, -1.49604697e-02,  1.97154842e-02, ...,\n",
+       "                          2.03390904e-02, -1.56578294e-03, -5.11408225e-03],\n",
+       "                        [ 2.66231168e-02,  1.82542447e-02,  2.63125654e-02, ...,\n",
+       "                          1.70649234e-02, -2.89466791e-02,  2.94499528e-02]]],\n",
+       "                      dtype=float32)>\n",
+       "                (r_r_bias): <tf.Variable 'transformer/layer_._2/rel_attn/r_r_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "                array([[ 0.2688689 , -0.26965415,  0.24901254, -0.21432097, -0.2537209 ,\n",
+       "                        -0.25497636, -0.25866804, -0.26985508,  0.279801  ,  0.13522011,\n",
+       "                         0.25756484, -0.24836208],\n",
+       "                       [ 0.22552061,  0.24260372, -0.19067137,  0.22706836,  0.24444126,\n",
+       "                        -0.22470543, -0.20988142,  0.21856506, -0.21155524, -0.23370892,\n",
+       "                        -0.24733196,  0.22796093],\n",
+       "                       [ 0.17451425,  0.24542138,  0.25050005,  0.22542311,  0.23060308,\n",
+       "                         0.23414634, -0.24786818, -0.22182368, -0.26085967,  0.2449251 ,\n",
+       "                         0.23860171,  0.2544802 ],\n",
+       "                       [-0.26321352,  0.25723347, -0.26902857,  0.26281124, -0.2697539 ,\n",
+       "                        -0.25095993,  0.2511667 , -0.26299623,  0.25617778, -0.26167557,\n",
+       "                         0.23467393, -0.2685565 ],\n",
+       "                       [ 0.17467302, -0.16205215, -0.1877693 ,  0.19500752,  0.2010059 ,\n",
+       "                         0.19327593, -0.15914948, -0.15686454,  0.17404646, -0.18154949,\n",
+       "                        -0.19225396, -0.22171909],\n",
+       "                       [ 0.2911585 ,  0.2944224 ,  0.30023518, -0.28492442,  0.29406187,\n",
+       "                         0.27411905,  0.28787902,  0.2629663 , -0.2700486 ,  0.28186122,\n",
+       "                         0.26866576, -0.2760028 ],\n",
+       "                       [ 0.23711525,  0.24224289,  0.2396094 ,  0.23603547,  0.22876322,\n",
+       "                        -0.1514269 , -0.21984197, -0.25572085,  0.22679004, -0.22610106,\n",
+       "                        -0.18015033,  0.23062935],\n",
+       "                       [ 0.14032885,  0.17071794, -0.17316875, -0.16643512,  0.1764703 ,\n",
+       "                        -0.16535877,  0.16976672, -0.17395648, -0.18172397, -0.16909888,\n",
+       "                        -0.15671346,  0.17406578],\n",
+       "                       [ 0.27129218,  0.0269384 ,  0.30974644, -0.32017758,  0.30744395,\n",
+       "                         0.3084069 ,  0.29277486, -0.2918221 ,  0.30702245, -0.3208851 ,\n",
+       "                        -0.31668597,  0.30160227],\n",
+       "                       [ 0.20867229,  0.26565212,  0.240152  ,  0.25398126,  0.25057864,\n",
+       "                        -0.2671012 , -0.22444747, -0.25539088, -0.20067541,  0.24432313,\n",
+       "                         0.25486085,  0.24394904],\n",
+       "                       [-0.11263231, -0.10217136,  0.11905885,  0.11843061, -0.04683039,\n",
+       "                        -0.1214601 , -0.13461663, -0.11759   , -0.09937124, -0.11690577,\n",
+       "                        -0.11399411, -0.11268682],\n",
+       "                       [-0.3255043 ,  0.3025848 , -0.32363445,  0.31425825,  0.33041543,\n",
+       "                        -0.32620475,  0.33724216, -0.34903747,  0.33359587, -0.32901266,\n",
+       "                        -0.20129874, -0.27945545],\n",
+       "                       [-0.28321803,  0.30109507,  0.28544128, -0.2959158 , -0.2607007 ,\n",
+       "                        -0.3055412 , -0.2917673 ,  0.05050412,  0.29260388,  0.3141212 ,\n",
+       "                         0.2934034 ,  0.27473462],\n",
+       "                       [ 0.13607652, -0.15221834,  0.12748647,  0.13965258, -0.13058284,\n",
+       "                         0.11827224, -0.14616172, -0.1512048 , -0.14531319,  0.12655123,\n",
+       "                        -0.13622668,  0.14556718],\n",
+       "                       [-0.11822458, -0.13290364,  0.12828259, -0.10410035,  0.11239365,\n",
+       "                        -0.1154983 ,  0.11172337, -0.07072505, -0.13299397, -0.14156868,\n",
+       "                        -0.13565728,  0.12855493],\n",
+       "                       [ 0.21563186,  0.2163769 ,  0.20157547, -0.1918813 ,  0.2039993 ,\n",
+       "                        -0.17185296,  0.20537192, -0.22688936,  0.17318453,  0.20538278,\n",
+       "                        -0.20797041,  0.21802594]], dtype=float32)>\n",
+       "                (r_s_bias): <tf.Variable 'transformer/layer_._2/rel_attn/r_s_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "                array([[0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.]], dtype=float32)>\n",
+       "                (r_w_bias): <tf.Variable 'transformer/layer_._2/rel_attn/r_w_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "                array([[-0.05696932,  0.06740195, -0.04667107,  0.03021106,  0.06784655,\n",
+       "                         0.05382765,  0.11438312,  0.06822202, -0.05993791,  0.0104263 ,\n",
+       "                        -0.05300143,  0.05010788],\n",
+       "                       [-0.01765995, -0.00319457, -0.00498415, -0.02782676, -0.0098952 ,\n",
+       "                         0.0253829 ,  0.00407754, -0.00715973, -0.01590695,  0.03437943,\n",
+       "                        -0.00520796,  0.01617681],\n",
+       "                       [ 0.03272007, -0.02977583, -0.0506134 , -0.02890366, -0.02049887,\n",
+       "                        -0.01999169,  0.02516508,  0.0137186 ,  0.05666393,  0.01375697,\n",
+       "                        -0.00890318, -0.02950851],\n",
+       "                       [ 0.04980705, -0.10362899,  0.11056181, -0.00730947,  0.0607907 ,\n",
+       "                         0.11900052, -0.05051542,  0.00662729, -0.07860364,  0.10183192,\n",
+       "                        -0.06212043,  0.10200542],\n",
+       "                       [-0.01238653,  0.01794332,  0.01029513,  0.01060856,  0.06930448,\n",
+       "                         0.02380366,  0.03477835, -0.00071606, -0.01467696,  0.02097475,\n",
+       "                        -0.05677698, -0.02087275],\n",
+       "                       [-0.00938045, -0.10405949, -0.16658893,  0.11485966, -0.09381208,\n",
+       "                        -0.09224471, -0.08554322, -0.10385393,  0.05632018, -0.08339553,\n",
+       "                        -0.07872038,  0.08625405],\n",
+       "                       [-0.00826191,  0.00976967, -0.05739374, -0.0021869 , -0.01485464,\n",
+       "                         0.04506572,  0.01217067, -0.02800449, -0.05174134,  0.00862589,\n",
+       "                        -0.048445  , -0.01480543],\n",
+       "                       [-0.03782475,  0.02112421, -0.02993089,  0.02389399,  0.01590282,\n",
+       "                        -0.07890326,  0.02925709, -0.01764274, -0.01462149, -0.02284196,\n",
+       "                        -0.00965995,  0.03196143],\n",
+       "                       [-0.0716677 ,  0.02040408, -0.10738931,  0.01476234, -0.13842428,\n",
+       "                        -0.16400102, -0.10327879,  0.12093128, -0.10067357,  0.06000268,\n",
+       "                         0.1498203 , -0.13828841],\n",
+       "                       [-0.0734336 , -0.03922071,  0.04693641,  0.04044463, -0.02889867,\n",
+       "                         0.02146053,  0.02633213,  0.03645428,  0.01565466, -0.03198807,\n",
+       "                        -0.04235039, -0.03586181],\n",
+       "                       [-0.0363492 , -0.01702744,  0.01083277,  0.03850618, -0.03934945,\n",
+       "                         0.0334761 , -0.01588807, -0.02619908, -0.03216818, -0.01060551,\n",
+       "                        -0.02627585, -0.02604468],\n",
+       "                       [ 0.17790402, -0.12851508,  0.15003633, -0.08518519, -0.14476636,\n",
+       "                         0.15762399, -0.1230861 ,  0.11259855, -0.1162812 ,  0.04080873,\n",
+       "                        -0.05779656,  0.01974249],\n",
+       "                       [ 0.1006938 , -0.01474479, -0.12138946,  0.09284463, -0.03289664,\n",
+       "                         0.10987794,  0.07332658,  0.07245267, -0.06578953, -0.04563607,\n",
+       "                        -0.05779454, -0.10485042],\n",
+       "                       [ 0.02835969, -0.02732395, -0.03461828,  0.03488555, -0.0194285 ,\n",
+       "                        -0.02805083, -0.03940667, -0.04644369, -0.04771877,  0.0372751 ,\n",
+       "                        -0.04531232,  0.04370135],\n",
+       "                       [-0.03590996, -0.0298533 ,  0.03344881, -0.02929044,  0.0327831 ,\n",
+       "                        -0.03273273,  0.03038734, -0.01118592, -0.02868269, -0.02645629,\n",
+       "                        -0.03735423,  0.03250728],\n",
+       "                       [ 0.02255821, -0.00829006,  0.02793193, -0.03778297, -0.00788219,\n",
+       "                        -0.04285704,  0.02978727,  0.05981049, -0.03792181,  0.03670314,\n",
+       "                        -0.02965603,  0.01923521]], dtype=float32)>\n",
+       "                (seg_embed): <tf.Variable 'transformer/layer_._2/rel_attn/seg_embed:0' shape=(2, 16, 12) dtype=float32, numpy=\n",
+       "                array([[[-1.76201500e-02,  7.23677780e-03,  2.01333477e-03,\n",
+       "                         -2.08359188e-03, -1.94589060e-03, -4.36071586e-03,\n",
+       "                         -2.57775449e-04,  7.59294024e-03, -1.73478248e-03,\n",
+       "                         -8.46251752e-03, -1.39660882e-02, -3.43717635e-03],\n",
+       "                        [-4.64910455e-03, -1.21313529e-02,  4.58984112e-04,\n",
+       "                         -1.35235321e-02, -1.04260454e-02, -1.50275379e-02,\n",
+       "                          1.48641376e-03,  1.55189037e-02,  5.91089716e-03,\n",
+       "                         -1.43639045e-03, -4.50501451e-03, -1.60674599e-03],\n",
+       "                        [ 1.60457045e-02,  1.19220214e-02, -1.28411585e-02,\n",
+       "                          9.09075513e-03, -1.58246304e-03,  1.31560909e-03,\n",
+       "                          1.35482438e-02,  5.81168523e-03, -1.05840880e-02,\n",
+       "                         -2.59173219e-03, -1.32385837e-02, -1.04863010e-02],\n",
+       "                        [-1.21809123e-02, -9.36632976e-03,  1.40900621e-02,\n",
+       "                          5.91376238e-03,  3.72369075e-03, -2.30165408e-03,\n",
+       "                          6.51500374e-03, -1.45569751e-02,  1.43247042e-02,\n",
+       "                          8.62884428e-03,  8.86701699e-03,  7.06208264e-03],\n",
+       "                        [ 1.02975138e-03, -1.51113952e-02,  1.51367933e-02,\n",
+       "                          9.86063853e-03, -2.37684697e-03,  1.99867710e-02,\n",
+       "                          8.06052238e-03, -7.84497056e-03,  3.50654381e-03,\n",
+       "                          3.82472947e-03, -3.21561890e-03,  7.42827263e-03],\n",
+       "                        [-1.18214521e-03, -1.43715926e-02, -8.06425512e-03,\n",
+       "                         -4.83092666e-03, -6.24039629e-03, -8.07906594e-03,\n",
+       "                         -8.29043146e-03, -1.61064218e-03,  4.77965921e-03,\n",
+       "                         -1.74443778e-02,  1.33291204e-02,  2.52250186e-03],\n",
+       "                        [-2.72214878e-04, -5.96261350e-03, -4.04428970e-03,\n",
+       "                         -6.11912599e-03, -6.60097087e-03,  1.76098440e-02,\n",
+       "                          2.69631855e-03,  1.54615650e-02, -2.30501313e-03,\n",
+       "                          1.05330944e-02,  6.35499740e-03,  9.17971018e-04],\n",
+       "                        [ 1.18885133e-02, -1.31673440e-02, -1.38173029e-02,\n",
+       "                         -3.70214053e-04,  5.35412400e-04, -1.37663968e-02,\n",
+       "                          1.87561940e-02, -2.42887018e-03,  1.48599371e-02,\n",
+       "                          3.21199768e-03, -1.09921275e-02, -5.65451774e-05],\n",
+       "                        [-3.74776288e-03,  1.38268322e-02,  9.05366149e-04,\n",
+       "                          1.20775551e-02,  1.10800657e-02, -8.72297771e-03,\n",
+       "                          4.18304279e-03,  4.37156297e-03, -1.07811140e-02,\n",
+       "                          1.92405155e-03,  3.25367018e-03,  8.75506643e-03],\n",
+       "                        [-1.75420940e-02,  6.48414111e-03, -9.18684620e-03,\n",
+       "                          1.14019576e-03, -1.57787383e-03,  5.56192547e-03,\n",
+       "                         -2.17733742e-03,  1.37266740e-02,  1.05201543e-04,\n",
+       "                          6.03883620e-03, -6.69960165e-03,  7.33956508e-03],\n",
+       "                        [-3.18406359e-03, -3.90002085e-03,  1.50526362e-02,\n",
+       "                         -1.12941780e-03,  7.90258031e-03,  5.57251694e-03,\n",
+       "                         -7.09417462e-03,  1.54607017e-02,  7.53346644e-03,\n",
+       "                          3.84633575e-04, -3.10583878e-03, -1.67749040e-02],\n",
+       "                        [ 1.35503442e-03,  1.14696333e-02,  1.69651874e-03,\n",
+       "                         -7.29335006e-03, -5.32992696e-03,  1.07378103e-02,\n",
+       "                          4.87127202e-03, -2.83743930e-03,  1.49954585e-02,\n",
+       "                         -4.96328762e-03,  3.51505092e-04, -1.27301645e-02],\n",
+       "                        [-1.52372206e-02,  1.93297828e-03,  1.31188966e-02,\n",
+       "                          1.51950726e-02, -5.42309275e-03,  5.40221622e-03,\n",
+       "                         -4.99887299e-03,  1.21317999e-02, -7.83546944e-04,\n",
+       "                         -1.46692842e-02,  3.18376743e-03,  6.29057584e-04],\n",
+       "                        [ 1.57519914e-02,  1.33262370e-02,  1.81965269e-02,\n",
+       "                         -7.42383441e-03, -1.89367812e-02, -6.97921682e-03,\n",
+       "                          1.48802875e-02,  1.46334016e-04,  7.02118780e-03,\n",
+       "                         -5.09436592e-04, -1.18623655e-02,  8.64821393e-03],\n",
+       "                        [ 7.67512945e-03, -8.17312021e-03,  2.41133641e-03,\n",
+       "                          6.33313879e-03,  7.54179759e-03, -3.57080396e-04,\n",
+       "                         -1.65680032e-02, -1.17100859e-02, -3.40799033e-03,\n",
+       "                         -1.27221271e-02,  8.30271374e-03,  7.56895775e-03],\n",
+       "                        [-9.88331065e-03, -1.54634397e-02,  3.01517267e-03,\n",
+       "                          1.49145685e-02,  3.77843564e-04,  5.24123758e-03,\n",
+       "                          7.02060014e-03, -1.07852966e-02,  1.04165310e-02,\n",
+       "                         -1.54804869e-03,  1.93265197e-03,  1.79295102e-03]],\n",
+       "                \n",
+       "                       [[-9.20055062e-03, -4.07590671e-03,  1.03095314e-02,\n",
+       "                          1.51754147e-03, -6.64392672e-03,  3.19885346e-03,\n",
+       "                         -4.18524677e-03, -1.13258476e-03, -1.70869473e-02,\n",
+       "                          1.26075298e-02, -1.30983908e-02, -7.83024263e-03],\n",
+       "                        [ 8.46219435e-03,  1.79808959e-02, -5.26713906e-03,\n",
+       "                         -1.21411623e-03,  1.86999720e-02, -3.02859768e-03,\n",
+       "                         -7.32064573e-03,  6.67995447e-03, -1.27523849e-02,\n",
+       "                         -9.06828791e-04,  9.74638015e-03, -1.72092929e-03],\n",
+       "                        [-2.01144046e-03, -5.63319679e-03, -5.22003649e-03,\n",
+       "                         -6.08433876e-03, -4.08862112e-03,  1.46857975e-02,\n",
+       "                          5.76145761e-03, -5.26309886e-04,  1.52066564e-02,\n",
+       "                         -9.31825582e-03,  1.23050511e-02, -4.26228344e-03],\n",
+       "                        [ 5.15877875e-03,  1.52563385e-03,  3.33353621e-03,\n",
+       "                          1.24664837e-02,  2.89318291e-03,  1.85139419e-03,\n",
+       "                          1.32558951e-02, -6.19108090e-03, -9.30891279e-03,\n",
+       "                         -1.32808858e-03,  7.90562108e-03, -1.03561748e-02],\n",
+       "                        [ 5.24061127e-03,  1.13433264e-02,  9.25735664e-03,\n",
+       "                         -4.02201712e-03,  2.17584849e-04,  5.15505997e-03,\n",
+       "                          1.17364945e-02, -2.31140363e-03, -5.13278367e-03,\n",
+       "                          1.39841707e-02,  6.70559751e-03, -6.61857938e-03],\n",
+       "                        [-8.77800304e-03,  2.86807003e-03, -2.38788500e-03,\n",
+       "                         -4.60851612e-03, -1.44038992e-02, -1.35576446e-02,\n",
+       "                          2.62864912e-03,  1.24858366e-02, -4.75487951e-03,\n",
+       "                         -1.43712144e-02,  7.60273263e-03,  3.79640306e-03],\n",
+       "                        [-7.03944918e-03,  1.97168030e-02, -7.26960087e-03,\n",
+       "                         -1.95749779e-03,  1.92702599e-02,  4.81317611e-03,\n",
+       "                          3.79350944e-03, -4.26485110e-03, -8.09873175e-03,\n",
+       "                          9.86441132e-03,  1.22883695e-03,  1.08946105e-02],\n",
+       "                        [-5.65246725e-03,  1.21349460e-02,  8.74449220e-03,\n",
+       "                          2.44105165e-03,  9.21645202e-04, -1.55313788e-02,\n",
+       "                         -5.02558984e-03, -8.27753078e-03,  1.90036907e-03,\n",
+       "                         -5.53005328e-03, -4.72517498e-03,  2.99230800e-03],\n",
+       "                        [ 9.09654330e-03,  3.31225386e-03, -9.27547738e-03,\n",
+       "                          1.19113754e-02, -1.02159902e-02,  6.25002244e-03,\n",
+       "                          1.22169312e-02, -9.51310806e-03,  1.30269127e-02,\n",
+       "                         -9.39868111e-03, -5.70971100e-03, -4.75845346e-03],\n",
+       "                        [-7.14318268e-03, -1.64083187e-02, -2.20953533e-03,\n",
+       "                          6.77416055e-03,  7.19653070e-03, -7.37716153e-04,\n",
+       "                         -9.68988799e-03, -8.25300999e-03, -4.56864573e-03,\n",
+       "                         -2.91621801e-03, -5.80342347e-03, -3.35400272e-03],\n",
+       "                        [-1.02773616e-02, -5.61380177e-04,  1.61001328e-02,\n",
+       "                          2.81318300e-03, -4.40954976e-03,  1.18312403e-03,\n",
+       "                          6.44329004e-03, -6.98125642e-03, -1.70135554e-02,\n",
+       "                         -3.60937743e-03, -7.53390486e-04, -2.80036475e-03],\n",
+       "                        [ 3.10404622e-03,  1.14401504e-02, -5.79726277e-03,\n",
+       "                          1.60975326e-02,  6.44704467e-03, -1.83150265e-02,\n",
+       "                          1.08390385e-02,  1.02912402e-02, -8.38461891e-03,\n",
+       "                          5.39217493e-04, -9.44596343e-03, -7.39992782e-03],\n",
+       "                        [-2.65034917e-03, -8.84522311e-03, -9.31692962e-03,\n",
+       "                          5.32580819e-03, -1.69087376e-03,  2.63938890e-03,\n",
+       "                          8.64508655e-03,  1.84377395e-02,  1.37084173e-02,\n",
+       "                         -1.89692043e-02,  1.31469080e-02,  1.86770391e-02],\n",
+       "                        [ 2.77522532e-03,  7.73473585e-04, -3.17918998e-03,\n",
+       "                          6.54795533e-03,  2.26482097e-03,  2.92668981e-03,\n",
+       "                          9.05719213e-03, -8.49937089e-03, -7.30413711e-04,\n",
+       "                          5.80394780e-03, -1.54569661e-02, -6.13560947e-03],\n",
+       "                        [-5.60323242e-03,  3.84009560e-03,  1.06589124e-02,\n",
+       "                         -8.98534432e-03,  1.82283614e-02, -5.89990197e-03,\n",
+       "                         -8.10589176e-03,  2.83340388e-03,  1.38193602e-02,\n",
+       "                         -9.81133338e-03,  1.99420359e-02,  9.88560077e-03],\n",
+       "                        [-9.26352944e-03, -9.68698412e-03, -2.24529719e-03,\n",
+       "                          5.43415966e-03,  1.32604288e-02, -3.96666024e-03,\n",
+       "                         -1.34215793e-02,  1.25270914e-02, -1.48909222e-02,\n",
+       "                          2.03456427e-03, -6.15184056e-03, -1.86165944e-02]]],\n",
+       "                      dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (ff): TFXLNetFeedForward(\n",
+       "                (layer_norm): LayerNormalization(\n",
+       "                  (axis): List(\n",
+       "                    (0): 2\n",
+       "                  )\n",
+       "                  (gamma): <tf.Variable 'transformer/layer_._2/ff/layer_norm/gamma:0' shape=(192,) dtype=float32, numpy=\n",
+       "                  array([1.2426662 , 1.0785499 , 1.1864272 , 1.1377372 , 1.1753842 ,\n",
+       "                         1.021473  , 0.9678357 , 1.075388  , 1.3095288 , 1.1425663 ,\n",
+       "                         1.1866144 , 1.2455702 , 1.2347478 , 1.1598873 , 1.1709665 ,\n",
+       "                         1.2157438 , 1.2720231 , 1.1773459 , 1.1897057 , 1.2453034 ,\n",
+       "                         1.2315087 , 0.8506601 , 1.070401  , 1.1797608 , 1.2647007 ,\n",
+       "                         1.2300415 , 1.3117491 , 1.0503579 , 1.1387292 , 1.1583905 ,\n",
+       "                         1.3045065 , 0.8964496 , 1.1164156 , 1.2434596 , 1.2388874 ,\n",
+       "                         1.2253768 , 1.1266948 , 1.0823714 , 1.1271874 , 1.1423486 ,\n",
+       "                         1.2114882 , 1.1171185 , 1.1692193 , 1.2141284 , 1.1173588 ,\n",
+       "                         1.2316343 , 1.1557999 , 1.1985208 , 1.1526998 , 1.1652381 ,\n",
+       "                         1.1020889 , 1.2839859 , 1.255206  , 1.2338889 , 1.1334827 ,\n",
+       "                         1.2606637 , 1.1768172 , 1.133126  , 1.1616554 , 1.2591982 ,\n",
+       "                         1.2608087 , 1.2771136 , 1.2220011 , 1.2126131 , 1.3102369 ,\n",
+       "                         1.161485  , 1.2388053 , 1.0854522 , 1.109191  , 1.2433244 ,\n",
+       "                         1.1612333 , 1.119974  , 1.1657274 , 1.2391368 , 1.2408532 ,\n",
+       "                         1.2713405 , 1.2003607 , 1.0934154 , 1.2725589 , 1.2331755 ,\n",
+       "                         1.1576575 , 1.2792869 , 1.0979929 , 1.2165016 , 1.2552319 ,\n",
+       "                         1.2154813 , 1.2387912 , 1.2113545 , 1.092492  , 1.287265  ,\n",
+       "                         1.2405735 , 1.086961  , 1.2186264 , 1.3057741 , 1.2447143 ,\n",
+       "                         1.145893  , 1.0720298 , 1.1931537 , 1.2258768 , 1.2223678 ,\n",
+       "                         1.1108402 , 1.2334076 , 1.2989581 , 1.0500095 , 1.2545264 ,\n",
+       "                         1.254883  , 1.06171   , 1.1827933 , 1.2883551 , 1.2290361 ,\n",
+       "                         1.1559633 , 1.0829264 , 1.2454283 , 1.2021191 , 1.1572067 ,\n",
+       "                         1.1571015 , 1.2683761 , 1.0523615 , 1.1081159 , 1.1978542 ,\n",
+       "                         1.2392715 , 1.1955217 , 1.154171  , 1.1076897 , 1.2144334 ,\n",
+       "                         1.0649818 , 1.2400447 , 1.1655055 , 1.1342129 , 1.2052649 ,\n",
+       "                         1.3010224 , 1.1970998 , 1.0977236 , 1.2325233 , 1.1176093 ,\n",
+       "                         1.1990188 , 1.1427927 , 1.1808167 , 1.1174316 , 1.1828363 ,\n",
+       "                         1.1767571 , 1.2167183 , 1.1697968 , 1.1744046 , 0.8939868 ,\n",
+       "                         1.2574182 , 1.2255412 , 1.2447684 , 1.1385155 , 1.1537726 ,\n",
+       "                         1.2788998 , 1.1112866 , 1.2417119 , 1.2249215 , 1.2867014 ,\n",
+       "                         1.1683307 , 1.2784356 , 1.1631655 , 1.1246334 , 1.2807626 ,\n",
+       "                         1.2504355 , 1.09938   , 1.2896625 , 1.2980561 , 1.1257046 ,\n",
+       "                         1.246858  , 1.0817022 , 1.0696605 , 1.2495583 , 1.2915183 ,\n",
+       "                         1.1820105 , 0.96095157, 1.1545107 , 1.1149871 , 1.1985911 ,\n",
+       "                         1.2794744 , 1.1154523 , 1.1982616 , 1.1381829 , 1.22324   ,\n",
+       "                         1.1455675 , 1.1988021 , 1.3195752 , 1.2144073 , 1.2616345 ,\n",
+       "                         1.1431206 , 1.2790085 , 1.0831236 , 1.125044  , 1.2778053 ,\n",
+       "                         1.1591135 , 1.1882532 ], dtype=float32)>\n",
+       "                  (beta): <tf.Variable 'transformer/layer_._2/ff/layer_norm/beta:0' shape=(192,) dtype=float32, numpy=\n",
+       "                  array([-0.01049791,  0.02152375, -0.03378561,  0.03164947,  0.00819711,\n",
+       "                         -0.01405335, -0.02091987,  0.00788867, -0.01027707, -0.00172993,\n",
+       "                         -0.01103046,  0.00836649,  0.00941498,  0.0382531 , -0.00642702,\n",
+       "                          0.01852331,  0.00470948,  0.02344545,  0.01141193,  0.00127532,\n",
+       "                          0.01603293, -0.04580598, -0.01747353,  0.02438874, -0.04060405,\n",
+       "                          0.00479471, -0.00592997, -0.00421144, -0.01156144, -0.00946089,\n",
+       "                         -0.00481299,  0.04446075, -0.04495647, -0.01447472,  0.02050785,\n",
+       "                         -0.00235888, -0.0057586 ,  0.01404028, -0.0084481 , -0.00079954,\n",
+       "                          0.00200081,  0.01832308, -0.01832635,  0.01489427,  0.00268834,\n",
+       "                         -0.02017709,  0.04548539,  0.05178156,  0.02737129, -0.00052763,\n",
+       "                          0.00891565,  0.01618693,  0.02362686, -0.01064536,  0.01651912,\n",
+       "                          0.03200817, -0.01955355, -0.00421685, -0.05510062, -0.00611641,\n",
+       "                         -0.01592397, -0.02227358, -0.02164057, -0.01181097,  0.00364242,\n",
+       "                         -0.01818874,  0.02677143,  0.00873136,  0.00520407,  0.00165503,\n",
+       "                         -0.0106048 , -0.0474345 , -0.01927847, -0.00275519, -0.05010425,\n",
+       "                          0.00443012, -0.02050812, -0.01938166,  0.02276452, -0.0491508 ,\n",
+       "                         -0.02156696,  0.00576269,  0.01251344, -0.00798486,  0.01934762,\n",
+       "                         -0.00466829,  0.02987502,  0.0449635 ,  0.02794607, -0.01035585,\n",
+       "                         -0.03455339, -0.02017214, -0.01751639,  0.00814069, -0.00960286,\n",
+       "                          0.02078385, -0.00918255,  0.04219389,  0.01527736, -0.00782714,\n",
+       "                         -0.01744033,  0.02201356, -0.01601992,  0.038303  ,  0.03574631,\n",
+       "                          0.04583006,  0.00173102,  0.02031284,  0.0127416 , -0.04929825,\n",
+       "                         -0.00745583, -0.00845573, -0.00315962,  0.0541168 ,  0.03200234,\n",
+       "                          0.00109879, -0.00174849,  0.01873765,  0.00980952,  0.03789899,\n",
+       "                         -0.00356435, -0.02858787, -0.01368637,  0.0037826 , -0.00455629,\n",
+       "                         -0.02301045, -0.03979176,  0.02152948, -0.0191615 ,  0.05090038,\n",
+       "                          0.01223159, -0.01177116, -0.01836306, -0.01753503,  0.00840725,\n",
+       "                          0.01081169, -0.03334855,  0.02582728, -0.00310735,  0.01060186,\n",
+       "                          0.02900856, -0.00193786, -0.00611028, -0.02355231,  0.02730693,\n",
+       "                          0.0168157 ,  0.0453185 , -0.00795171, -0.0490472 ,  0.01299703,\n",
+       "                         -0.01211376, -0.04820883, -0.00058289,  0.03355829,  0.00526739,\n",
+       "                         -0.00226219, -0.00548809,  0.01104187, -0.01620302, -0.01379755,\n",
+       "                          0.03002222,  0.01691281, -0.03559435,  0.02778582,  0.00775762,\n",
+       "                          0.00697485, -0.00750486,  0.02037126,  0.01142175,  0.00481389,\n",
+       "                          0.00276021,  0.05482011,  0.04322674, -0.00956445,  0.00750658,\n",
+       "                         -0.03632697, -0.00013556, -0.03406565, -0.01553119,  0.00891615,\n",
+       "                         -0.03667552,  0.0512755 ,  0.0034136 ,  0.03808332, -0.01828413,\n",
+       "                          0.01024727,  0.03339678, -0.01204124,  0.01003862, -0.00612356,\n",
+       "                         -0.00908286,  0.01659943], dtype=float32)>\n",
+       "                  (_feature_shapes): Dict()\n",
+       "                  (_feature_dtypes): Dict()\n",
+       "                )\n",
+       "                (layer_1): Dense(\n",
+       "                  768, activation=linear, use_bias=True\n",
+       "                  (kernel): <tf.Variable 'transformer/layer_._2/ff/layer_1/kernel:0' shape=(192, 768) dtype=float32, numpy=\n",
+       "                  array([[ 0.0200138 ,  0.0453618 ,  0.05944573, ..., -0.03587371,\n",
+       "                           0.01224422, -0.00072175],\n",
+       "                         [ 0.02137091, -0.01859555, -0.04710541, ..., -0.02794299,\n",
+       "                           0.01419899, -0.0136291 ],\n",
+       "                         [-0.03292815,  0.00347762,  0.05609084, ...,  0.03168143,\n",
+       "                          -0.0128223 ,  0.00386102],\n",
+       "                         ...,\n",
+       "                         [-0.02450894, -0.02459157, -0.0068263 , ...,  0.04013702,\n",
+       "                          -0.00466742, -0.02921941],\n",
+       "                         [ 0.03239494, -0.00134928,  0.00123798, ...,  0.00292211,\n",
+       "                          -0.00111932,  0.02714985],\n",
+       "                         [-0.02418012,  0.01257174, -0.00812958, ..., -0.04709027,\n",
+       "                           0.01096694, -0.02088788]], dtype=float32)>\n",
+       "                  (bias): <tf.Variable 'transformer/layer_._2/ff/layer_1/bias:0' shape=(768,) dtype=float32, numpy=\n",
+       "                  array([-3.33372578e-02, -1.20304301e-02, -2.64285505e-02, -8.84530786e-03,\n",
+       "                          9.27949324e-03, -1.14668226e-02, -3.10168378e-02, -1.43622728e-02,\n",
+       "                         -1.12179536e-02, -3.48813981e-02, -7.80524500e-03, -6.67409645e-03,\n",
+       "                         -2.71618329e-02,  1.33763952e-02, -1.43442694e-02, -2.26112269e-02,\n",
+       "                         -1.89228449e-02,  4.67353873e-03, -7.46711437e-03, -4.57441760e-03,\n",
+       "                         -1.14336181e-02, -3.73703078e-03, -4.13804967e-03, -2.49586198e-02,\n",
+       "                         -2.95854453e-02,  6.92587765e-03, -2.84688734e-03, -8.96761846e-03,\n",
+       "                          2.66582938e-04,  2.34540319e-03, -1.01395976e-02, -1.24753118e-02,\n",
+       "                         -2.55310051e-02, -1.66565515e-02, -2.73905843e-02, -1.69004244e-03,\n",
+       "                         -9.20773949e-03, -1.39765264e-02, -1.25533100e-02, -6.37155911e-03,\n",
+       "                         -2.09209453e-02, -3.99773149e-03, -1.79250874e-02,  4.29014070e-03,\n",
+       "                         -5.00511331e-03, -9.72811226e-03,  1.04333623e-04, -1.89962573e-02,\n",
+       "                         -1.60261542e-02, -1.94814522e-02,  1.01348842e-02, -8.10685009e-03,\n",
+       "                          2.04461813e-03, -2.24812888e-02, -6.67038467e-03, -1.02129420e-02,\n",
+       "                         -1.79766286e-02, -8.14508274e-03,  8.25855602e-03, -2.43141619e-03,\n",
+       "                         -7.08713830e-02, -1.82897076e-02, -2.60730693e-03, -1.65768694e-02,\n",
+       "                         -1.64023545e-02, -1.30782751e-02, -4.28689923e-03,  6.52118400e-03,\n",
+       "                         -1.96230076e-02, -3.99262942e-02, -2.73289271e-02,  4.30044835e-04,\n",
+       "                         -1.49638178e-02, -5.51447086e-02, -9.65916365e-03,  3.96977365e-03,\n",
+       "                          1.84384976e-02, -5.73096680e-04, -2.91963312e-04, -1.73625816e-02,\n",
+       "                         -3.48348282e-02, -7.23623345e-03, -1.28294611e-02, -1.53274667e-02,\n",
+       "                         -4.12606215e-03, -1.72958728e-02, -1.18990690e-02, -3.26990895e-02,\n",
+       "                         -4.20313291e-02,  5.03082108e-03,  2.19244440e-03, -2.19866037e-02,\n",
+       "                         -1.68198347e-02, -3.78365703e-02, -9.67846625e-03, -6.25378080e-03,\n",
+       "                         -1.03926891e-03,  1.34079829e-02,  3.34297912e-03, -2.53701061e-02,\n",
+       "                         -9.54755396e-03, -1.01934336e-02, -1.20657152e-02, -2.67628189e-02,\n",
+       "                         -8.09953455e-03, -6.08193688e-03,  3.38082924e-03, -1.18695842e-02,\n",
+       "                         -3.71371172e-02, -7.80474115e-03,  1.11220693e-02, -8.33167508e-03,\n",
+       "                         -5.58236428e-03, -1.80757064e-02, -2.09607501e-02,  5.48776379e-03,\n",
+       "                         -2.94951964e-02, -2.46344414e-02, -1.53862284e-02, -3.09490436e-03,\n",
+       "                         -3.11847795e-02, -1.71698779e-02, -3.63941677e-03, -2.74066366e-02,\n",
+       "                         -1.05475530e-03, -9.25327931e-03, -2.82230861e-02, -1.94824096e-02,\n",
+       "                         -1.38977701e-02, -1.04714287e-02,  4.30400576e-03, -2.20607650e-02,\n",
+       "                         -1.64322909e-02, -2.57586893e-02, -1.70667171e-02,  6.02981949e-04,\n",
+       "                         -2.33562738e-02,  6.21822709e-03, -3.45053500e-03, -1.09830648e-02,\n",
+       "                         -8.82339850e-03, -3.73522788e-02, -4.52396683e-02, -2.81988066e-02,\n",
+       "                          1.19963416e-03, -1.27797676e-02, -2.18338128e-02, -2.80943122e-02,\n",
+       "                         -3.59988119e-03, -1.18604396e-02, -6.16526231e-03,  2.33954028e-03,\n",
+       "                         -1.63589418e-03, -2.47196518e-02,  2.08187494e-02, -4.36770730e-02,\n",
+       "                         -3.05688493e-02, -1.34526286e-03, -3.30831483e-02,  3.23941559e-03,\n",
+       "                         -3.06175444e-02, -2.90571637e-02, -2.06385646e-02,  8.43056943e-03,\n",
+       "                          2.05167918e-03,  1.05036711e-02, -4.97501083e-02,  8.82736221e-03,\n",
+       "                         -3.26694426e-04, -1.03351744e-02,  8.86771642e-03, -2.79260948e-02,\n",
+       "                         -9.40874964e-03, -2.87361499e-02,  5.42023219e-03, -2.59471256e-02,\n",
+       "                         -4.26682644e-03, -1.39961147e-03,  5.25543839e-03,  1.44586945e-03,\n",
+       "                         -4.93929535e-03, -1.81996729e-02, -3.66596431e-02, -7.88619276e-03,\n",
+       "                         -7.22077349e-03, -1.38734980e-02, -2.62850765e-02, -1.04199219e-02,\n",
+       "                          4.22720285e-03, -4.93065640e-02, -1.53207366e-04,  1.66621129e-03,\n",
+       "                         -2.31967121e-02,  7.48836808e-03, -2.90694274e-02, -6.71045436e-03,\n",
+       "                         -2.49706525e-02, -3.15400236e-03, -2.88101286e-02, -1.17433537e-02,\n",
+       "                          1.22765440e-03, -8.89103208e-03, -1.20216729e-02, -2.58050431e-02,\n",
+       "                         -2.23770384e-02, -5.27241342e-02,  4.58361907e-03, -9.20900144e-03,\n",
+       "                         -4.86494834e-03,  5.95131190e-03, -3.35572027e-02, -5.22214063e-02,\n",
+       "                         -2.77308151e-02, -2.04498172e-02, -1.13594290e-02,  4.46268264e-03,\n",
+       "                         -1.38799436e-02, -2.00398602e-02, -1.42829427e-02,  4.64145560e-03,\n",
+       "                          2.28046585e-04, -4.69782483e-03, -2.27966066e-02,  7.99322035e-03,\n",
+       "                         -3.26800458e-02, -1.99418738e-02,  9.19471588e-03, -2.12415587e-02,\n",
+       "                         -2.27290746e-02, -1.31595824e-02, -1.15283253e-02, -7.50241475e-03,\n",
+       "                         -2.39377823e-02, -6.95785088e-03, -1.58205442e-02, -1.71613060e-02,\n",
+       "                         -1.08889155e-02, -2.31623300e-03, -1.26144765e-02, -1.01996101e-02,\n",
+       "                         -5.04346937e-03, -4.60104551e-03, -5.06210662e-02, -6.60978723e-03,\n",
+       "                         -5.96453110e-03, -7.14415684e-02, -1.78630725e-02,  5.41150104e-03,\n",
+       "                         -1.03690885e-02, -5.87195996e-03, -1.95817929e-02, -1.92977004e-02,\n",
+       "                          1.77244954e-02,  1.22857792e-03, -2.35614125e-02,  8.67873151e-03,\n",
+       "                         -1.04582077e-02, -1.39173279e-02, -3.24732549e-02, -3.26969177e-02,\n",
+       "                         -1.23288631e-02,  5.84124122e-03,  3.75783164e-03, -6.03185035e-02,\n",
+       "                         -5.38562834e-02, -1.87854804e-02,  1.52939111e-02, -1.73892621e-02,\n",
+       "                          1.84238015e-03,  4.95142397e-03, -3.33155915e-02, -1.19728940e-02,\n",
+       "                         -3.54210101e-03, -3.57735856e-03, -1.00171883e-02,  1.33268954e-02,\n",
+       "                          5.69132995e-03,  1.47731975e-02, -1.83567614e-03, -3.20666321e-02,\n",
+       "                         -2.86797527e-02, -2.64031384e-02, -7.56429462e-03, -1.20009044e-02,\n",
+       "                          1.12973684e-02, -5.62287122e-03, -1.97638269e-03, -2.07206514e-02,\n",
+       "                         -8.64086524e-02,  1.15817529e-04, -1.07997051e-02, -5.99109055e-03,\n",
+       "                          5.98610938e-03, -3.76985781e-03, -1.16103915e-02, -4.73026782e-02,\n",
+       "                         -3.24012749e-02, -1.52687272e-02,  1.39175309e-02, -3.89402099e-02,\n",
+       "                          4.79430798e-03, -3.10392287e-02, -1.22434238e-03, -1.20959114e-02,\n",
+       "                         -6.41068676e-03,  1.71033880e-05, -6.88490784e-03, -1.94683392e-02,\n",
+       "                         -1.64008960e-02, -2.63622683e-02, -5.85283060e-03, -1.85996443e-02,\n",
+       "                         -2.71032117e-02, -2.38017156e-03, -4.95283352e-03, -9.60978493e-03,\n",
+       "                         -1.25073837e-02, -1.55702140e-02, -1.95839349e-02, -2.03742441e-02,\n",
+       "                         -1.85265532e-03,  5.65958768e-03, -6.40596682e-03, -4.88626864e-03,\n",
+       "                         -2.15109205e-03, -9.18837916e-03, -2.19131261e-02, -3.64525206e-02,\n",
+       "                         -1.73025541e-02, -2.00000545e-03, -8.19304609e-04,  6.57165097e-03,\n",
+       "                         -6.28626253e-03, -2.95665115e-02, -6.25590011e-02, -1.84975117e-02,\n",
+       "                          6.67490123e-04, -2.22133230e-02, -1.77290067e-02, -3.24275382e-02,\n",
+       "                          7.81799573e-03, -2.80588735e-02, -1.20364176e-02, -7.06162909e-03,\n",
+       "                         -5.66909835e-03, -5.73322969e-03, -1.52700823e-02,  8.84732977e-03,\n",
+       "                         -1.49889970e-02, -1.92730948e-02,  1.35639915e-03, -3.77680473e-02,\n",
+       "                         -2.19104849e-02, -2.64837239e-02, -9.12345655e-04, -2.44116709e-02,\n",
+       "                          1.09210573e-02, -1.41132390e-04,  1.17622353e-02, -3.11280079e-02,\n",
+       "                          7.26891309e-03, -4.66628969e-02, -1.35422535e-02, -3.92462946e-02,\n",
+       "                         -3.86740407e-03, -1.41668820e-03,  1.08932122e-03, -1.82715822e-02,\n",
+       "                         -1.30463401e-02, -2.50185985e-04, -1.38900643e-02,  1.21532627e-04,\n",
+       "                         -7.55504519e-03, -6.68428373e-03,  3.75840045e-03,  3.87968845e-03,\n",
+       "                         -2.96963658e-02, -3.35212089e-02, -2.25975411e-03,  3.00933095e-03,\n",
+       "                         -4.02128510e-02, -1.42791662e-02, -5.48909791e-03, -3.20998975e-03,\n",
+       "                         -1.32048894e-02, -1.12547325e-02, -1.24998428e-02, -2.58491207e-02,\n",
+       "                          9.08760849e-05,  1.16652362e-02, -1.65408142e-02,  5.10796235e-05,\n",
+       "                         -8.15010723e-03, -1.28825111e-02, -3.89126949e-02, -9.37087275e-03,\n",
+       "                         -6.18562428e-03, -6.63009584e-02, -9.35898162e-03, -2.45649852e-02,\n",
+       "                         -7.92087708e-03, -1.31273726e-02, -1.97531860e-02, -1.37249520e-02,\n",
+       "                         -8.93866643e-03, -4.28636521e-02, -3.74601525e-03, -2.80440412e-02,\n",
+       "                         -1.74158271e-02,  9.33865644e-03,  4.91131470e-03,  1.11120502e-02,\n",
+       "                         -2.57497951e-02, -4.39163633e-02,  6.66483399e-03, -5.06761135e-04,\n",
+       "                         -2.32957341e-02, -2.53415443e-02, -4.46022581e-03,  1.13388188e-02,\n",
+       "                          2.02134461e-03, -1.31819705e-02,  1.01864496e-02, -3.78090749e-03,\n",
+       "                         -3.53341899e-03, -1.36399046e-02, -1.20440796e-02, -1.36488294e-02,\n",
+       "                         -1.38256513e-02, -6.28865436e-02, -4.16373424e-02, -4.74301493e-03,\n",
+       "                         -2.44922694e-02,  1.66400254e-03, -1.12737331e-03, -3.13604530e-03,\n",
+       "                         -3.24759744e-02, -1.65949818e-02,  2.92222598e-03, -1.58712268e-03,\n",
+       "                         -1.77903417e-02, -1.66294689e-03, -5.67669561e-03, -1.32287908e-02,\n",
+       "                         -1.93906557e-02, -4.19550687e-02,  1.61865051e-03, -2.05391757e-02,\n",
+       "                         -2.26580556e-02,  1.11057591e-02, -6.92468788e-03, -5.12448046e-03,\n",
+       "                         -3.18950079e-02, -4.35872423e-03, -2.53419876e-02,  1.55006526e-02,\n",
+       "                          1.20479669e-02, -1.77465249e-02, -2.14677062e-02,  2.35745008e-03,\n",
+       "                         -1.81921013e-02, -7.76443025e-03, -3.23890446e-04, -5.32940868e-03,\n",
+       "                          1.67221632e-02, -1.97462440e-02,  1.09343296e-02,  1.14851557e-02,\n",
+       "                         -2.77556907e-02, -8.87866947e-04,  1.33279143e-04, -5.81024587e-02,\n",
+       "                         -3.61334137e-03, -2.81540696e-02, -1.51612861e-02, -1.97562072e-02,\n",
+       "                          5.15708001e-04, -6.83074538e-03, -1.87120978e-02, -2.43883245e-02,\n",
+       "                         -7.91893061e-03, -4.11415892e-03, -8.43337551e-03,  1.16346637e-02,\n",
+       "                         -2.43854988e-02, -2.16020066e-02, -3.26048471e-02, -1.09725781e-02,\n",
+       "                         -3.57973687e-02, -5.08582965e-02, -1.33388182e-02,  5.90886362e-03,\n",
+       "                         -1.32997604e-02, -9.13704652e-03,  1.77791761e-03, -1.10328160e-02,\n",
+       "                          1.60120130e-02, -2.30981521e-02, -1.49227204e-02,  5.10551268e-03,\n",
+       "                          6.10626582e-03, -2.87795793e-02,  1.70728483e-03, -1.78763717e-02,\n",
+       "                         -1.94948930e-02, -1.66736473e-03, -1.70627479e-02,  1.37127992e-02,\n",
+       "                         -1.32692317e-02,  6.65037474e-03, -1.29313814e-02,  5.57297794e-03,\n",
+       "                         -1.12800766e-02,  4.67792340e-03, -7.82010332e-03, -4.64824103e-02,\n",
+       "                         -2.65281610e-02,  1.47148669e-02, -4.31900006e-03, -2.03008670e-02,\n",
+       "                         -2.63399538e-03, -2.16606539e-02, -1.90197546e-02, -1.78931039e-02,\n",
+       "                         -1.38731794e-02, -3.75676341e-02, -8.64620414e-03, -6.58054799e-02,\n",
+       "                         -1.70020033e-02, -3.28940749e-02,  4.65774618e-04, -1.98039897e-02,\n",
+       "                         -2.59156171e-02, -7.85135943e-03, -1.25278654e-02, -1.11970643e-03,\n",
+       "                         -2.91844960e-02, -1.97878089e-02,  2.52304319e-03,  5.96133480e-03,\n",
+       "                         -5.23802266e-02, -2.73484532e-02, -3.66229527e-02, -1.43872052e-02,\n",
+       "                         -4.07523988e-03, -5.29169776e-02, -2.10777409e-02, -3.25676277e-02,\n",
+       "                         -9.24565084e-03, -5.09950239e-03, -1.04549387e-02, -2.45881788e-02,\n",
+       "                         -3.48805226e-02, -5.53940125e-02, -3.37969400e-02, -5.90338185e-03,\n",
+       "                         -5.14366738e-02, -2.08435231e-03, -7.82921351e-03, -1.05392961e-02,\n",
+       "                         -6.99244160e-03, -2.68173851e-02, -1.15421731e-02, -2.56756227e-02,\n",
+       "                          1.55956158e-03, -4.72193910e-03, -1.58323143e-02, -9.19513591e-03,\n",
+       "                         -2.00888999e-02, -3.19119655e-02, -3.35531938e-03, -1.04231259e-03,\n",
+       "                         -9.81072523e-03, -1.77766923e-02, -2.31661070e-02, -3.86816682e-03,\n",
+       "                         -5.58865443e-03, -1.16977030e-02, -2.61800736e-02, -1.86645531e-03,\n",
+       "                         -3.06399371e-02, -9.05887131e-03, -1.93412770e-02, -5.43606542e-02,\n",
+       "                          2.60276510e-03, -8.96754768e-03, -3.24303173e-02, -3.29047143e-02,\n",
+       "                          2.46463460e-03, -3.13622109e-03, -1.11212321e-02, -1.36358421e-02,\n",
+       "                         -1.89102590e-02, -3.58816683e-02, -8.04788154e-03, -3.75765860e-02,\n",
+       "                          1.24625880e-02, -3.20654698e-02, -6.90695737e-03,  1.00988441e-03,\n",
+       "                          2.75147846e-03, -1.61069054e-02,  2.06897836e-02,  1.87683210e-03,\n",
+       "                         -1.62859093e-02, -2.90039498e-02, -1.36160792e-03, -1.72167066e-02,\n",
+       "                          7.65678659e-03,  2.95401318e-04, -7.96781853e-03, -3.59004922e-02,\n",
+       "                         -1.22297904e-03,  1.20183127e-02, -3.44441235e-02,  3.89194262e-04,\n",
+       "                         -2.51837485e-02, -1.65693760e-02, -3.02922279e-02,  6.05576904e-03,\n",
+       "                          3.68867512e-03,  3.91587103e-03, -6.81368308e-03, -6.03012135e-03,\n",
+       "                         -1.47708375e-02, -1.30854193e-02, -9.50133801e-03, -3.45344692e-02,\n",
+       "                         -2.94285733e-02,  8.44507944e-03, -2.27477471e-03, -1.56889744e-02,\n",
+       "                          1.59581471e-02, -1.25193940e-02, -1.91157572e-02, -3.21304277e-02,\n",
+       "                          8.02859943e-03, -8.64375941e-03,  3.78777785e-03, -6.59673940e-03,\n",
+       "                         -3.39506269e-02,  5.64883510e-03, -6.13440014e-02, -7.93107785e-03,\n",
+       "                         -1.50270360e-02, -1.61594078e-02, -1.94392912e-02, -1.68349724e-02,\n",
+       "                          3.09064277e-02,  4.93095955e-03, -3.94429043e-02, -1.15872324e-02,\n",
+       "                         -1.28836315e-02, -2.01286804e-02, -3.84248607e-02, -3.05649750e-02,\n",
+       "                         -1.04364334e-02, -2.77922582e-03, -2.36243010e-02, -2.01014858e-02,\n",
+       "                         -4.84081805e-02, -2.26343190e-03,  6.25391584e-03, -6.36793440e-03,\n",
+       "                         -6.46613713e-04, -9.01893992e-03, -3.63259926e-03, -6.74518943e-03,\n",
+       "                         -2.59635970e-02, -2.46191379e-02, -1.03657711e-02, -2.07470562e-02,\n",
+       "                         -7.71256257e-03, -2.91075669e-02, -1.47521086e-02, -7.92815816e-03,\n",
+       "                         -6.64313324e-03, -1.91371590e-02, -1.40240137e-02, -5.21422923e-02,\n",
+       "                         -3.74027751e-02, -2.06586719e-03, -3.58425593e-03, -2.08234824e-02,\n",
+       "                         -2.45748758e-02,  9.72781982e-03, -4.43681739e-02, -8.66457354e-03,\n",
+       "                         -4.82482389e-02, -1.56797916e-02, -2.47380249e-02,  1.87400840e-02,\n",
+       "                         -3.79825868e-02, -1.38318846e-02, -2.10447628e-02,  1.08323405e-02,\n",
+       "                         -2.42531281e-02,  1.12944627e-02,  2.59104045e-03, -1.14521887e-02,\n",
+       "                         -1.68768931e-02, -1.68022700e-02, -5.14307059e-03,  3.44281056e-04,\n",
+       "                         -4.87398217e-03, -9.55253374e-03, -1.22880088e-02, -2.63365097e-02,\n",
+       "                         -3.84489149e-02, -2.61132549e-02, -7.96650629e-03, -1.69632696e-02,\n",
+       "                         -1.71560347e-02, -2.25002784e-02, -8.88591073e-03, -2.72413641e-02,\n",
+       "                         -2.03668867e-04, -1.90096684e-02,  8.35950393e-03, -1.64371338e-02,\n",
+       "                          1.47741567e-02, -5.84984869e-02, -1.04708606e-02, -1.68935489e-02,\n",
+       "                         -3.54976244e-02, -2.78694136e-03, -1.73107199e-02,  5.00151608e-03,\n",
+       "                         -3.82142793e-03,  1.13632660e-02, -1.49819618e-02,  1.17110950e-03,\n",
+       "                         -2.05652462e-03, -8.59066565e-03, -2.67075058e-02, -2.47322544e-02,\n",
+       "                         -7.30546482e-04, -2.14617644e-02, -2.84397081e-02, -1.64100621e-02,\n",
+       "                         -1.08914925e-02, -1.72290541e-02, -1.59400273e-02,  8.52343906e-03,\n",
+       "                         -6.42960984e-03, -1.95234921e-02, -2.53217611e-02, -1.46880426e-04,\n",
+       "                         -4.34152931e-02, -2.06201486e-02, -7.12397024e-02, -8.53891764e-03,\n",
+       "                         -9.43581574e-03,  3.32818925e-02, -1.99020449e-02, -8.32063705e-03,\n",
+       "                         -1.83409415e-02, -1.25894314e-02,  1.62209210e-03, -3.50676570e-03,\n",
+       "                         -2.81427167e-02, -1.38427606e-02,  3.03339353e-03, -2.49240994e-02,\n",
+       "                          7.31371716e-03, -1.02051990e-02, -1.33559704e-02, -6.67838380e-04],\n",
+       "                        dtype=float32)>\n",
+       "                  (_feature_shapes): Dict()\n",
+       "                  (_feature_dtypes): Dict()\n",
+       "                )\n",
+       "                (layer_2): Dense(\n",
+       "                  192, activation=linear, use_bias=True\n",
+       "                  (kernel): <tf.Variable 'transformer/layer_._2/ff/layer_2/kernel:0' shape=(768, 192) dtype=float32, numpy=\n",
+       "                  array([[-0.00277009, -0.00766354,  0.00111258, ...,  0.0023168 ,\n",
+       "                          -0.00371265,  0.03133386],\n",
+       "                         [ 0.01033583,  0.01263355,  0.00214211, ..., -0.03399085,\n",
+       "                           0.01188842, -0.0047044 ],\n",
+       "                         [ 0.03755607,  0.01134737, -0.00071585, ...,  0.00905287,\n",
+       "                           0.0055303 ,  0.00608071],\n",
+       "                         ...,\n",
+       "                         [-0.02624071,  0.00230232, -0.0022273 , ...,  0.02333591,\n",
+       "                          -0.00608842, -0.00880447],\n",
+       "                         [ 0.02174632, -0.01645869,  0.00782272, ..., -0.02966961,\n",
+       "                          -0.0024398 ,  0.01270658],\n",
+       "                         [ 0.00865628, -0.00132068, -0.02910091, ...,  0.00513306,\n",
+       "                           0.0078499 ,  0.0188979 ]], dtype=float32)>\n",
+       "                  (bias): <tf.Variable 'transformer/layer_._2/ff/layer_2/bias:0' shape=(192,) dtype=float32, numpy=\n",
+       "                  array([ 2.13714177e-03,  7.69167487e-03, -5.89249097e-03,  9.38836485e-03,\n",
+       "                          4.06415015e-03,  2.61747669e-02,  2.37808824e-02, -1.49717368e-03,\n",
+       "                         -1.51039485e-03,  3.72942095e-03,  1.19742397e-02,  4.87796776e-03,\n",
+       "                          6.80093654e-04, -7.29197753e-04, -5.09615056e-03, -1.20036164e-02,\n",
+       "                         -1.96033157e-02,  9.48915444e-03, -2.59881979e-03, -1.12662334e-02,\n",
+       "                          7.63040036e-03,  5.20693026e-02, -5.27575146e-03,  3.14396597e-03,\n",
+       "                          1.55584817e-03, -1.92209911e-02, -7.76566193e-03,  1.75420791e-02,\n",
+       "                          4.84731398e-04,  5.83604816e-03, -8.13735416e-04, -4.79252115e-02,\n",
+       "                         -1.84813831e-02, -2.28549889e-03, -6.95835566e-03, -5.86241111e-03,\n",
+       "                         -5.69443172e-03,  1.65568888e-02, -1.38337014e-03,  1.48930652e-02,\n",
+       "                          6.02127891e-03, -1.39874406e-02, -1.65665802e-02,  9.20123979e-03,\n",
+       "                          2.05240049e-03,  1.01555558e-02,  1.16605442e-02,  1.38822282e-02,\n",
+       "                          8.48454516e-03,  8.67671042e-04,  9.06788185e-03,  2.90332711e-03,\n",
+       "                          5.12160128e-03, -7.77168153e-03, -7.38827465e-03, -6.99232193e-03,\n",
+       "                         -1.00234915e-02, -1.26919309e-02, -3.56813939e-03, -8.51563271e-03,\n",
+       "                         -5.44333598e-03, -1.24330847e-02,  7.89948646e-03, -5.10330265e-03,\n",
+       "                          8.52113962e-03, -4.80575487e-03,  5.86674875e-03, -7.98383448e-03,\n",
+       "                         -1.58236409e-03, -3.90194566e-03, -3.19704623e-03, -1.27897607e-02,\n",
+       "                         -1.08337877e-02, -2.88095623e-02,  2.85866234e-04, -8.40043090e-03,\n",
+       "                          1.68466531e-02, -9.48300865e-03,  1.07089747e-02, -6.55804481e-03,\n",
+       "                          1.07785873e-02, -2.03706510e-03, -6.23795530e-03,  1.84131053e-03,\n",
+       "                         -1.19226137e-02, -1.19245518e-02,  1.07499138e-02, -1.60556356e-03,\n",
+       "                          1.48513662e-02,  8.42911075e-04, -7.61739630e-03, -1.00078341e-02,\n",
+       "                         -6.85031665e-03,  6.62403181e-05, -1.47380102e-02,  1.06051601e-02,\n",
+       "                         -1.52580086e-02,  4.62111458e-03, -7.25929858e-03, -9.87567380e-03,\n",
+       "                         -2.11753566e-02, -2.81897746e-03,  7.57926563e-03,  1.56047642e-02,\n",
+       "                         -5.49622765e-03, -1.26458518e-02, -4.95762797e-04, -1.26452465e-02,\n",
+       "                         -5.07163466e-04, -2.44214141e-04, -1.36806136e-02, -6.36481447e-03,\n",
+       "                          9.41760000e-03, -2.01441571e-02,  5.63550880e-03, -9.40112583e-03,\n",
+       "                          8.10766220e-03, -3.01348814e-03, -5.85703761e-04, -6.87783398e-03,\n",
+       "                         -2.04759687e-02,  5.50722983e-03,  1.64064090e-03,  2.13566399e-03,\n",
+       "                         -2.66503030e-03,  1.19713731e-02, -2.46646977e-03,  1.18620200e-02,\n",
+       "                         -9.19723790e-03, -1.83394272e-03,  1.11400019e-02, -7.83916272e-04,\n",
+       "                         -1.84947625e-02, -1.56250689e-02, -4.50070575e-03,  4.96139983e-05,\n",
+       "                          1.15786900e-03, -1.15699519e-03,  8.74574110e-03,  7.34791812e-03,\n",
+       "                         -1.66535741e-04, -4.48113959e-03, -2.73513864e-03,  1.59729156e-03,\n",
+       "                         -4.85743620e-02,  1.04213860e-02,  1.65184797e-03, -8.78975447e-03,\n",
+       "                          2.33145412e-02,  2.71241821e-04, -5.57205081e-03, -6.47265138e-03,\n",
+       "                          7.14300759e-03,  1.50586208e-02, -7.69229233e-03, -6.83056330e-03,\n",
+       "                          1.11706341e-02, -5.33302967e-03,  1.01505285e-02, -1.04286522e-03,\n",
+       "                          5.20325173e-03,  7.18424190e-03, -5.82816964e-03, -1.94616728e-02,\n",
+       "                         -9.02798609e-04, -1.22039793e-02, -1.85265485e-02,  6.41540438e-03,\n",
+       "                          2.65102787e-03,  1.07528424e-04,  8.87938961e-03, -6.68506231e-03,\n",
+       "                          6.87584700e-03, -5.48701826e-03,  8.97261198e-04, -1.17392847e-02,\n",
+       "                         -9.75791924e-03,  1.70990115e-03, -5.55254053e-03,  1.12752430e-02,\n",
+       "                         -6.84495084e-04,  1.56747233e-02,  1.91728352e-03, -1.50278080e-02,\n",
+       "                          5.20985387e-03, -2.47837487e-03,  2.45351926e-03,  6.19899435e-03,\n",
+       "                          1.05873914e-02,  8.07140023e-03, -5.94343990e-04, -3.08463769e-03],\n",
+       "                        dtype=float32)>\n",
+       "                  (_feature_shapes): Dict()\n",
+       "                  (_feature_dtypes): Dict()\n",
+       "                )\n",
+       "                (dropout): Dropout(\n",
+       "                  (_feature_shapes): Dict()\n",
+       "                  (_feature_dtypes): Dict()\n",
+       "                )\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (dropout): Dropout(\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "          )\n",
+       "          (dropout): Dropout(\n",
+       "            (_feature_shapes): Dict()\n",
+       "            (_feature_dtypes): Dict()\n",
+       "          )\n",
+       "          (_kwargs): Dict(\n",
+       "            (name): 'transformer'\n",
+       "            (trainable): True\n",
+       "            (dtype): 'float32'\n",
+       "          )\n",
+       "          (mask_emb): <tf.Variable 'model/mask_emb:0' shape=(1, 1, 192) dtype=float32, numpy=\n",
+       "          array([[[ 4.04036790e-03,  2.15086387e-03,  1.04019826e-03,\n",
+       "                   -1.42265148e-02,  1.21783582e-04,  8.70395917e-03,\n",
+       "                    6.63713319e-03,  7.36431265e-03, -1.54305118e-04,\n",
+       "                   -9.43066180e-03, -1.04995137e-02,  8.46136641e-03,\n",
+       "                    7.09149288e-04,  7.55310385e-03,  1.56539027e-02,\n",
+       "                   -1.72090076e-03,  4.24924027e-03, -5.31134475e-03,\n",
+       "                   -1.48346564e-02, -2.87283910e-03,  6.70258282e-03,\n",
+       "                   -1.77564528e-02,  7.61946477e-03,  9.40683205e-03,\n",
+       "                   -6.71640271e-03,  8.04069825e-03, -6.12986507e-03,\n",
+       "                    4.19179862e-03, -8.79541412e-03, -1.18354000e-02,\n",
+       "                    1.18796797e-02, -4.27424023e-03,  5.22729533e-04,\n",
+       "                   -2.82752240e-04, -5.58008580e-03,  8.65907688e-03,\n",
+       "                    1.38010653e-02,  1.27496161e-02,  1.39875710e-03,\n",
+       "                    2.82851863e-03,  9.22558014e-04, -9.95281339e-03,\n",
+       "                   -1.83557272e-02,  1.69160645e-02,  1.07988389e-02,\n",
+       "                   -9.23428405e-03, -4.20611026e-03, -1.25393076e-02,\n",
+       "                   -3.94632109e-03, -9.12902178e-04,  5.01031801e-03,\n",
+       "                   -9.91391484e-03,  3.60712525e-04, -4.11095610e-03,\n",
+       "                    7.01457262e-03, -3.89575318e-04, -9.14055016e-03,\n",
+       "                   -1.23113198e-02,  3.95737030e-03, -3.31253605e-03,\n",
+       "                   -1.13035142e-02, -1.94670074e-02,  1.20422023e-03,\n",
+       "                   -1.42025901e-03,  6.52758172e-03,  1.50428945e-02,\n",
+       "                    1.14396252e-02,  9.52708255e-03, -1.09730114e-03,\n",
+       "                   -1.33979488e-02, -1.07515557e-02,  9.95630212e-03,\n",
+       "                   -4.52685449e-03,  5.00414427e-03, -1.98842213e-03,\n",
+       "                    1.37774022e-02,  5.30165201e-03,  1.23802433e-03,\n",
+       "                   -4.73509915e-03,  1.11496374e-02,  1.02096051e-02,\n",
+       "                   -4.51285811e-03, -3.92367877e-03, -7.36222602e-04,\n",
+       "                   -9.84671526e-03, -1.30903888e-02, -1.32385455e-02,\n",
+       "                   -5.05355746e-03,  1.77229438e-02, -1.26720043e-02,\n",
+       "                   -3.81861255e-03,  1.92409288e-03,  4.43383912e-03,\n",
+       "                   -2.90768524e-03, -3.23669449e-03, -6.66979142e-03,\n",
+       "                   -2.06012907e-03, -1.12843849e-02,  4.79723467e-03,\n",
+       "                    4.63116821e-03,  5.16073406e-03,  8.70506628e-05,\n",
+       "                   -5.35136508e-03, -6.81748800e-03,  1.07775088e-02,\n",
+       "                    6.40543317e-03, -5.58225671e-03,  1.11177545e-02,\n",
+       "                   -1.27711734e-02,  5.51164476e-03,  1.43165309e-02,\n",
+       "                   -1.18009234e-02,  1.00297267e-02,  2.94128619e-03,\n",
+       "                    5.09045878e-03,  6.01266325e-03,  3.48583143e-03,\n",
+       "                   -9.97739006e-03,  5.73237287e-03, -1.74200535e-02,\n",
+       "                   -1.05477320e-02, -6.82158954e-03, -1.22792637e-02,\n",
+       "                    1.54061895e-02,  6.61997357e-03, -6.48623565e-03,\n",
+       "                    1.03507945e-02,  4.72886208e-03,  3.41648381e-04,\n",
+       "                    1.56227135e-04, -6.57477323e-03,  1.07179703e-02,\n",
+       "                    1.44143337e-02, -5.46780648e-03,  6.18689740e-03,\n",
+       "                   -9.73255560e-03, -2.16128258e-03, -1.91180315e-03,\n",
+       "                    3.76634533e-03,  2.67042592e-03, -2.67445343e-03,\n",
+       "                    3.32484627e-03,  1.01211574e-02,  2.27720127e-03,\n",
+       "                    7.88620266e-04, -1.48888072e-02,  7.72451982e-03,\n",
+       "                   -1.09812963e-05,  1.72610395e-02, -1.04232905e-02,\n",
+       "                   -5.94944111e-04,  8.15481320e-03, -1.07726390e-02,\n",
+       "                    2.42098351e-03, -7.10068317e-03,  1.06540425e-02,\n",
+       "                    9.72479582e-03,  4.19085007e-03,  5.90282353e-03,\n",
+       "                    1.59875136e-02, -1.69793852e-02,  1.46484468e-04,\n",
+       "                   -9.65306722e-03, -2.21638312e-03, -1.99070992e-03,\n",
+       "                    1.52429137e-02,  7.03723729e-03, -3.10059241e-03,\n",
+       "                    1.18050715e-02,  1.10457819e-02, -8.42266437e-03,\n",
+       "                   -9.11685079e-03, -1.46749020e-02, -5.18356264e-03,\n",
+       "                   -1.54700959e-02,  1.13772415e-02, -5.09043923e-03,\n",
+       "                   -1.58989453e-03, -1.11678680e-02, -1.49724097e-03,\n",
+       "                    2.78852787e-03, -8.65777209e-03,  3.00176186e-03,\n",
+       "                   -1.46945333e-02,  8.13734066e-03,  7.89561775e-03,\n",
+       "                    1.56951277e-03,  7.45176163e-04, -1.99116878e-02,\n",
+       "                    4.55260696e-03, -6.38728775e-03, -4.85596713e-03]]],\n",
+       "                dtype=float32)>\n",
+       "          (_feature_shapes): Dict()\n",
+       "          (_feature_dtypes): Dict()\n",
+       "        )\n",
+       "        (transformer_pre): PrepareTransformerInputs(\n",
+       "          (_feature_shapes): Dict()\n",
+       "          (_feature_dtypes): Dict()\n",
+       "        )\n",
+       "        (transformer_post): LastHiddenState(\n",
+       "          (_feature_shapes): Dict()\n",
+       "          (_feature_dtypes): Dict()\n",
+       "        )\n",
+       "        (_masking_post): SequentialBlock(\n",
+       "          (layers): List(\n",
+       "            (0): TransformerOutputToRagged(\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "            (1): TransformerInferenceHiddenState(\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "          )\n",
+       "          (_feature_shapes): Dict()\n",
+       "          (_feature_dtypes): Dict()\n",
+       "        )\n",
+       "        (_masking_pre): SequentialBlock(\n",
+       "          (layers): List(\n",
+       "            (0): SequenceCausalLastInference(\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "            (1): ExtractMaskFromTargets(\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "          )\n",
+       "          (_feature_shapes): Dict()\n",
+       "          (_feature_dtypes): Dict()\n",
+       "        )\n",
+       "        (_feature_shapes): Dict()\n",
+       "        (_feature_dtypes): Dict()\n",
+       "      )\n",
+       "    )\n",
+       "    (_feature_shapes): Dict()\n",
+       "    (_feature_dtypes): Dict()\n",
+       "  ), SequentialBlock(\n",
+       "    (layers): List(\n",
+       "      (0): _Dense(\n",
+       "        (dense): Dense(\n",
+       "          448, activation=linear, use_bias=True\n",
+       "          (kernel): <tf.Variable 'model/sequential_block_5/private__dense_5/dense_5/kernel:0' shape=(192, 448) dtype=float32, numpy=\n",
+       "          array([[-0.07455213,  0.08738312, -0.09132323, ..., -0.02972549,\n",
+       "                   0.00206033,  0.08987995],\n",
+       "                 [-0.1418723 ,  0.01722792,  0.03020085, ..., -0.08537607,\n",
+       "                   0.0528537 , -0.05985903],\n",
+       "                 [ 0.12507589, -0.12977485, -0.06706683, ...,  0.00457396,\n",
+       "                   0.07196002,  0.01268123],\n",
+       "                 ...,\n",
+       "                 [-0.00195695,  0.04857071, -0.06206015, ..., -0.00629914,\n",
+       "                  -0.08346017, -0.1287044 ],\n",
+       "                 [ 0.1128123 , -0.04531217,  0.08705742, ...,  0.03716769,\n",
+       "                   0.02515787,  0.018825  ],\n",
+       "                 [ 0.06322469,  0.08437516, -0.02691332, ...,  0.01932786,\n",
+       "                  -0.12162916,  0.093416  ]], dtype=float32)>\n",
+       "          (bias): <tf.Variable 'model/sequential_block_5/private__dense_5/dense_5/bias:0' shape=(448,) dtype=float32, numpy=\n",
+       "          array([ 2.81504877e-02, -1.44335190e-02,  7.53238574e-02,  3.00887652e-04,\n",
+       "                 -4.56925854e-02,  5.75957075e-02,  3.64849344e-02,  6.72322437e-02,\n",
+       "                  1.42776454e-02,  8.10379311e-02,  7.14076310e-02,  6.54920563e-02,\n",
+       "                  3.74164097e-02,  1.98917389e-02, -4.83481660e-02, -1.00074466e-02,\n",
+       "                  3.73900980e-02, -8.09519216e-02,  4.84817736e-02,  1.61066670e-02,\n",
+       "                  1.44684138e-02, -2.18199790e-02,  4.94538881e-02,  1.79679096e-02,\n",
+       "                 -8.12651997e-04, -2.44654771e-02, -5.43974787e-02, -2.61204913e-02,\n",
+       "                 -7.38266343e-03, -7.60965198e-02,  3.54000367e-02, -4.18136492e-02,\n",
+       "                  3.79898772e-02, -3.03007346e-02,  8.16893298e-03,  2.76147742e-02,\n",
+       "                  1.79042313e-02,  3.28151546e-02, -1.86179411e-02, -7.63999373e-02,\n",
+       "                  1.83715262e-02, -5.15938997e-02,  3.33066992e-02, -4.72240299e-02,\n",
+       "                 -3.20874550e-03,  6.16678521e-02, -4.77884114e-02, -3.93300056e-02,\n",
+       "                 -1.31899863e-02,  7.59410323e-04, -5.72681576e-02, -9.87503603e-02,\n",
+       "                  4.51197736e-02, -9.50545445e-02, -1.95405688e-02,  2.83987969e-02,\n",
+       "                  1.13698682e-02,  4.45396639e-02, -2.78044064e-02,  6.31122962e-02,\n",
+       "                 -4.33192253e-02,  4.00839001e-02,  5.49467281e-03,  3.42128165e-02,\n",
+       "                  5.25591671e-02,  5.23718633e-02,  7.44423121e-02, -4.51364219e-02,\n",
+       "                  5.35758696e-02, -5.21030538e-02,  2.33111754e-02,  3.98062021e-02,\n",
+       "                  1.20931277e-02, -4.18836810e-02, -6.42815232e-02, -7.57243410e-02,\n",
+       "                  5.05668344e-03, -4.21471614e-03,  4.92137186e-02, -2.42954325e-02,\n",
+       "                 -5.17125875e-02, -3.30529623e-02, -2.23571272e-03,  4.99468632e-02,\n",
+       "                  1.68716945e-02, -2.66351961e-02,  5.78250876e-03,  3.81902605e-03,\n",
+       "                 -1.86531839e-03,  4.16462719e-02,  9.35514718e-02, -2.69782171e-03,\n",
+       "                  5.35458066e-02, -5.52286543e-02,  2.77625527e-02,  4.79908995e-02,\n",
+       "                  4.06310894e-02,  5.05130403e-02, -2.12739091e-02, -1.12941816e-01,\n",
+       "                  3.42403203e-02,  5.31319194e-02, -4.04034182e-02, -1.33715738e-02,\n",
+       "                 -6.03716597e-02, -1.27376020e-02,  6.97045550e-02,  3.82803269e-02,\n",
+       "                 -7.08445460e-02,  3.07148062e-02, -5.72059080e-02,  6.36915118e-02,\n",
+       "                  2.22203881e-02, -5.68518378e-02, -4.02556397e-02, -1.29877878e-02,\n",
+       "                  5.60183935e-02, -1.40941944e-02, -7.21269893e-03,  3.69947292e-02,\n",
+       "                 -2.33332161e-03, -2.00844463e-02,  3.79087925e-02,  2.35442892e-02,\n",
+       "                  4.98754382e-02,  3.65077965e-02,  5.73647320e-02,  2.58711316e-02,\n",
+       "                 -5.56078330e-02, -2.12874692e-02, -8.37986395e-02, -1.14348732e-01,\n",
+       "                 -6.78669810e-02, -3.57556753e-02,  1.28276750e-01, -3.55466194e-02,\n",
+       "                  2.15561315e-02,  1.37906556e-03,  5.15904129e-02,  8.29028264e-02,\n",
+       "                  9.20313001e-02, -3.30200940e-02,  1.07878260e-02, -7.14220852e-03,\n",
+       "                 -6.34240657e-02,  9.80120897e-02, -5.69730774e-02,  4.68370598e-03,\n",
+       "                  1.18519412e-02,  4.56332229e-02,  4.96787764e-03,  7.34674558e-02,\n",
+       "                 -9.58381221e-02, -4.71204445e-02,  3.07661314e-02, -5.07396758e-02,\n",
+       "                 -1.06472917e-01, -4.56791297e-02,  3.80240083e-02, -2.05161609e-03,\n",
+       "                 -1.54581284e-02,  2.56832987e-02, -2.02810708e-02, -5.18618040e-02,\n",
+       "                 -6.43723831e-02,  2.77332105e-02, -1.13049299e-01, -8.25305060e-02,\n",
+       "                  2.06295867e-03,  3.80844735e-02, -2.54678018e-02, -7.67340511e-03,\n",
+       "                 -5.74909523e-02,  1.03158038e-02, -5.88300675e-02,  5.72723001e-02,\n",
+       "                  3.75031941e-02,  6.12024851e-02, -8.10966790e-02, -7.40096644e-02,\n",
+       "                  3.44251581e-02,  3.30497278e-04,  5.53901084e-02, -4.65683751e-02,\n",
+       "                  1.63332280e-02,  3.78027409e-02, -1.68565027e-02,  9.12062009e-04,\n",
+       "                  4.45604138e-02, -4.31712791e-02, -3.37749273e-02, -3.64207774e-02,\n",
+       "                 -2.89519206e-02, -3.16274688e-02,  3.14507494e-03, -3.27558778e-02,\n",
+       "                  4.80295047e-02, -5.75459516e-03,  3.29576619e-02, -2.32726056e-02,\n",
+       "                 -4.43717279e-02, -9.45364535e-02,  1.47395516e-02, -3.32047492e-02,\n",
+       "                  5.22973463e-02, -3.33522595e-02, -1.08384183e-02,  2.27131750e-02,\n",
+       "                  6.46038279e-02, -6.03022845e-03,  1.69095900e-02, -4.70702462e-02,\n",
+       "                  4.40847315e-02, -7.00245723e-02, -3.66129214e-03, -4.39092964e-02,\n",
+       "                  4.16780040e-02,  3.74898803e-03,  8.82267579e-02, -6.26748055e-02,\n",
+       "                 -7.64379129e-02,  2.61908397e-02, -3.34191360e-02, -5.92365190e-02,\n",
+       "                 -6.26700446e-02,  8.21715966e-03, -5.94762228e-02, -3.49649764e-03,\n",
+       "                 -7.91054498e-03, -1.05116203e-01, -2.14781463e-02,  6.25034347e-02,\n",
+       "                  6.15232275e-04, -6.48260564e-02,  6.41944706e-02, -9.87281203e-02,\n",
+       "                  4.22392786e-02,  2.89099030e-02,  4.90633957e-02, -3.93835381e-02,\n",
+       "                  2.58098776e-03, -7.80234784e-02,  1.09283090e-01, -3.93152684e-02,\n",
+       "                 -2.41577644e-02, -4.23509404e-02,  5.13587259e-02, -2.08917893e-02,\n",
+       "                 -9.90049797e-04, -3.47129218e-02,  3.90933678e-02,  7.25999326e-02,\n",
+       "                  6.32548481e-02, -6.10543042e-02, -4.34314925e-03, -7.20030144e-02,\n",
+       "                  3.20613086e-02,  6.36913851e-02, -5.04832268e-02, -2.49274280e-02,\n",
+       "                 -4.01630476e-02, -1.02888472e-01,  7.77155161e-02, -2.35703234e-02,\n",
+       "                 -2.90265046e-02, -6.19896501e-02,  2.04921290e-02, -7.78229954e-03,\n",
+       "                  5.88550046e-02,  8.65513459e-02,  4.17349748e-02,  9.32703614e-02,\n",
+       "                 -9.08269882e-02,  7.46139809e-02,  4.26179431e-02, -7.85728619e-02,\n",
+       "                 -4.75439504e-02, -2.36839484e-02,  3.25777940e-02, -4.10465710e-02,\n",
+       "                 -7.24445358e-02,  1.95803270e-02, -6.25842586e-02,  3.84642743e-02,\n",
+       "                  9.73698422e-02, -3.94890178e-03, -6.34230822e-02,  6.54949322e-02,\n",
+       "                 -7.02639446e-02,  7.34698959e-03,  9.34855826e-03,  7.41588175e-02,\n",
+       "                 -4.41608801e-02, -9.66508090e-02,  4.46497202e-02,  1.46768112e-02,\n",
+       "                  2.40328051e-02,  9.56735201e-03, -3.16882804e-02, -8.25649053e-02,\n",
+       "                 -2.15418488e-02, -6.63369074e-02,  5.47350608e-02,  2.53856424e-02,\n",
+       "                  2.52143480e-03,  3.41758989e-02, -3.06833293e-02,  3.53016481e-02,\n",
+       "                  4.56132926e-03, -4.27958407e-02, -4.84563690e-03, -5.22852540e-02,\n",
+       "                  4.93012071e-02,  7.69221857e-02,  8.91810358e-02, -3.40652093e-02,\n",
+       "                  4.26637530e-02,  3.34802121e-02, -6.97589070e-02, -6.99364617e-02,\n",
+       "                  4.96848905e-03,  3.50300744e-02,  5.43780625e-02,  8.37500170e-02,\n",
+       "                 -3.51133458e-02,  6.53213263e-02,  4.08907887e-03,  2.05903780e-02,\n",
+       "                  3.07346564e-02,  1.12512643e-02, -3.35258245e-02,  2.00964883e-02,\n",
+       "                 -7.92130753e-02, -6.38761520e-02, -5.32166511e-02, -6.66197017e-02,\n",
+       "                 -6.02674410e-02, -1.45740258e-02,  1.74162947e-02, -1.00922715e-02,\n",
+       "                  1.64833497e-02,  5.37883444e-03,  2.98331734e-02,  2.39258930e-02,\n",
+       "                 -5.21781705e-02, -3.69406790e-02, -2.19336022e-02,  7.12144002e-02,\n",
+       "                 -1.79243684e-02, -3.97394225e-02, -1.21570602e-01,  9.55308676e-02,\n",
+       "                 -3.95454168e-02, -3.46877822e-03,  3.34495120e-02, -5.81799522e-02,\n",
+       "                 -2.86029372e-02, -5.65220527e-02,  6.55567972e-04,  1.18885962e-02,\n",
+       "                 -6.88158497e-02,  1.21420855e-02, -1.16546685e-02, -2.32225470e-02,\n",
+       "                  4.47147042e-02,  6.95649311e-02, -4.26835306e-02, -1.59330107e-02,\n",
+       "                 -2.79076137e-02,  3.72364931e-02,  9.00735706e-02,  2.86666732e-02,\n",
+       "                 -5.26046082e-02,  2.58283727e-02,  3.59461047e-02, -1.87338181e-02,\n",
+       "                  1.64362025e-02,  1.06756319e-03,  6.04878142e-02, -1.31062083e-02,\n",
+       "                 -7.03594089e-02,  4.74309884e-02,  5.08545339e-02,  3.11768968e-02,\n",
+       "                 -2.47639306e-02, -6.00228012e-02,  6.14431426e-02,  1.42489225e-02,\n",
+       "                  1.61257351e-03, -5.95050529e-02, -4.87988591e-02,  5.72246872e-02,\n",
+       "                  5.33988047e-03,  6.72396421e-02, -7.28468075e-02,  4.77694571e-02,\n",
+       "                  6.32697940e-02,  7.30263665e-02,  1.65096261e-02, -5.55839986e-02,\n",
+       "                 -1.79752782e-02,  6.11882024e-02, -1.52537134e-02,  5.44449463e-02,\n",
+       "                 -2.75510475e-02,  4.73566540e-02, -5.51235154e-02,  3.62135470e-02,\n",
+       "                  4.04872857e-02,  4.04216610e-02, -5.64646423e-02, -9.89621878e-02,\n",
+       "                  4.53976885e-04,  5.28844260e-03, -9.11633074e-02,  2.31906958e-02,\n",
+       "                  5.08855991e-02,  4.17667106e-02, -1.03460886e-02, -9.60661918e-02,\n",
+       "                  4.08463739e-02,  4.51107807e-02,  2.29300167e-02,  4.96448539e-02,\n",
+       "                 -5.79110347e-02,  4.71823243e-03,  2.64104735e-02, -5.66517711e-02,\n",
+       "                 -5.72334938e-02, -3.19476537e-02, -1.32638989e-02,  3.67012108e-04,\n",
+       "                  5.98505437e-02, -5.61106540e-02,  3.62262875e-02,  4.87550870e-02,\n",
+       "                  2.20525730e-02, -4.59078001e-03,  1.95620954e-02, -5.58165535e-02,\n",
+       "                 -5.32784907e-05, -4.48737666e-02,  3.11158206e-02, -1.24887027e-01,\n",
+       "                  1.50636323e-02,  6.38935119e-02,  6.11636676e-02,  6.91439142e-04],\n",
+       "                dtype=float32)>\n",
+       "          (_feature_shapes): Dict()\n",
+       "          (_feature_dtypes): Dict()\n",
+       "        )\n",
+       "        (_feature_shapes): Dict()\n",
+       "        (_feature_dtypes): Dict()\n",
+       "      )\n",
+       "    )\n",
+       "    (_feature_shapes): Dict()\n",
+       "    (_feature_dtypes): Dict()\n",
+       "  ), CategoricalOutput(\n",
+       "    (to_call): EmbeddingTablePrediction(\n",
+       "      (table): EmbeddingTable(\n",
+       "        (features): Dict(\n",
+       "          (sess_pid_seq): ColumnSchema(name='sess_pid_seq', tags={<Tags.LIST: 'list'>, <Tags.ITEM_ID: 'item_id'>, <Tags.CATEGORICAL: 'categorical'>, <Tags.ITEM: 'item'>, <Tags.ID: 'id'>}, properties={'domain': {'min': 1, 'max': 390000, 'name': 'sess_pid_seq'}, 'value_count': {'min': 2, 'max': None}}, dtype=DType(name='int64', element_type=<ElementType.Int: 'int'>, element_size=64, element_unit=None, signed=True, shape=Shape(dims=(Dimension(min=0, max=None), Dimension(min=2, max=None)))), is_list=True, is_ragged=True)\n",
+       "        )\n",
+       "        (table): Embedding(\n",
+       "          (embeddings): <tf.Variable 'model/embeddings:0' shape=(390001, 448) dtype=float32, numpy=\n",
+       "          array([[-0.07078984,  0.02619123, -0.0765224 , ..., -0.00312191,\n",
+       "                  -0.05631081,  0.00704953],\n",
+       "                 [ 0.01045333,  0.00758395,  0.04146114, ...,  0.04109409,\n",
+       "                   0.03323384, -0.01482256],\n",
+       "                 [ 0.05135752,  0.00544662,  0.01021936, ...,  0.01505754,\n",
+       "                   0.04705757,  0.05248646],\n",
+       "                 ...,\n",
+       "                 [-0.01608207, -0.01954165, -0.07535209, ..., -0.04260258,\n",
+       "                  -0.01301942, -0.06323248],\n",
+       "                 [-0.06214527, -0.00186577, -0.0687324 , ..., -0.06297008,\n",
+       "                   0.01791379,  0.00888064],\n",
+       "                 [ 0.00934703, -0.02699249, -0.05696923, ..., -0.01498478,\n",
+       "                  -0.02875059, -0.01258981]], dtype=float32)>\n",
+       "          (_feature_shapes): Dict()\n",
+       "          (_feature_dtypes): Dict()\n",
+       "        )\n",
+       "        (_feature_shapes): Dict()\n",
+       "        (_feature_dtypes): Dict()\n",
+       "      )\n",
+       "      (output_layer_bias): <tf.Variable 'model/output_layer_bias:0' shape=(390001,) dtype=float32, numpy=\n",
+       "      array([-0.15439628,  0.03772116,  0.04522803, ..., -0.1648375 ,\n",
+       "             -0.1597082 , -0.15951891], dtype=float32)>\n",
+       "      (bias): <tf.Variable 'model/output_layer_bias:0' shape=(390001,) dtype=float32, numpy=\n",
+       "      array([-0.15439628,  0.03772116,  0.04522803, ..., -0.1648375 ,\n",
+       "             -0.1597082 , -0.15951891], dtype=float32)>\n",
+       "      (_feature_shapes): Dict()\n",
+       "      (_feature_dtypes): Dict()\n",
+       "    )\n",
+       "    (_feature_shapes): Dict()\n",
+       "    (_feature_dtypes): Dict()\n",
+       "  )))\n",
+       "  (context): ModelContext(\n",
+       "    (_feature_shapes): Dict()\n",
+       "    (_feature_dtypes): Dict()\n",
+       "  )\n",
+       "  (_prepare_features): PrepareFeatures(\n",
+       "    (prepare_lists): PrepareListFeatures()\n",
+       "  )\n",
+       "  (output_names): List(\n",
+       "    (0): 'sess_pid_seq/categorical_output'\n",
+       "  )\n",
+       "  (optimizer): Adam()\n",
+       "  (loss): Dict(\n",
+       "    (sess_pid_seq/categorical_output): CategoricalCrossEntropy()\n",
+       "  )\n",
+       "  (train_pre): SequencePredictNext(\n",
+       "    (_pre): SequentialBlock(\n",
+       "      (layers): List(\n",
+       "        (0): PrepareFeatures(\n",
+       "          (prepare_lists): PrepareListFeatures()\n",
+       "        )\n",
+       "        (1): PrepareFeatures(\n",
+       "          (prepare_lists): PrepareListFeatures()\n",
+       "        )\n",
+       "      )\n",
+       "      (prepare_lists): PrepareListFeatures()\n",
+       "    )\n",
+       "    (transformer): XLNetBlock(\n",
+       "      (transformer): TFXLNetMainLayer(\n",
+       "        (word_embedding): TFSharedEmbeddings(\n",
+       "          (_feature_shapes): Dict()\n",
+       "          (_feature_dtypes): Dict()\n",
+       "        )\n",
+       "        (layer): List(\n",
+       "          (0): TFXLNetLayer(\n",
+       "            (rel_attn): TFXLNetRelativeAttention(\n",
+       "              (layer_norm): LayerNormalization(\n",
+       "                (axis): List(\n",
+       "                  (0): 2\n",
+       "                )\n",
+       "                (gamma): <tf.Variable 'transformer/layer_._0/rel_attn/layer_norm/gamma:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([1.0096865 , 1.0156112 , 1.0047966 , 1.0055697 , 1.0296937 ,\n",
+       "                       1.0257732 , 1.0405434 , 1.0163577 , 0.9534506 , 1.0183752 ,\n",
+       "                       1.027002  , 1.0310668 , 1.0172462 , 1.0297366 , 0.9981551 ,\n",
+       "                       0.9956357 , 0.99598515, 0.98782843, 1.0019149 , 1.0021151 ,\n",
+       "                       0.9731392 , 1.0394815 , 1.0419115 , 0.99122995, 0.9815058 ,\n",
+       "                       1.0394274 , 0.95420986, 1.0140872 , 1.0178257 , 1.0153575 ,\n",
+       "                       0.9975193 , 1.0342228 , 0.9783905 , 0.99436754, 1.0437794 ,\n",
+       "                       1.0107313 , 0.9973728 , 1.0330907 , 0.98237264, 1.0205512 ,\n",
+       "                       1.0262665 , 1.057069  , 1.0186831 , 1.0065695 , 1.0573292 ,\n",
+       "                       0.9723765 , 1.0185301 , 0.9783078 , 1.0805802 , 1.0072856 ,\n",
+       "                       1.046347  , 0.9651661 , 1.0125892 , 1.0318221 , 1.0100422 ,\n",
+       "                       0.98210293, 1.0385141 , 1.0028491 , 1.0255537 , 0.9748143 ,\n",
+       "                       1.0136645 , 0.9777978 , 1.0167676 , 0.9867102 , 0.99873364,\n",
+       "                       1.0448893 , 0.9775781 , 1.020897  , 1.0156687 , 1.0070162 ,\n",
+       "                       0.9949982 , 0.9890248 , 1.0294597 , 0.97803134, 0.9471789 ,\n",
+       "                       1.0155677 , 1.0290877 , 1.0084465 , 0.9563062 , 0.98199034,\n",
+       "                       1.0073545 , 0.96270114, 1.0361133 , 1.0037365 , 1.0049076 ,\n",
+       "                       0.9958272 , 1.0042776 , 0.9906111 , 1.0195004 , 0.98845285,\n",
+       "                       1.0099287 , 1.0035214 , 0.9916738 , 0.9639702 , 0.9999653 ,\n",
+       "                       1.0250297 , 1.036368  , 1.0106395 , 0.99796367, 0.9961404 ,\n",
+       "                       0.99974966, 0.98292816, 0.9863248 , 1.0158017 , 0.9997731 ,\n",
+       "                       1.0132103 , 1.0377946 , 1.0157263 , 0.98545736, 1.0048945 ,\n",
+       "                       1.0137354 , 1.0606142 , 0.98290765, 1.0372158 , 0.9920816 ,\n",
+       "                       1.0716795 , 1.0048707 , 1.0199146 , 1.0151896 , 1.0404963 ,\n",
+       "                       1.009017  , 1.0116297 , 1.0267462 , 1.0299959 , 0.9948385 ,\n",
+       "                       1.0162882 , 1.0151713 , 0.9754863 , 1.0113914 , 1.0105838 ,\n",
+       "                       1.018187  , 1.0054674 , 1.0116692 , 1.0358899 , 1.0134988 ,\n",
+       "                       1.0051659 , 0.96874547, 0.99625516, 1.0667871 , 0.97690076,\n",
+       "                       1.0244907 , 0.9951849 , 0.9845813 , 0.9981892 , 1.0345283 ,\n",
+       "                       0.9751158 , 1.0104059 , 1.0049229 , 1.0344111 , 1.0108231 ,\n",
+       "                       1.0074483 , 1.0138446 , 0.97882235, 0.9838856 , 0.9797773 ,\n",
+       "                       1.0448751 , 1.0250106 , 0.9940398 , 1.0415001 , 1.010096  ,\n",
+       "                       0.9959737 , 1.0421578 , 0.99612373, 1.008482  , 1.0168474 ,\n",
+       "                       1.0117303 , 1.0058619 , 1.0206212 , 0.9813257 , 0.97197706,\n",
+       "                       1.0078402 , 1.0188038 , 0.9819965 , 1.0236609 , 0.9870887 ,\n",
+       "                       0.96151966, 1.0474262 , 1.0463325 , 1.0403295 , 1.015123  ,\n",
+       "                       1.0659757 , 0.98529726, 0.96674085, 1.0507897 , 0.9882364 ,\n",
+       "                       1.0611303 , 0.98063576, 1.0268865 , 0.9999817 , 0.95722026,\n",
+       "                       1.0107577 , 1.0596876 ], dtype=float32)>\n",
+       "                (beta): <tf.Variable 'transformer/layer_._0/rel_attn/layer_norm/beta:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([-7.82491732e-03,  1.17448866e-02,  2.86215218e-05,  2.13310122e-02,\n",
+       "                        6.15173485e-03,  4.41838168e-02,  3.52672711e-02,  3.73794995e-02,\n",
+       "                       -2.44397484e-02,  2.63913777e-02, -1.92101207e-02,  1.68179050e-02,\n",
+       "                        1.09884115e-02,  6.81292498e-03, -1.47153009e-02,  1.50813432e-02,\n",
+       "                       -7.20379350e-04,  1.68901030e-02, -4.87045525e-03, -2.82951538e-02,\n",
+       "                       -1.63124632e-02,  2.98008770e-02,  2.43800394e-02, -1.33296829e-02,\n",
+       "                        5.78173622e-03,  8.41072667e-03, -1.16651105e-02,  4.57805302e-03,\n",
+       "                       -1.83029305e-02, -5.12085622e-03,  1.37897804e-02, -2.52885967e-02,\n",
+       "                        1.42254690e-02, -1.35734994e-02,  5.25993854e-02, -1.03573725e-02,\n",
+       "                       -1.14020770e-02,  9.41959268e-04,  3.96627970e-02,  3.15781720e-02,\n",
+       "                       -2.24383790e-02,  1.86920688e-02, -7.97046442e-03, -2.70248894e-02,\n",
+       "                        3.81716304e-02,  1.37069626e-02,  1.00353323e-02, -6.83175074e-03,\n",
+       "                        1.59086268e-02,  4.49690456e-03,  1.20646395e-02, -1.96351800e-02,\n",
+       "                       -1.78791047e-03, -2.16557011e-02,  5.07375300e-02, -2.81546824e-03,\n",
+       "                        5.75071760e-03, -4.75972937e-03,  2.06295010e-02, -7.60992151e-03,\n",
+       "                        1.30418986e-02,  1.54393655e-03,  8.23538285e-03, -9.66409966e-03,\n",
+       "                       -1.59477256e-02, -6.53768145e-03,  2.64450200e-02, -1.21939182e-02,\n",
+       "                       -2.44537480e-02, -1.32514127e-02,  4.72463388e-03, -6.23199455e-02,\n",
+       "                       -9.88284126e-03, -1.01852976e-03,  8.38834606e-03,  5.14619891e-03,\n",
+       "                       -2.43399031e-02, -3.44760045e-02,  3.00469343e-02, -1.12967705e-02,\n",
+       "                       -1.09801833e-02,  2.30398844e-03,  9.92888771e-03, -3.32463742e-03,\n",
+       "                        3.43136154e-02,  3.60682383e-02, -3.67968087e-03,  1.74639337e-02,\n",
+       "                        1.97809841e-02, -2.45451611e-02,  1.67986832e-03,  2.69882358e-03,\n",
+       "                       -2.04691254e-02,  1.29097085e-02, -2.70051602e-02, -4.05806676e-02,\n",
+       "                       -2.31585279e-02,  4.98421630e-03, -4.47037667e-02, -8.27246532e-03,\n",
+       "                       -7.42262113e-04, -3.22355516e-03, -5.14169736e-03,  2.15779357e-02,\n",
+       "                       -1.11045064e-02, -2.59866863e-02,  3.82872522e-02,  1.02850962e-02,\n",
+       "                        3.94708291e-02, -1.60061326e-02,  5.03637968e-03, -2.80841645e-02,\n",
+       "                        7.09669766e-05, -4.67813946e-03, -1.76187896e-05,  1.27147445e-02,\n",
+       "                       -4.22244053e-03,  4.70675938e-02, -1.94290020e-02, -1.37540735e-02,\n",
+       "                        1.72726456e-02, -3.45245190e-02, -1.70333236e-02,  6.64326828e-03,\n",
+       "                       -2.56029330e-02,  3.23950835e-02, -1.42239043e-02, -1.48923928e-02,\n",
+       "                       -1.45010799e-02,  2.70975046e-02,  3.46343732e-03, -1.41528598e-03,\n",
+       "                       -3.36916260e-02,  9.26417951e-03,  1.23228608e-02, -1.04462192e-03,\n",
+       "                       -4.54590917e-02,  6.67568156e-03, -3.63403489e-03, -6.04176559e-02,\n",
+       "                        4.78232652e-03, -3.75009403e-02, -2.47718971e-02, -1.40848383e-03,\n",
+       "                       -5.22233248e-02, -1.13894709e-03, -7.80673418e-03,  5.45118609e-03,\n",
+       "                        1.58662163e-03,  4.10271995e-02,  1.59943216e-02, -3.07554863e-02,\n",
+       "                       -1.69451218e-02, -1.17179407e-02,  2.83574010e-03, -2.54462264e-03,\n",
+       "                       -1.83762833e-02, -1.88289094e-03, -3.40282395e-02,  1.10489558e-02,\n",
+       "                       -1.69651117e-03,  2.39129476e-02,  5.87868970e-03,  9.99899115e-04,\n",
+       "                       -5.21592982e-03,  3.35242087e-03, -1.36361187e-02,  1.72579456e-02,\n",
+       "                        3.15937190e-03,  4.49407697e-02, -1.53307710e-02, -6.07074127e-02,\n",
+       "                        3.54830991e-03, -3.54800522e-02,  9.24525037e-03,  3.27169746e-02,\n",
+       "                       -2.32813358e-02,  3.64200436e-02, -6.11901516e-04, -3.56406788e-03,\n",
+       "                       -1.71201453e-02,  1.83092244e-02,  3.73052014e-03,  4.37969994e-03,\n",
+       "                       -6.32673851e-04,  1.01843160e-02,  2.05308665e-02, -2.17945818e-02,\n",
+       "                        2.46619992e-02, -1.98999303e-03, -6.00536261e-03, -1.18894950e-02],\n",
+       "                      dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (dropout): Dropout(\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (q): <tf.Variable 'transformer/layer_._0/rel_attn/q:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[ 0.13197099, -0.12747517, -0.11641935, ..., -0.10109836,\n",
+       "                       -0.12369698, -0.12235671],\n",
+       "                      [-0.01014621,  0.0235051 , -0.0030254 , ..., -0.00358669,\n",
+       "                        0.02513896,  0.02814367],\n",
+       "                      [-0.09935587,  0.12525903, -0.1472499 , ...,  0.11936913,\n",
+       "                        0.13238919, -0.11256532],\n",
+       "                      ...,\n",
+       "                      [-0.12259299,  0.09363633, -0.11260894, ..., -0.07576296,\n",
+       "                       -0.08214942, -0.12410881],\n",
+       "                      [-0.05617683,  0.07248516,  0.05206291, ..., -0.06845155,\n",
+       "                        0.06023917,  0.07214421],\n",
+       "                      [ 0.0586201 ,  0.05837682,  0.05086967, ..., -0.04357501,\n",
+       "                       -0.06763364,  0.05550697]],\n",
+       "              \n",
+       "                     [[-0.13025644,  0.12209299,  0.12323013, ...,  0.12075363,\n",
+       "                        0.09601118,  0.09255827],\n",
+       "                      [ 0.08915628,  0.07382819,  0.07099618, ..., -0.0768103 ,\n",
+       "                        0.0475458 , -0.07742295],\n",
+       "                      [ 0.02872836, -0.06235151,  0.11553147, ..., -0.05319935,\n",
+       "                       -0.05903677,  0.03677876],\n",
+       "                      ...,\n",
+       "                      [ 0.12209638, -0.10401054,  0.13268085, ...,  0.09688871,\n",
+       "                        0.10452053,  0.12009949],\n",
+       "                      [ 0.10607433, -0.09689898, -0.06376923, ...,  0.08841456,\n",
+       "                       -0.10300028, -0.1044563 ],\n",
+       "                      [-0.0914668 , -0.08097184, -0.06668061, ...,  0.09470978,\n",
+       "                        0.06220397, -0.09111064]],\n",
+       "              \n",
+       "                     [[ 0.00058233,  0.02772736,  0.02006061, ...,  0.00036397,\n",
+       "                       -0.02168103,  0.01568287],\n",
+       "                      [ 0.00347983,  0.05903155,  0.02945688, ..., -0.03992393,\n",
+       "                        0.03995887, -0.01548792],\n",
+       "                      [-0.07598231,  0.09135605, -0.10173324, ...,  0.07594861,\n",
+       "                        0.08776175, -0.08319726],\n",
+       "                      ...,\n",
+       "                      [ 0.02002489, -0.0180598 ,  0.02898292, ...,  0.05892501,\n",
+       "                        0.07759988,  0.03240566],\n",
+       "                      [ 0.0311827 , -0.02396172, -0.06914719, ...,  0.02610791,\n",
+       "                       -0.031378  , -0.02404469],\n",
+       "                      [ 0.03871018,  0.03000399,  0.01775593, ..., -0.02095439,\n",
+       "                       -0.02130386,  0.04530597]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[-0.14868718,  0.15100038,  0.16120967, ...,  0.1410322 ,\n",
+       "                        0.15062724,  0.12837149],\n",
+       "                      [ 0.05342876,  0.03672805,  0.0651921 , ..., -0.05224199,\n",
+       "                        0.04776929, -0.08523804],\n",
+       "                      [ 0.05559164, -0.09261318,  0.107168  , ..., -0.08454619,\n",
+       "                       -0.09076596,  0.08992289],\n",
+       "                      ...,\n",
+       "                      [ 0.12589426, -0.11314777,  0.12426507, ...,  0.08356976,\n",
+       "                        0.10044491,  0.12639156],\n",
+       "                      [ 0.06355417, -0.04420558, -0.01156731, ...,  0.05051657,\n",
+       "                       -0.05817353, -0.03657222],\n",
+       "                      [-0.03658766, -0.02278869, -0.04286689, ...,  0.06056577,\n",
+       "                        0.04052235, -0.05048911]],\n",
+       "              \n",
+       "                     [[ 0.00077285, -0.02091939, -0.02179666, ..., -0.02718211,\n",
+       "                       -0.0087873 ,  0.00054167],\n",
+       "                      [-0.03704397, -0.0547603 , -0.04194904, ...,  0.0333349 ,\n",
+       "                       -0.03617225,  0.04379632],\n",
+       "                      [-0.00530401, -0.01642063,  0.00167275, ...,  0.00762442,\n",
+       "                        0.00649468,  0.00245123],\n",
+       "                      ...,\n",
+       "                      [ 0.00478095, -0.01497871, -0.00115625, ..., -0.00592807,\n",
+       "                       -0.01775305,  0.01014595],\n",
+       "                      [ 0.00987361, -0.01282128,  0.00660534, ...,  0.01324118,\n",
+       "                       -0.01851957,  0.00425063],\n",
+       "                      [ 0.01102448,  0.01941266,  0.00894985, ..., -0.02141596,\n",
+       "                        0.00027551,  0.04116082]],\n",
+       "              \n",
+       "                     [[-0.12173207,  0.12579004,  0.12077694, ...,  0.10138801,\n",
+       "                        0.11864589,  0.10221381],\n",
+       "                      [-0.02032071, -0.04710845, -0.0055217 , ...,  0.02435347,\n",
+       "                       -0.05264059,  0.00311177],\n",
+       "                      [-0.00397544, -0.03643695,  0.10240758, ..., -0.02665599,\n",
+       "                       -0.04377652,  0.03546317],\n",
+       "                      ...,\n",
+       "                      [ 0.0769384 , -0.06460597,  0.06227714, ...,  0.0460739 ,\n",
+       "                        0.02304599,  0.05762106],\n",
+       "                      [ 0.06128034, -0.04426205, -0.03479004, ...,  0.042454  ,\n",
+       "                       -0.05019034, -0.04568675],\n",
+       "                      [-0.05524379, -0.06202021, -0.04874821, ...,  0.04686412,\n",
+       "                        0.04290378, -0.0746149 ]]], dtype=float32)>\n",
+       "              (k): <tf.Variable 'transformer/layer_._0/rel_attn/k:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[-7.68226478e-03, -2.18245108e-02,  9.52953065e-04, ...,\n",
+       "                       -4.93486365e-03, -1.21793533e-02, -1.26160523e-02],\n",
+       "                      [-7.43793417e-03, -1.20707992e-02, -6.53376943e-03, ...,\n",
+       "                        2.92456280e-02, -3.25674308e-03,  1.21511864e-02],\n",
+       "                      [-1.35852136e-02,  1.87938241e-03, -1.01676602e-02, ...,\n",
+       "                        2.05786899e-02,  1.34299798e-02, -1.43495211e-02],\n",
+       "                      ...,\n",
+       "                      [ 3.58363008e-03, -2.66930517e-02,  1.21933036e-03, ...,\n",
+       "                       -1.62357197e-03, -1.62881166e-02,  3.91136855e-03],\n",
+       "                      [ 2.21821051e-02, -2.58309972e-02, -3.92753910e-03, ...,\n",
+       "                        3.09738088e-02, -2.88884938e-02, -1.72762908e-02],\n",
+       "                      [ 3.42399031e-02,  4.14119326e-02,  3.64699885e-02, ...,\n",
+       "                       -1.62819158e-02, -4.43666801e-02,  4.56376821e-02]],\n",
+       "              \n",
+       "                     [[ 5.56782149e-02, -3.10854726e-02, -4.81049083e-02, ...,\n",
+       "                       -3.98653857e-02, -4.33852226e-02, -3.19941342e-02],\n",
+       "                      [ 4.35383096e-02,  6.49795458e-02,  2.57861316e-02, ...,\n",
+       "                       -5.24633527e-02,  4.20018435e-02, -2.63198018e-02],\n",
+       "                      [-2.54611839e-02,  3.08996532e-02,  1.94905959e-02, ...,\n",
+       "                        3.56150158e-02,  2.95397937e-02, -5.12102805e-02],\n",
+       "                      ...,\n",
+       "                      [-1.21757882e-02,  2.53642909e-02,  7.72101339e-05, ...,\n",
+       "                        1.69840753e-02,  8.38600751e-03, -3.96163156e-03],\n",
+       "                      [-3.53838429e-02,  3.53519283e-02, -3.68676893e-02, ...,\n",
+       "                       -2.53158119e-02,  2.94843595e-02,  1.01852333e-02],\n",
+       "                      [-1.47796969e-03,  6.62320666e-03,  1.49483886e-02, ...,\n",
+       "                       -2.28901999e-03, -6.19671959e-03,  2.28765719e-02]],\n",
+       "              \n",
+       "                     [[ 1.17053827e-02, -2.50329729e-02, -2.19117496e-02, ...,\n",
+       "                       -3.80133167e-02, -2.65514757e-02, -7.27514597e-03],\n",
+       "                      [-1.78928077e-02, -1.69182811e-02,  3.16141150e-03, ...,\n",
+       "                        1.59324165e-02, -1.54765015e-02,  7.96239730e-03],\n",
+       "                      [-1.16813637e-01,  1.03553854e-01, -3.13211568e-02, ...,\n",
+       "                        1.13394342e-01,  1.06305420e-01, -1.10351004e-01],\n",
+       "                      ...,\n",
+       "                      [-2.18171608e-02,  1.39812902e-02, -1.50209228e-02, ...,\n",
+       "                       -3.89618762e-02, -4.92681414e-02, -4.68410878e-03],\n",
+       "                      [ 3.05185374e-02, -3.40098143e-02,  1.13884155e-02, ...,\n",
+       "                        2.97950469e-02, -3.64380144e-02, -1.04942517e-02],\n",
+       "                      [ 3.37445624e-02,  3.35685574e-02,  3.04103903e-02, ...,\n",
+       "                       -2.40385197e-02, -1.90875176e-02,  4.48835082e-02]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[ 4.42194827e-02, -5.08627035e-02, -3.86995897e-02, ...,\n",
+       "                       -5.09292372e-02, -4.82375398e-02, -4.56841141e-02],\n",
+       "                      [-5.57947196e-02, -4.15932760e-02, -4.83722910e-02, ...,\n",
+       "                        4.65600304e-02, -4.73332889e-02,  3.59597690e-02],\n",
+       "                      [-4.08401750e-02,  2.42609885e-02,  3.46741155e-02, ...,\n",
+       "                        3.86420041e-02,  9.45237931e-03, -3.15879993e-02],\n",
+       "                      ...,\n",
+       "                      [ 4.90185805e-03,  4.53932863e-03,  1.13866816e-03, ...,\n",
+       "                        1.40106957e-02,  1.91211719e-02, -8.73244926e-03],\n",
+       "                      [-6.61803456e-03,  1.66730173e-02, -4.06372882e-02, ...,\n",
+       "                       -2.04761196e-02,  3.11128376e-03,  1.49987591e-02],\n",
+       "                      [ 5.47084492e-03,  6.85863616e-03,  2.34094419e-04, ...,\n",
+       "                        2.92215571e-02,  5.72894141e-03, -1.19066413e-03]],\n",
+       "              \n",
+       "                     [[-4.31554615e-02,  6.39417619e-02,  5.02575226e-02, ...,\n",
+       "                        6.53538033e-02,  5.54384664e-02,  4.20371369e-02],\n",
+       "                      [ 7.17930421e-02,  7.29683116e-02,  6.09961711e-02, ...,\n",
+       "                       -9.18020830e-02,  8.56361762e-02, -6.71873838e-02],\n",
+       "                      [ 5.04934788e-02, -4.51203883e-02,  1.68532617e-02, ...,\n",
+       "                       -3.29082832e-02, -2.49036923e-02,  4.25316319e-02],\n",
+       "                      ...,\n",
+       "                      [ 1.46742398e-02, -3.43895471e-03,  5.69227152e-03, ...,\n",
+       "                       -2.83451960e-03,  1.22414744e-02,  1.62646342e-02],\n",
+       "                      [-6.54027564e-03,  1.52935763e-03, -9.13942046e-03, ...,\n",
+       "                        5.21203212e-04, -2.77781975e-03, -6.00035116e-03],\n",
+       "                      [-5.78916371e-02, -5.93501814e-02, -8.45207125e-02, ...,\n",
+       "                        4.54125442e-02,  6.86786473e-02, -5.92041649e-02]],\n",
+       "              \n",
+       "                     [[ 4.55016270e-02, -1.08455513e-02, -2.07238458e-02, ...,\n",
+       "                       -2.82163695e-02, -2.77336575e-02, -3.14533934e-02],\n",
+       "                      [-2.32847258e-02, -1.02253594e-02, -4.68420517e-03, ...,\n",
+       "                       -5.64631820e-03, -2.67742760e-03,  2.13843174e-02],\n",
+       "                      [-2.86033489e-02,  2.24300697e-02,  4.91300672e-02, ...,\n",
+       "                        1.67693906e-02,  1.43385716e-02, -1.24855936e-02],\n",
+       "                      ...,\n",
+       "                      [-1.71137322e-02,  2.70220917e-02, -2.11604238e-02, ...,\n",
+       "                        1.46003044e-03, -1.17526902e-02, -1.94206256e-02],\n",
+       "                      [-8.81280228e-02,  8.72216299e-02,  4.61283103e-02, ...,\n",
+       "                       -8.43449533e-02,  8.62690136e-02,  8.77720714e-02],\n",
+       "                      [ 6.30031154e-03, -7.33704399e-03, -6.12117175e-04, ...,\n",
+       "                       -7.54373753e-03,  4.23501385e-03, -1.15064979e-02]]],\n",
+       "                    dtype=float32)>\n",
+       "              (v): <tf.Variable 'transformer/layer_._0/rel_attn/v:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[ 2.1935981e-02, -6.5499027e-03, -1.1758077e-02, ...,\n",
+       "                        1.0016707e-02, -7.5214269e-04, -8.2895309e-03],\n",
+       "                      [-1.8930623e-03,  5.3072263e-02,  1.5991306e-03, ...,\n",
+       "                       -1.8671863e-02,  2.4590937e-02,  2.4358975e-02],\n",
+       "                      [-3.1385969e-02, -2.4187125e-02, -2.3068676e-02, ...,\n",
+       "                       -2.9522167e-03,  2.9918220e-02, -1.3696299e-02],\n",
+       "                      ...,\n",
+       "                      [ 4.5431224e-03, -2.1852402e-03, -3.7807938e-02, ...,\n",
+       "                       -6.8151602e-03, -6.5027446e-02, -2.5086295e-02],\n",
+       "                      [ 1.6041191e-02,  2.7763426e-02,  3.7474424e-02, ...,\n",
+       "                       -2.7330104e-02,  1.4487169e-02, -3.0760732e-02],\n",
+       "                      [ 2.8109785e-02, -2.4505377e-02,  1.8567089e-02, ...,\n",
+       "                        1.4045787e-02, -1.9658763e-02, -1.4424617e-02]],\n",
+       "              \n",
+       "                     [[ 1.8175874e-03, -3.2669792e-04,  1.3658139e-02, ...,\n",
+       "                       -2.3051307e-02, -4.8103187e-02,  1.1212352e-02],\n",
+       "                      [ 8.3899694e-03,  2.7757354e-02,  2.1220583e-03, ...,\n",
+       "                        1.4684557e-02, -9.0189716e-03, -1.3189890e-02],\n",
+       "                      [-4.5665298e-03,  6.0181617e-04, -1.9221806e-03, ...,\n",
+       "                       -2.3014978e-02, -1.6371313e-02, -1.3619252e-02],\n",
+       "                      ...,\n",
+       "                      [-4.4560842e-02,  3.2866932e-02, -1.5270534e-02, ...,\n",
+       "                        4.7959336e-03, -5.0913695e-02, -4.4832855e-02],\n",
+       "                      [-2.6422122e-02,  3.0812582e-05, -1.1526907e-02, ...,\n",
+       "                       -2.9947080e-02,  9.2024086e-03,  4.0475205e-03],\n",
+       "                      [-4.6224903e-02,  4.9632844e-03,  7.3847193e-03, ...,\n",
+       "                       -3.4064833e-02,  1.4927809e-02,  4.0222075e-02]],\n",
+       "              \n",
+       "                     [[-2.4709852e-02,  4.0778179e-02,  2.4162993e-02, ...,\n",
+       "                       -7.7223894e-04,  3.3004548e-02, -2.0557796e-03],\n",
+       "                      [-1.7915012e-02, -4.2037833e-02,  1.7063325e-02, ...,\n",
+       "                        3.9280627e-02, -8.4403567e-03,  1.0665564e-03],\n",
+       "                      [-3.1648852e-02,  1.9462965e-02, -5.1749021e-02, ...,\n",
+       "                        1.2728607e-02, -3.1452335e-02, -1.2489329e-02],\n",
+       "                      ...,\n",
+       "                      [-3.3701200e-02,  1.7426152e-02,  9.4926590e-03, ...,\n",
+       "                        8.8201044e-03, -2.5306158e-02,  5.8208715e-02],\n",
+       "                      [ 1.6601574e-02, -1.4275823e-02, -1.6822370e-02, ...,\n",
+       "                        2.4828877e-02, -8.6892888e-02,  6.4262375e-03],\n",
+       "                      [ 9.1747073e-03, -1.1685979e-02, -3.6286458e-02, ...,\n",
+       "                        1.3910839e-02,  8.0748266e-03,  5.0397436e-03]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[-8.4186476e-03, -1.0676413e-02, -1.0499355e-02, ...,\n",
+       "                        1.4340507e-03, -1.5456588e-02,  8.2055647e-03],\n",
+       "                      [ 2.0050982e-02,  3.9912029e-03, -4.9512643e-02, ...,\n",
+       "                       -8.0223344e-03,  8.9866975e-03, -1.7193217e-02],\n",
+       "                      [-6.1425157e-03, -2.3025960e-02, -2.0697471e-02, ...,\n",
+       "                       -1.3261255e-03, -4.4959106e-02,  1.4391148e-02],\n",
+       "                      ...,\n",
+       "                      [-3.9630566e-02,  3.4915447e-02, -2.5021229e-02, ...,\n",
+       "                        1.9735634e-02,  2.4283731e-02,  8.8040769e-02],\n",
+       "                      [ 7.1960546e-02, -3.2245752e-03, -3.1058513e-02, ...,\n",
+       "                        9.1858171e-03,  2.0113736e-02,  3.4582719e-02],\n",
+       "                      [ 3.5613827e-02,  5.2555401e-02,  2.0199718e-02, ...,\n",
+       "                        2.9557332e-02, -2.4335729e-03, -4.0849347e-02]],\n",
+       "              \n",
+       "                     [[ 2.5519842e-02,  3.4481441e-03,  7.5593151e-02, ...,\n",
+       "                       -1.0861231e-02,  1.3288087e-02, -2.1570064e-03],\n",
+       "                      [ 2.5518127e-02,  1.7416688e-02,  3.1182369e-02, ...,\n",
+       "                       -2.4906599e-03,  1.5789142e-02,  8.4962416e-03],\n",
+       "                      [ 1.0470330e-02, -9.0953298e-03,  2.6568150e-02, ...,\n",
+       "                       -7.2716870e-03,  3.2788489e-02,  1.6375307e-02],\n",
+       "                      ...,\n",
+       "                      [ 5.4019187e-03, -1.6473958e-02, -2.0612899e-02, ...,\n",
+       "                       -9.2589520e-03,  1.1356876e-02,  2.7651006e-02],\n",
+       "                      [ 1.5268090e-02,  8.3070369e-03,  8.7036788e-03, ...,\n",
+       "                        7.7237003e-03,  7.3369341e-03,  2.1213299e-02],\n",
+       "                      [-4.1702986e-02, -1.6719857e-02, -4.1055001e-02, ...,\n",
+       "                        2.3881821e-03, -1.4375679e-02, -5.3924224e-03]],\n",
+       "              \n",
+       "                     [[-3.8459700e-02,  2.7399434e-02, -2.4477823e-02, ...,\n",
+       "                       -2.8467288e-02,  4.2125326e-02, -2.4380080e-02],\n",
+       "                      [-8.2248095e-03,  9.4872410e-04,  3.1300731e-02, ...,\n",
+       "                        1.2363208e-02,  1.0819474e-02, -1.3270676e-03],\n",
+       "                      [-1.3462825e-02,  1.1999467e-02, -5.2867807e-03, ...,\n",
+       "                        5.4947892e-03,  8.4173940e-03, -1.5731178e-02],\n",
+       "                      ...,\n",
+       "                      [ 6.6192739e-02, -2.1830844e-03, -2.2746423e-02, ...,\n",
+       "                        9.5197987e-03, -3.5458893e-02,  4.4134855e-02],\n",
+       "                      [ 2.5184005e-02,  5.4138672e-02,  1.3472022e-02, ...,\n",
+       "                       -4.9555153e-02, -3.8271304e-02, -1.1530346e-03],\n",
+       "                      [-1.5618957e-02, -2.3071036e-02,  6.0527720e-02, ...,\n",
+       "                        3.5982949e-03,  7.5665531e-03,  1.2278390e-03]]], dtype=float32)>\n",
+       "              (o): <tf.Variable 'transformer/layer_._0/rel_attn/o:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[ 3.4558035e-02, -8.1972502e-02, -5.6760699e-02, ...,\n",
+       "                        1.3388766e-02, -3.4494880e-03, -3.5049133e-02],\n",
+       "                      [ 1.4903742e-02,  5.1185200e-03,  2.7732885e-02, ...,\n",
+       "                        1.5752869e-02, -1.6719513e-04, -3.2367846e-03],\n",
+       "                      [-3.1436101e-02, -3.6930665e-02, -8.4744478e-03, ...,\n",
+       "                        1.1747203e-02, -2.9896988e-02, -2.3278227e-02],\n",
+       "                      ...,\n",
+       "                      [-4.4766188e-02, -2.9565591e-02,  2.2492344e-02, ...,\n",
+       "                        2.3775781e-03, -2.3477389e-03, -6.3977003e-02],\n",
+       "                      [-7.9599731e-03,  2.3603067e-02,  4.2270361e-03, ...,\n",
+       "                       -7.9671228e-03, -8.4035415e-03,  3.3881772e-02],\n",
+       "                      [ 2.3896206e-02,  5.2790940e-02, -1.9825008e-02, ...,\n",
+       "                        3.4890927e-02, -1.6427118e-02, -1.3012372e-02]],\n",
+       "              \n",
+       "                     [[ 5.6012128e-02,  3.9354857e-02, -3.7056282e-02, ...,\n",
+       "                       -9.5437188e-04, -1.5669381e-02,  3.6575941e-03],\n",
+       "                      [ 1.0521270e-02,  2.4832424e-02,  1.0564318e-02, ...,\n",
+       "                        4.5253210e-02, -3.8564852e-03, -5.6845369e-03],\n",
+       "                      [ 1.9469766e-02, -2.4921447e-03,  1.7152067e-02, ...,\n",
+       "                       -2.1238407e-02, -3.6743453e-03, -1.8075069e-02],\n",
+       "                      ...,\n",
+       "                      [-9.2346454e-04,  3.8158480e-02,  1.6374113e-02, ...,\n",
+       "                        1.5201136e-02,  1.3134910e-02,  6.9975376e-02],\n",
+       "                      [-2.4690642e-03,  7.7905254e-03, -2.1554135e-02, ...,\n",
+       "                       -3.9290216e-02, -4.0334272e-03, -1.0793213e-03],\n",
+       "                      [-1.6754212e-02,  4.7255494e-02, -3.2703991e-03, ...,\n",
+       "                       -3.3369564e-02, -6.0496605e-03,  2.2343850e-02]],\n",
+       "              \n",
+       "                     [[ 3.5791956e-02,  3.4770794e-02,  3.7401337e-02, ...,\n",
+       "                       -4.1593242e-02, -6.7334563e-02,  7.5647626e-03],\n",
+       "                      [-5.5595064e-03, -8.0210743e-03,  3.9957631e-02, ...,\n",
+       "                        1.7897096e-02,  2.1864127e-02,  4.6957351e-02],\n",
+       "                      [-3.2328866e-02,  1.4444360e-02, -6.8443440e-02, ...,\n",
+       "                        8.4532611e-03, -8.8195698e-03,  4.0060803e-03],\n",
+       "                      ...,\n",
+       "                      [-4.3917345e-03,  2.9294435e-02, -3.1086415e-02, ...,\n",
+       "                        3.7843004e-02,  2.0224897e-02, -9.4552422e-03],\n",
+       "                      [ 2.0256270e-02,  1.3612260e-02, -1.5514650e-02, ...,\n",
+       "                        1.6113631e-02, -7.7781297e-02,  4.5416508e-02],\n",
+       "                      [-1.7456708e-02, -3.6125474e-02, -4.8056237e-02, ...,\n",
+       "                        5.6817383e-03,  3.8123481e-02,  5.2873984e-02]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[-6.6254879e-03, -7.6921834e-03,  1.3759888e-02, ...,\n",
+       "                       -9.2632528e-03,  1.1549971e-02, -3.9358933e-02],\n",
+       "                      [ 1.4470451e-02, -4.2162634e-02,  1.2218486e-02, ...,\n",
+       "                        3.8135707e-02, -3.5125174e-02, -5.4729473e-02],\n",
+       "                      [ 8.0266371e-03,  8.7115606e-03,  5.6484030e-03, ...,\n",
+       "                        5.8089835e-03, -3.3503424e-02, -1.6844057e-02],\n",
+       "                      ...,\n",
+       "                      [-1.0784569e-02,  4.7266845e-02,  5.7555144e-03, ...,\n",
+       "                       -3.6044452e-02,  3.6605848e-03, -1.0359948e-02],\n",
+       "                      [ 1.3826589e-02, -2.8647454e-03,  2.5868905e-03, ...,\n",
+       "                        1.7714184e-02, -3.6266308e-02, -7.1984404e-03],\n",
+       "                      [-2.3084020e-02,  2.2052677e-02, -2.8226499e-02, ...,\n",
+       "                        5.0086722e-02,  1.3204823e-02,  2.3870086e-03]],\n",
+       "              \n",
+       "                     [[-2.8730264e-02, -5.2821822e-03, -9.1553042e-03, ...,\n",
+       "                        2.0447128e-02, -4.7689546e-02,  7.5007915e-03],\n",
+       "                      [-2.3960054e-02, -1.7942205e-02, -1.8274842e-02, ...,\n",
+       "                       -8.0897193e-03, -2.3875024e-02, -1.4553037e-02],\n",
+       "                      [ 1.7344387e-02, -2.0958342e-02,  1.4681545e-02, ...,\n",
+       "                       -2.2302102e-02,  2.8698748e-02, -9.1849379e-03],\n",
+       "                      ...,\n",
+       "                      [-1.8616887e-02,  4.7773879e-02,  2.2023235e-02, ...,\n",
+       "                       -3.4950111e-02, -3.9754819e-02,  3.8231418e-03],\n",
+       "                      [-2.6944082e-03, -2.2312153e-02,  6.6401674e-03, ...,\n",
+       "                        1.6840655e-02,  8.5035199e-04, -5.4619432e-04],\n",
+       "                      [ 7.5075715e-03,  2.7986795e-02, -2.1366706e-02, ...,\n",
+       "                        2.1776481e-02, -3.2732459e-03,  1.7775759e-02]],\n",
+       "              \n",
+       "                     [[ 1.7125104e-02,  1.5672354e-02, -1.9874105e-02, ...,\n",
+       "                       -8.8345492e-03, -6.3765082e-03,  3.8814072e-02],\n",
+       "                      [-1.5929114e-02,  4.0955096e-02,  1.8637704e-02, ...,\n",
+       "                       -4.3095972e-02,  5.2418392e-03, -8.3040539e-03],\n",
+       "                      [-2.5189148e-02,  1.6959475e-02,  2.0080386e-03, ...,\n",
+       "                        1.7491961e-06, -9.4349124e-03, -8.7165339e-03],\n",
+       "                      ...,\n",
+       "                      [-1.5020861e-02,  9.1123721e-03, -1.2940341e-02, ...,\n",
+       "                        2.1540092e-02, -4.8262607e-02,  9.3815767e-04],\n",
+       "                      [-2.0072028e-02, -3.4046255e-03, -5.2106597e-02, ...,\n",
+       "                       -1.6067177e-02,  4.7017686e-02,  5.2954555e-03],\n",
+       "                      [ 2.7247950e-02, -4.7271936e-03,  3.7552916e-02, ...,\n",
+       "                       -2.3428671e-02,  2.5338635e-02, -7.1937349e-03]]], dtype=float32)>\n",
+       "              (r): <tf.Variable 'transformer/layer_._0/rel_attn/r:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[ 3.38747710e-01, -3.52252215e-01, -3.31913650e-01, ...,\n",
+       "                       -3.32406253e-01, -3.55435610e-01, -3.70355815e-01],\n",
+       "                      [-2.57155180e-01, -2.27717996e-01, -2.49137834e-01, ...,\n",
+       "                        2.52328873e-01, -2.27478221e-01,  2.74260193e-01],\n",
+       "                      [-8.42767283e-02,  1.40244111e-01, -1.90620884e-01, ...,\n",
+       "                        1.35595366e-01,  1.51921853e-01, -1.44851297e-01],\n",
+       "                      ...,\n",
+       "                      [-3.61111403e-01,  3.26171756e-01, -3.69894445e-01, ...,\n",
+       "                       -3.20066005e-01, -3.35039854e-01, -3.68529588e-01],\n",
+       "                      [-3.09335232e-01,  3.14753771e-01,  3.20735216e-01, ...,\n",
+       "                       -3.20914894e-01,  2.96445906e-01,  3.30758154e-01],\n",
+       "                      [ 2.12763369e-01,  2.13694334e-01,  2.23139688e-01, ...,\n",
+       "                       -2.15393752e-01, -2.09336951e-01,  2.45465353e-01]],\n",
+       "              \n",
+       "                     [[ 3.20928752e-01, -2.94858247e-01, -3.14106166e-01, ...,\n",
+       "                       -3.04256856e-01, -3.10841501e-01, -3.13560814e-01],\n",
+       "                      [-1.59511223e-01, -1.70894131e-01, -1.87740177e-01, ...,\n",
+       "                        1.77135527e-01, -1.74924582e-01,  1.93289027e-01],\n",
+       "                      [-1.41561776e-02,  7.51935318e-02, -1.13328710e-01, ...,\n",
+       "                        7.05530196e-02,  7.44837448e-02, -9.26639065e-02],\n",
+       "                      ...,\n",
+       "                      [-3.11126292e-01,  3.01795095e-01, -2.95113325e-01, ...,\n",
+       "                       -2.81502992e-01, -2.79552013e-01, -2.94877738e-01],\n",
+       "                      [-2.69808233e-01,  2.46761337e-01,  2.37797692e-01, ...,\n",
+       "                       -2.70426184e-01,  2.29666948e-01,  2.68684894e-01],\n",
+       "                      [ 1.52459487e-01,  1.56723812e-01,  1.87588021e-01, ...,\n",
+       "                       -1.80774227e-01, -1.40872061e-01,  1.92230970e-01]],\n",
+       "              \n",
+       "                     [[ 2.41833925e-01, -2.19398052e-01, -2.29633719e-01, ...,\n",
+       "                       -2.45204329e-01, -2.58349568e-01, -2.36624196e-01],\n",
+       "                      [-1.61572859e-01, -1.48212776e-01, -1.40561178e-01, ...,\n",
+       "                        1.41516134e-01, -1.32165566e-01,  1.68426186e-01],\n",
+       "                      [ 8.09539296e-03,  3.59569304e-02, -1.04876310e-01, ...,\n",
+       "                        1.58704743e-02,  3.60485800e-02, -2.96752173e-02],\n",
+       "                      ...,\n",
+       "                      [-2.84408092e-01,  2.66984671e-01, -2.70496905e-01, ...,\n",
+       "                       -2.57439345e-01, -2.39332542e-01, -2.48226896e-01],\n",
+       "                      [-2.43775159e-01,  2.12252900e-01,  2.33381778e-01, ...,\n",
+       "                       -2.36481652e-01,  2.05704838e-01,  2.55553931e-01],\n",
+       "                      [ 1.28472507e-01,  1.25496238e-01,  1.41340226e-01, ...,\n",
+       "                       -1.42667651e-01, -1.06452040e-01,  1.74517885e-01]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[ 1.18206572e-02, -1.62823759e-02, -1.13886865e-02, ...,\n",
+       "                       -2.72346847e-02, -1.76205616e-02, -2.58876495e-02],\n",
+       "                      [-2.48313230e-02, -2.81952247e-02, -2.03840993e-02, ...,\n",
+       "                        1.74464211e-02, -2.47928239e-02,  7.45158223e-03],\n",
+       "                      [-9.72194225e-03,  1.15375388e-02, -2.56897379e-02, ...,\n",
+       "                        3.06775165e-03,  1.03304058e-03,  2.59421836e-03],\n",
+       "                      ...,\n",
+       "                      [-1.75657198e-02,  2.45507937e-02, -2.12120879e-02, ...,\n",
+       "                       -2.06703022e-02, -1.25367660e-02, -1.66469775e-02],\n",
+       "                      [ 1.25846509e-02, -3.71760194e-04,  4.49259765e-03, ...,\n",
+       "                       -6.64241752e-03, -9.64385923e-03,  1.40363369e-02],\n",
+       "                      [ 1.40556889e-02,  1.82496123e-02, -2.07160265e-04, ...,\n",
+       "                        2.71461118e-04, -8.42160638e-03,  1.78159462e-04]],\n",
+       "              \n",
+       "                     [[-2.22503580e-02,  3.15407328e-02,  2.72795390e-02, ...,\n",
+       "                        2.50934549e-02,  3.40305455e-02,  3.39202397e-02],\n",
+       "                      [ 1.35067226e-02,  2.46651508e-02,  1.00027593e-02, ...,\n",
+       "                       -2.89492551e-02,  1.59373134e-02, -1.51004000e-02],\n",
+       "                      [ 2.25287229e-02, -2.75186412e-02,  1.70388352e-02, ...,\n",
+       "                       -1.08766872e-02, -1.86810736e-03,  1.76009033e-02],\n",
+       "                      ...,\n",
+       "                      [ 1.43293003e-02, -1.70654003e-02,  1.25767132e-02, ...,\n",
+       "                        8.09190446e-04,  1.77804064e-02,  3.09025124e-02],\n",
+       "                      [ 2.47963774e-03, -2.90571898e-03, -1.11264074e-02, ...,\n",
+       "                        5.73507929e-03, -9.31484811e-03,  3.93942930e-03],\n",
+       "                      [-8.68460070e-03,  2.89098313e-03, -2.11955067e-02, ...,\n",
+       "                        1.13159856e-02,  2.39106696e-02,  7.65375979e-03]],\n",
+       "              \n",
+       "                     [[ 5.94059192e-02, -3.16232182e-02, -4.25012745e-02, ...,\n",
+       "                       -4.64180671e-02, -4.29909676e-02, -5.43733463e-02],\n",
+       "                      [ 1.00171287e-02,  2.10887119e-02,  3.75756249e-02, ...,\n",
+       "                       -3.65561582e-02,  1.15714017e-02, -2.47725472e-02],\n",
+       "                      [-2.42286529e-02,  6.19218312e-03,  2.24700011e-02, ...,\n",
+       "                       -6.83102896e-03, -3.37700290e-03,  4.71456256e-03],\n",
+       "                      ...,\n",
+       "                      [ 1.35079189e-03,  1.35904429e-02, -1.20370295e-02, ...,\n",
+       "                       -6.28219778e-03, -2.10926589e-02, -1.22290216e-02],\n",
+       "                      [-3.48052718e-02,  4.21429165e-02, -4.43692598e-03, ...,\n",
+       "                       -3.98377255e-02,  2.64684688e-02,  3.64753604e-02],\n",
+       "                      [-1.27071552e-02, -1.95082203e-02, -4.74442961e-03, ...,\n",
+       "                       -5.14267990e-03,  1.45630771e-02, -1.93668939e-02]]],\n",
+       "                    dtype=float32)>\n",
+       "              (r_r_bias): <tf.Variable 'transformer/layer_._0/rel_attn/r_r_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "              array([[-0.37346047,  0.37250054,  0.3907651 ,  0.38277408,  0.35741195,\n",
+       "                       0.38824454, -0.36372992,  0.37197435,  0.37989146,  0.37147713,\n",
+       "                       0.37070706,  0.35559788],\n",
+       "                     [ 0.06975611,  0.07689185,  0.07228172, -0.0722764 ,  0.08365536,\n",
+       "                       0.06633326,  0.07988963, -0.06860004, -0.0622002 , -0.06374823,\n",
+       "                       0.0776644 , -0.07216003],\n",
+       "                     [ 0.22928728, -0.17429328,  0.09725206, -0.10263564,  0.06898433,\n",
+       "                       0.13690604,  0.12810868,  0.06246556, -0.14255992, -0.169385  ,\n",
+       "                      -0.16261199,  0.16058037],\n",
+       "                     [-0.19601476, -0.19472797,  0.20428008,  0.20267177,  0.18398753,\n",
+       "                      -0.20113394, -0.20566987, -0.21166983,  0.2035028 ,  0.20144981,\n",
+       "                      -0.20082442, -0.21696469],\n",
+       "                     [-0.27361003,  0.26644444, -0.25823227,  0.27925947,  0.27160206,\n",
+       "                      -0.26067862,  0.270715  ,  0.2698397 ,  0.25726572,  0.25751913,\n",
+       "                       0.24445428,  0.27668142],\n",
+       "                     [-0.30897072,  0.29939672,  0.29147333, -0.29759452,  0.31223142,\n",
+       "                      -0.270364  , -0.3067601 , -0.30111563,  0.31529158,  0.31188235,\n",
+       "                      -0.29824102, -0.31075856],\n",
+       "                     [-0.39532706,  0.38874832, -0.39142627, -0.3886234 , -0.38499188,\n",
+       "                      -0.39429832,  0.3917147 , -0.37333068, -0.38008067,  0.38615617,\n",
+       "                      -0.38081092, -0.39247522],\n",
+       "                     [ 0.2290351 , -0.23079675,  0.23544736,  0.21889143,  0.21990548,\n",
+       "                       0.2233682 ,  0.20575589,  0.23166424,  0.21836095, -0.22710325,\n",
+       "                      -0.23054157, -0.22402786],\n",
+       "                     [ 0.31462234, -0.33824605,  0.34888077,  0.35271886, -0.35531324,\n",
+       "                       0.34544548,  0.3376679 ,  0.3411377 , -0.335851  , -0.3580673 ,\n",
+       "                       0.33728704, -0.35013184],\n",
+       "                     [ 0.28967628, -0.28802818,  0.29017174,  0.29956898,  0.29380292,\n",
+       "                      -0.28895316, -0.28544793, -0.292428  , -0.2882111 , -0.28964576,\n",
+       "                       0.29340708,  0.2927634 ],\n",
+       "                     [-0.3411081 ,  0.35220957,  0.33591127,  0.3540816 ,  0.3503263 ,\n",
+       "                       0.33048216, -0.34637055,  0.32407367, -0.32438353,  0.3529602 ,\n",
+       "                      -0.35776407, -0.33932883],\n",
+       "                     [-0.37032467, -0.36812896, -0.39068243, -0.37287602, -0.3721401 ,\n",
+       "                      -0.38354024, -0.3734055 ,  0.4030942 ,  0.37940052,  0.34137526,\n",
+       "                       0.3707558 , -0.3911879 ],\n",
+       "                     [-0.13885868, -0.07073349, -0.1152356 ,  0.11311065,  0.05461643,\n",
+       "                      -0.10694173, -0.11797076, -0.11336335, -0.10334926,  0.07756246,\n",
+       "                       0.12306441,  0.10861646],\n",
+       "                     [ 0.37422347, -0.37067974,  0.382464  ,  0.37082633, -0.37619328,\n",
+       "                       0.3700374 , -0.3775079 ,  0.369756  , -0.37618253,  0.3672613 ,\n",
+       "                       0.39667937,  0.38020003],\n",
+       "                     [ 0.30904633, -0.29189512, -0.31334987, -0.29167944, -0.31405964,\n",
+       "                      -0.28898612,  0.2923434 ,  0.30766192, -0.28573954,  0.2949249 ,\n",
+       "                      -0.29706052, -0.31455588],\n",
+       "                     [-0.1166977 , -0.09267767, -0.05344103,  0.20561723,  0.10361944,\n",
+       "                      -0.09597252, -0.11368804,  0.07374494,  0.0895981 ,  0.07990894,\n",
+       "                       0.10973554, -0.05313613]], dtype=float32)>\n",
+       "              (r_s_bias): <tf.Variable 'transformer/layer_._0/rel_attn/r_s_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "              array([[0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.]], dtype=float32)>\n",
+       "              (r_w_bias): <tf.Variable 'transformer/layer_._0/rel_attn/r_w_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "              array([[ 0.02704959,  0.02960145,  0.00974695,  0.04531549, -0.0031658 ,\n",
+       "                       0.00470249,  0.01819921,  0.01747902, -0.01848036,  0.01552903,\n",
+       "                      -0.01393487, -0.01188555],\n",
+       "                     [ 0.01097695,  0.05780909,  0.03655621, -0.02134515,  0.02434413,\n",
+       "                       0.01866677,  0.01949622, -0.01921584, -0.02902889, -0.03096105,\n",
+       "                      -0.00388369, -0.01727411],\n",
+       "                     [-0.13681485,  0.12220031,  0.07949183,  0.09230855,  0.1203526 ,\n",
+       "                       0.13126956,  0.00737103,  0.04044032,  0.13264242,  0.16051207,\n",
+       "                       0.12056144, -0.15448172],\n",
+       "                     [-0.0837023 , -0.07897114,  0.10445868,  0.09328368,  0.09781563,\n",
+       "                      -0.07505805, -0.07814854, -0.10116591,  0.11434007,  0.1039658 ,\n",
+       "                      -0.11767636, -0.10332035],\n",
+       "                     [-0.10378645,  0.07673589, -0.09991188,  0.09477323,  0.06950181,\n",
+       "                      -0.09498238,  0.11595728,  0.0818167 ,  0.09139769,  0.0908348 ,\n",
+       "                       0.09375099,  0.09006778],\n",
+       "                     [-0.07200488,  0.11039345,  0.08926661, -0.10429743,  0.10531338,\n",
+       "                      -0.13036886, -0.09732608, -0.09588756,  0.10691873,  0.069135  ,\n",
+       "                      -0.07627007, -0.09407212],\n",
+       "                     [-0.06730818,  0.0776398 , -0.07527994, -0.08677673, -0.07946926,\n",
+       "                      -0.09474014,  0.08316637, -0.10570373, -0.10657622,  0.06857269,\n",
+       "                      -0.09510182, -0.07508499],\n",
+       "                     [ 0.1272688 , -0.11871098,  0.11859486,  0.12073346,  0.15111545,\n",
+       "                       0.12950963,  0.14462966,  0.13155784,  0.14078899, -0.11819407,\n",
+       "                      -0.11242524, -0.12828752],\n",
+       "                     [ 0.10244546, -0.08281285,  0.12599547,  0.12352646, -0.08232223,\n",
+       "                       0.06362368,  0.11628054,  0.08121345, -0.09381401, -0.1017275 ,\n",
+       "                       0.1122688 , -0.0936246 ],\n",
+       "                     [ 0.06956902, -0.07016854,  0.07207846,  0.08185235,  0.07348476,\n",
+       "                      -0.07044141, -0.10483667, -0.06724312, -0.07413901, -0.08150072,\n",
+       "                       0.08842966,  0.07842822],\n",
+       "                     [-0.04902898,  0.08947049,  0.08037989,  0.06807387,  0.06831039,\n",
+       "                       0.05044439, -0.10449897,  0.05752584, -0.07764029,  0.09782408,\n",
+       "                      -0.11914786, -0.05327021],\n",
+       "                     [-0.12178728, -0.11973495, -0.08931118, -0.11802942, -0.12639539,\n",
+       "                      -0.11765701, -0.12301757,  0.09002702,  0.1099894 ,  0.10601277,\n",
+       "                       0.12055498, -0.11824764],\n",
+       "                     [-0.13013272, -0.11347592, -0.09590119, -0.04600147,  0.12135155,\n",
+       "                       0.15605357,  0.14212345,  0.12413304, -0.11489878,  0.10646964,\n",
+       "                       0.11570179,  0.13300925],\n",
+       "                     [ 0.07953635, -0.05358617,  0.06076136,  0.03857687, -0.08740384,\n",
+       "                       0.09580573, -0.11589228,  0.0530813 , -0.1262951 ,  0.12957394,\n",
+       "                       0.14165434,  0.07234689],\n",
+       "                     [ 0.00606865, -0.02865283, -0.11514653, -0.03855786, -0.03915163,\n",
+       "                      -0.04437567,  0.05897851,  0.07263748, -0.07599041,  0.02014523,\n",
+       "                      -0.0326612 , -0.05191225],\n",
+       "                     [-0.02615956,  0.00082458,  0.02219692, -0.05171375,  0.05447492,\n",
+       "                       0.06622541, -0.02247809,  0.05879986,  0.01587608,  0.09542776,\n",
+       "                       0.03455094,  0.00630618]], dtype=float32)>\n",
+       "              (seg_embed): <tf.Variable 'transformer/layer_._0/rel_attn/seg_embed:0' shape=(2, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[ 6.92830980e-03, -1.91756096e-02,  2.75568711e-03,\n",
+       "                       -3.27806338e-03,  1.43940898e-03,  8.38105334e-04,\n",
+       "                       -3.17075802e-03,  4.66949260e-03,  1.29533000e-02,\n",
+       "                        6.37105154e-03, -1.42557546e-02, -1.56039307e-02],\n",
+       "                      [-5.24008507e-03,  5.83554897e-03,  5.28278288e-05,\n",
+       "                        4.41452535e-03, -5.96833415e-03,  1.97377801e-02,\n",
+       "                        6.63386192e-03, -2.70113046e-03, -1.09323701e-02,\n",
+       "                        9.40765906e-03,  8.52212869e-03,  1.27732707e-02],\n",
+       "                      [-5.47951926e-03, -6.30398374e-03, -1.88931415e-03,\n",
+       "                       -3.82627477e-03, -1.03170695e-02, -1.62921418e-02,\n",
+       "                        4.42750810e-04,  1.83049624e-03, -4.93631791e-03,\n",
+       "                        7.21302396e-03,  7.58891134e-03, -1.35076218e-04],\n",
+       "                      [-5.04115736e-03,  1.51219219e-03, -6.07239781e-04,\n",
+       "                        2.68661021e-03, -5.32567082e-03, -3.63681372e-03,\n",
+       "                       -1.47937634e-03,  1.41145978e-02,  2.44664983e-03,\n",
+       "                       -5.30580198e-03, -3.58004036e-04,  2.21235352e-03],\n",
+       "                      [ 6.63177948e-03,  7.20981602e-03, -3.34927929e-03,\n",
+       "                        1.57867242e-02, -1.06790895e-02,  4.76629054e-03,\n",
+       "                        7.01094558e-03,  2.55558966e-03,  7.01530662e-04,\n",
+       "                        1.96129885e-02, -3.47580039e-03, -4.14459547e-03],\n",
+       "                      [ 6.63608173e-03,  8.13847221e-03,  1.26328748e-02,\n",
+       "                        2.93742679e-03, -1.11131268e-02, -7.77325965e-03,\n",
+       "                       -4.69116308e-03,  5.06164553e-03,  3.31703736e-03,\n",
+       "                       -1.49551462e-02,  9.83483810e-03, -1.38381887e-02],\n",
+       "                      [-3.13207647e-03, -1.20346656e-03, -7.14240829e-04,\n",
+       "                        3.38257337e-03, -1.21155549e-02,  1.77355520e-02,\n",
+       "                       -3.78817786e-03,  4.60852869e-03,  1.38352753e-03,\n",
+       "                       -1.96225918e-03, -1.54525228e-03,  7.27207214e-03],\n",
+       "                      [-3.52438586e-03, -6.73636142e-03,  5.56267146e-03,\n",
+       "                        2.76904181e-03,  6.09423034e-03,  1.14140250e-02,\n",
+       "                        4.51555708e-03, -4.84374259e-03, -1.83317550e-02,\n",
+       "                        4.07868624e-03, -3.52122728e-03, -9.72320139e-03],\n",
+       "                      [-2.92871613e-03, -1.36275403e-03, -1.12001523e-02,\n",
+       "                        4.15648054e-03,  7.76014291e-04, -1.56104667e-04,\n",
+       "                        1.66957453e-02, -1.34978080e-02,  2.59425724e-03,\n",
+       "                        1.50437718e-02, -8.85847863e-03, -2.27058597e-04],\n",
+       "                      [-8.55377130e-03, -9.33228992e-04,  1.05962288e-02,\n",
+       "                        3.73685732e-03, -1.46479104e-02, -2.58295774e-03,\n",
+       "                       -3.21662426e-03,  8.22018459e-03, -6.62432238e-03,\n",
+       "                        5.34095289e-03, -1.60596147e-02,  1.89380813e-02],\n",
+       "                      [-3.03876121e-03, -9.45069920e-03, -1.05521297e-02,\n",
+       "                        7.64022162e-03,  1.24902911e-02,  1.32637294e-02,\n",
+       "                        1.30019896e-02,  4.11059591e-04,  1.14952738e-03,\n",
+       "                       -9.66892054e-04,  3.42015829e-03,  1.51099060e-02],\n",
+       "                      [ 9.67782363e-03,  1.13166841e-02,  1.24215791e-02,\n",
+       "                       -8.93799961e-03, -7.70286610e-03, -2.62288231e-04,\n",
+       "                       -1.25799067e-02, -2.34622974e-03, -1.37031516e-02,\n",
+       "                        7.25830998e-03,  3.48036946e-03,  8.82094260e-03],\n",
+       "                      [ 1.93330422e-02,  1.02664595e-02, -1.38892382e-02,\n",
+       "                       -4.28191572e-03, -1.71063491e-03,  2.99980305e-03,\n",
+       "                       -5.98835619e-03,  1.08044026e-02, -7.76272779e-03,\n",
+       "                       -8.02671071e-04,  6.56242890e-04,  5.36549371e-03],\n",
+       "                      [-1.00181112e-02, -1.59210637e-02, -8.38838704e-03,\n",
+       "                        4.86764265e-03, -1.79222059e-02,  3.47048254e-03,\n",
+       "                       -1.83304548e-02, -4.92845010e-03,  3.65043571e-03,\n",
+       "                        2.54237023e-03, -1.38753336e-02, -1.58153474e-02],\n",
+       "                      [-8.56178463e-04,  9.56560671e-03,  1.43071841e-02,\n",
+       "                        1.44142760e-02, -2.97402544e-03, -1.18832442e-03,\n",
+       "                        1.54865775e-02,  1.16390940e-02,  1.89097952e-02,\n",
+       "                       -1.21177221e-03, -1.57084243e-04,  1.07376613e-02],\n",
+       "                      [-1.82367454e-03,  2.21159682e-03, -3.59512377e-03,\n",
+       "                       -8.40761815e-04,  1.32178674e-02,  1.82569642e-02,\n",
+       "                       -6.03301101e-04, -5.30507276e-03,  1.09237980e-03,\n",
+       "                        1.43965418e-02, -8.32139887e-03,  4.34310501e-03]],\n",
+       "              \n",
+       "                     [[ 6.01352192e-03,  1.62515126e-03, -8.11410509e-03,\n",
+       "                       -6.86854636e-03, -6.21954072e-03, -1.00534027e-02,\n",
+       "                       -9.41478554e-03,  1.14045916e-02, -8.45357031e-03,\n",
+       "                       -2.07757368e-03, -1.37391184e-02, -4.38201270e-04],\n",
+       "                      [ 1.43431686e-02,  9.54034738e-03, -5.74651361e-03,\n",
+       "                        1.66568439e-04, -9.06508230e-03,  1.37667237e-02,\n",
+       "                        5.70776733e-03,  7.25450320e-03,  2.16021363e-05,\n",
+       "                       -5.47146471e-03, -6.25970587e-03, -3.44276486e-05],\n",
+       "                      [ 1.48183517e-02, -6.20869081e-03,  8.95625539e-03,\n",
+       "                       -9.27595049e-03, -1.83574425e-03,  2.49610422e-03,\n",
+       "                       -1.22964820e-02, -1.36222802e-02,  9.96832177e-03,\n",
+       "                       -1.19066276e-02, -7.85201322e-03, -7.36650918e-03],\n",
+       "                      [ 1.08605931e-02,  8.69748648e-03,  3.17076640e-03,\n",
+       "                       -8.42709839e-03, -1.57119669e-02, -1.40998634e-02,\n",
+       "                       -1.92577229e-03, -1.10639585e-02,  2.97422521e-03,\n",
+       "                       -1.15742059e-02,  1.63778535e-03,  9.25154146e-03],\n",
+       "                      [-4.83186170e-03, -1.48528756e-03, -6.04805397e-03,\n",
+       "                       -3.92264035e-03, -1.23623861e-02, -1.09437210e-02,\n",
+       "                       -1.96897378e-03, -6.39349746e-04,  4.56422335e-03,\n",
+       "                        1.13997767e-02,  4.75200778e-03,  7.35366624e-03],\n",
+       "                      [ 1.12166035e-03,  5.45477308e-03, -4.32490138e-03,\n",
+       "                        7.68110855e-03,  5.26575372e-04, -1.25714159e-02,\n",
+       "                       -3.77588673e-03, -1.14904623e-02,  5.39455842e-03,\n",
+       "                       -4.17162431e-03, -9.63759050e-03,  6.98206900e-03],\n",
+       "                      [ 1.96407139e-02,  1.29522821e-02, -4.13262704e-03,\n",
+       "                       -1.44496374e-02, -1.74691656e-03,  4.20865184e-03,\n",
+       "                       -1.11074317e-02,  2.64025060e-03,  1.47657096e-02,\n",
+       "                        1.23877609e-02, -2.37396988e-03, -2.93945603e-04],\n",
+       "                      [ 9.71211493e-03,  7.94302672e-03, -1.58977136e-02,\n",
+       "                       -2.76799593e-03, -5.05202217e-03, -9.76024102e-03,\n",
+       "                        1.49224671e-02, -2.76487437e-03, -7.95385893e-03,\n",
+       "                        2.28416151e-03,  8.62033758e-03, -8.03585071e-03],\n",
+       "                      [ 3.58456396e-03, -7.30898371e-03,  9.81163792e-03,\n",
+       "                        4.00693668e-03, -4.60821064e-03,  1.25033129e-02,\n",
+       "                       -7.10477680e-03, -1.87209854e-03, -1.86083149e-02,\n",
+       "                        1.13955196e-02,  3.02036270e-03,  1.86788588e-04],\n",
+       "                      [-7.39630545e-03, -3.24555533e-03, -6.80431770e-03,\n",
+       "                       -8.48817732e-03,  5.44536347e-03, -6.96611451e-03,\n",
+       "                        9.67375468e-03, -1.37550682e-02,  1.24195861e-02,\n",
+       "                       -5.80661930e-03, -8.72546516e-04, -7.87189323e-03],\n",
+       "                      [ 8.17328412e-03,  7.39035569e-03, -1.30875167e-02,\n",
+       "                        2.98461039e-03,  6.12607226e-03, -3.95844551e-03,\n",
+       "                       -4.27940721e-03, -5.09019941e-03,  9.36426129e-03,\n",
+       "                        2.17008332e-04,  9.72903217e-05,  1.09658763e-03],\n",
+       "                      [-2.05476675e-03, -6.83139719e-04, -1.89697009e-03,\n",
+       "                        1.14962943e-02,  7.20423460e-03,  1.39946323e-02,\n",
+       "                        1.07048582e-02, -6.42856723e-03, -5.79423131e-03,\n",
+       "                        1.23832189e-02, -7.18865078e-03,  1.38154672e-02],\n",
+       "                      [-1.16244173e-02,  2.05547106e-03,  9.67404339e-03,\n",
+       "                       -2.89262226e-03,  4.12624609e-03, -5.93587151e-03,\n",
+       "                       -2.06840690e-03, -3.01017077e-03, -2.76456797e-03,\n",
+       "                        1.60607956e-02,  6.62347884e-04,  8.47559713e-04],\n",
+       "                      [-1.70180527e-03,  1.20092779e-02,  1.39846858e-02,\n",
+       "                        1.87645629e-02,  3.60628217e-03, -1.03077693e-02,\n",
+       "                       -3.90187866e-04,  7.14913337e-03, -1.36780804e-02,\n",
+       "                        5.78043377e-03, -6.81782607e-03,  1.98236643e-03],\n",
+       "                      [-1.06942744e-05,  8.62054899e-03,  1.27580739e-03,\n",
+       "                        1.30051170e-02,  9.38100927e-03,  1.04769599e-02,\n",
+       "                       -1.51592251e-02,  4.45883907e-03, -2.48641265e-03,\n",
+       "                       -9.80575942e-03, -1.38305919e-03,  7.01086072e-04],\n",
+       "                      [-1.26606720e-02, -3.34550929e-03,  7.17817014e-03,\n",
+       "                       -5.29674813e-03, -5.15649887e-03,  1.82109885e-02,\n",
+       "                       -1.07203387e-02, -1.93532417e-03,  1.92708708e-02,\n",
+       "                       -2.18898524e-03, -1.15341763e-03,  5.27428696e-03]]],\n",
+       "                    dtype=float32)>\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "            (ff): TFXLNetFeedForward(\n",
+       "              (layer_norm): LayerNormalization(\n",
+       "                (axis): List(\n",
+       "                  (0): 2\n",
+       "                )\n",
+       "                (gamma): <tf.Variable 'transformer/layer_._0/ff/layer_norm/gamma:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([1.0379136 , 1.0441794 , 1.0282985 , 1.0300299 , 1.0497706 ,\n",
+       "                       1.0531958 , 1.0634363 , 1.0370939 , 0.97006977, 1.0404468 ,\n",
+       "                       1.0234414 , 1.0444169 , 1.016389  , 1.0636438 , 1.0183308 ,\n",
+       "                       1.0163523 , 1.0237935 , 1.0102572 , 1.017104  , 1.0147494 ,\n",
+       "                       0.99349844, 1.0893013 , 1.0604361 , 1.0118674 , 0.9946299 ,\n",
+       "                       1.0589231 , 0.96908444, 1.0519881 , 1.0418249 , 1.0343268 ,\n",
+       "                       1.0077153 , 1.0598058 , 1.0031377 , 1.0132179 , 1.0564682 ,\n",
+       "                       1.041158  , 1.0136855 , 1.0441773 , 1.0054435 , 1.0305686 ,\n",
+       "                       1.0372981 , 1.0551254 , 1.0419368 , 1.0237669 , 1.0648608 ,\n",
+       "                       0.9859887 , 1.0432713 , 0.992015  , 1.1081674 , 1.025258  ,\n",
+       "                       1.0640073 , 0.9919767 , 1.037432  , 1.045794  , 1.0330951 ,\n",
+       "                       1.0092527 , 1.0409127 , 1.0085353 , 1.0442319 , 0.99454325,\n",
+       "                       1.0313554 , 0.9998184 , 1.0338147 , 1.0133076 , 1.0005473 ,\n",
+       "                       1.0445073 , 0.9953769 , 1.0483619 , 1.0318505 , 1.0313379 ,\n",
+       "                       1.0211383 , 1.0175071 , 1.0427523 , 1.0183996 , 0.9728469 ,\n",
+       "                       1.0114137 , 1.0472678 , 1.0251293 , 0.9770746 , 0.9970426 ,\n",
+       "                       1.0212427 , 0.98568845, 1.0427203 , 1.0072767 , 1.0269111 ,\n",
+       "                       1.0186119 , 1.0205765 , 1.0080137 , 1.0402783 , 1.0055327 ,\n",
+       "                       1.0263197 , 1.011762  , 0.9943807 , 0.97362155, 1.0212238 ,\n",
+       "                       1.0551015 , 1.0413436 , 1.0225371 , 1.023914  , 1.0239075 ,\n",
+       "                       1.0248226 , 1.003032  , 1.0068135 , 1.0337843 , 1.0179108 ,\n",
+       "                       1.0402795 , 1.0472751 , 1.0388597 , 1.0047336 , 1.0077493 ,\n",
+       "                       1.0392822 , 1.0628049 , 1.0116792 , 1.0418272 , 1.0172741 ,\n",
+       "                       1.0869482 , 1.0238012 , 1.0404757 , 1.020196  , 1.0563034 ,\n",
+       "                       1.0301741 , 1.0372742 , 1.0494779 , 1.0387503 , 1.0062817 ,\n",
+       "                       1.036887  , 1.0277052 , 1.0019801 , 1.0326486 , 1.0132165 ,\n",
+       "                       1.0250734 , 1.0243207 , 1.0353926 , 1.0375448 , 1.0284371 ,\n",
+       "                       1.0279876 , 0.99319714, 1.0211086 , 1.0743738 , 1.0147293 ,\n",
+       "                       1.0403458 , 1.0320364 , 1.0163448 , 1.0086402 , 1.0668328 ,\n",
+       "                       0.9998712 , 1.0195384 , 1.0262363 , 1.0496252 , 1.0281852 ,\n",
+       "                       1.0143824 , 1.0131371 , 1.0147458 , 1.0153939 , 1.002428  ,\n",
+       "                       1.056508  , 1.0375637 , 1.0288135 , 1.0562717 , 1.0206257 ,\n",
+       "                       1.0170466 , 1.0470344 , 1.002945  , 1.0293034 , 1.0338373 ,\n",
+       "                       1.0267545 , 1.0173984 , 1.0321118 , 1.0058153 , 0.9890631 ,\n",
+       "                       1.0418366 , 1.0471084 , 1.000789  , 1.0489752 , 1.011835  ,\n",
+       "                       0.9849616 , 1.0682111 , 1.067782  , 1.0667943 , 1.0295328 ,\n",
+       "                       1.0648719 , 1.0072024 , 0.9829486 , 1.0619706 , 1.0037473 ,\n",
+       "                       1.082172  , 1.010111  , 1.0480627 , 1.0180742 , 0.9671146 ,\n",
+       "                       1.0334889 , 1.0734522 ], dtype=float32)>\n",
+       "                (beta): <tf.Variable 'transformer/layer_._0/ff/layer_norm/beta:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([-0.03437203,  0.05411717, -0.00093422,  0.07425429,  0.00736092,\n",
+       "                        0.11286709,  0.08217093,  0.10122769, -0.00846282,  0.07157344,\n",
+       "                       -0.05813284,  0.0454649 ,  0.02636049,  0.01231122, -0.01111093,\n",
+       "                        0.02166114, -0.00972567,  0.04515434, -0.02430212, -0.06187151,\n",
+       "                       -0.0381984 ,  0.12061298,  0.03548988,  0.04389787,  0.01137476,\n",
+       "                       -0.01380202, -0.01825755,  0.05156202, -0.07114236, -0.06216979,\n",
+       "                        0.05545609, -0.10842778, -0.02432374, -0.0060093 ,  0.03022136,\n",
+       "                       -0.00703949, -0.05032122,  0.03701846,  0.09063955,  0.0639187 ,\n",
+       "                       -0.06332532,  0.01021036, -0.01898221, -0.04602299,  0.0845482 ,\n",
+       "                        0.05272847,  0.04152165,  0.01572024,  0.0124438 ,  0.05633397,\n",
+       "                        0.04072688, -0.03248957,  0.01956263, -0.0594047 ,  0.10126687,\n",
+       "                        0.00997925, -0.03006562, -0.04982569, -0.01702003, -0.02220715,\n",
+       "                        0.0006759 , -0.00147267,  0.04309494, -0.02025459,  0.00237669,\n",
+       "                       -0.06119434,  0.06299283, -0.06787321, -0.04963538, -0.0285508 ,\n",
+       "                       -0.02115064, -0.10439228, -0.06280854, -0.02150689, -0.0087407 ,\n",
+       "                       -0.01133496, -0.05820064, -0.08399351, -0.00220406, -0.05374147,\n",
+       "                       -0.0084166 ,  0.02683506,  0.04995831, -0.04991116,  0.07378334,\n",
+       "                        0.08771855,  0.03559894,  0.04174837,  0.04986992, -0.07031458,\n",
+       "                       -0.04099566, -0.04586393, -0.04894676,  0.0452544 , -0.02901545,\n",
+       "                       -0.10887094, -0.06665391,  0.03176153, -0.07640473, -0.03704071,\n",
+       "                       -0.04572297,  0.04151303,  0.01618064,  0.05201699, -0.00598239,\n",
+       "                        0.00666859,  0.08898568,  0.04584971,  0.0312804 , -0.03132866,\n",
+       "                       -0.0066317 , -0.08492738, -0.01431052, -0.00116769,  0.02063407,\n",
+       "                        0.01227299,  0.0105425 ,  0.08164899, -0.07966555, -0.04573595,\n",
+       "                       -0.01493629, -0.06341923, -0.04441991,  0.0393707 , -0.07018486,\n",
+       "                        0.07571896,  0.01216909, -0.00044978, -0.03057809,  0.0612355 ,\n",
+       "                        0.00077983, -0.05563807, -0.10079593, -0.02951942,  0.08499622,\n",
+       "                        0.05386762, -0.06173644,  0.02608804,  0.03443969, -0.09064186,\n",
+       "                        0.0389196 , -0.07017983, -0.07173447, -0.03408198, -0.14056338,\n",
+       "                        0.01628569,  0.0268622 , -0.02475309, -0.01677444,  0.09604827,\n",
+       "                        0.02439231, -0.07903947, -0.01104342,  0.03859695,  0.00089456,\n",
+       "                       -0.00089233, -0.01680246,  0.04352787, -0.06731002, -0.02855014,\n",
+       "                        0.01585025,  0.08303126, -0.00780854,  0.01587816,  0.03930783,\n",
+       "                       -0.00718552, -0.04818885,  0.06294682,  0.02472097,  0.05720899,\n",
+       "                       -0.05400939, -0.12929952,  0.0696051 , -0.07063247,  0.02118118,\n",
+       "                        0.01647286, -0.05759468,  0.02665047, -0.00792585,  0.02348289,\n",
+       "                       -0.06724691,  0.04548252, -0.00882383,  0.02862583, -0.01595174,\n",
+       "                        0.01586641,  0.05275662, -0.05550243,  0.0463598 ,  0.02981136,\n",
+       "                       -0.02164674,  0.01641086], dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (layer_1): Dense(\n",
+       "                768, activation=linear, use_bias=True\n",
+       "                (kernel): <tf.Variable 'transformer/layer_._0/ff/layer_1/kernel:0' shape=(192, 768) dtype=float32, numpy=\n",
+       "                array([[-8.7349433e-03,  1.4380505e-02, -1.8403217e-02, ...,\n",
+       "                        -1.0560994e-02, -9.8247221e-03,  3.8896156e-03],\n",
+       "                       [ 1.9794539e-02,  1.9119913e-02,  1.4701257e-03, ...,\n",
+       "                        -4.6915929e-03, -3.0279700e-03, -1.0369797e-02],\n",
+       "                       [ 2.2685794e-02, -1.1076587e-02,  2.1512689e-02, ...,\n",
+       "                        -9.3838237e-03, -1.5814094e-02,  1.2654760e-02],\n",
+       "                       ...,\n",
+       "                       [ 3.3880837e-02,  3.2771707e-02, -1.5241621e-02, ...,\n",
+       "                        -1.8954782e-02,  9.0328557e-03, -3.8368767e-03],\n",
+       "                       [ 3.4973539e-02,  7.7871266e-03, -1.2202458e-03, ...,\n",
+       "                        -1.1511138e-03, -6.7377505e-03,  1.4305637e-02],\n",
+       "                       [-5.9016286e-03,  3.0963784e-05,  4.6348446e-03, ...,\n",
+       "                        -9.7331330e-03, -9.1186212e-03, -4.0696082e-03]], dtype=float32)>\n",
+       "                (bias): <tf.Variable 'transformer/layer_._0/ff/layer_1/bias:0' shape=(768,) dtype=float32, numpy=\n",
+       "                array([-2.48988252e-03,  6.58203196e-03,  2.64750496e-02, -9.87772923e-03,\n",
+       "                        2.49165483e-02, -1.96873536e-03,  1.37765594e-02,  7.72468513e-03,\n",
+       "                       -1.52863916e-02, -3.80107411e-03, -1.07600829e-02,  3.38745862e-03,\n",
+       "                        1.53273325e-02, -1.19882887e-02,  5.40436618e-03,  2.19404721e-03,\n",
+       "                        2.60363892e-03,  4.26220242e-03,  2.08184868e-02,  1.22082443e-03,\n",
+       "                        1.71658359e-02,  1.61883030e-02, -1.14635089e-02,  5.40121691e-03,\n",
+       "                        5.44373458e-03,  1.77889038e-02, -5.69844851e-03,  3.11289355e-03,\n",
+       "                        1.31086144e-03, -2.80178571e-03, -3.88765195e-03, -7.58470781e-03,\n",
+       "                        1.36907427e-02,  6.45675417e-03,  2.65116412e-02,  1.58387870e-02,\n",
+       "                        1.02622213e-03,  8.93147197e-03,  2.47938349e-03, -1.99125968e-02,\n",
+       "                        2.70253327e-03, -8.58191773e-03,  1.80017427e-02,  7.24463165e-03,\n",
+       "                        9.56831127e-03,  2.74193045e-02,  1.74996982e-04, -7.05160759e-03,\n",
+       "                        2.38953568e-02,  6.30728249e-03,  2.40837168e-02,  2.80947471e-03,\n",
+       "                       -3.53719312e-04,  9.57346521e-03,  8.25208705e-03, -7.29673402e-03,\n",
+       "                       -1.38636009e-04,  4.73524723e-03,  1.45125119e-02, -1.18843932e-02,\n",
+       "                        2.11451408e-02,  2.68677399e-02,  6.18341239e-03, -6.16480596e-03,\n",
+       "                        8.34112335e-03,  4.47013066e-04, -3.05860024e-03, -9.32345074e-03,\n",
+       "                       -2.02798527e-02,  4.69490094e-03, -1.61361136e-02,  4.10681684e-03,\n",
+       "                        1.28482804e-02,  4.03247820e-03,  9.11187287e-03,  1.24189295e-02,\n",
+       "                        1.27137732e-02,  1.99195351e-02,  1.41281942e-02,  1.55547783e-02,\n",
+       "                       -1.07247783e-02,  7.05646677e-03, -1.81599881e-03,  9.94427502e-03,\n",
+       "                       -1.99749079e-02,  1.62800290e-02, -2.43168436e-02, -5.13213966e-03,\n",
+       "                        2.00566128e-02,  2.97278585e-03, -7.79949501e-03,  5.56347473e-03,\n",
+       "                        7.97226559e-03,  1.98900197e-02,  1.38633540e-02, -6.45546895e-03,\n",
+       "                        1.38269775e-02, -4.40548221e-03,  8.96899216e-03, -9.38130263e-03,\n",
+       "                       -5.15380700e-04, -2.41116602e-02,  1.52957542e-02,  1.24769453e-02,\n",
+       "                        6.28790632e-03,  5.41381445e-03,  8.18936341e-03,  1.51892807e-02,\n",
+       "                        1.11203482e-02, -4.50899825e-03, -1.44061493e-02, -2.26674285e-02,\n",
+       "                        3.10106426e-02,  2.14485563e-02,  1.03145291e-03,  1.03755528e-03,\n",
+       "                       -6.20614132e-03, -1.09666409e-02,  8.96500424e-03,  4.80830902e-03,\n",
+       "                       -7.33030727e-03,  6.25240244e-03, -9.21320729e-03,  6.77359942e-03,\n",
+       "                       -5.92142157e-03,  7.07151927e-03, -1.22634443e-02,  7.56111601e-03,\n",
+       "                        1.75033621e-02,  3.66673758e-03, -1.09480824e-02, -2.01308820e-03,\n",
+       "                       -5.92470681e-03,  2.63545513e-02,  1.99394524e-02, -4.43834206e-03,\n",
+       "                       -1.58517994e-02,  8.09705444e-03,  2.51221992e-02,  4.07058606e-03,\n",
+       "                        6.50535512e-04,  1.90216992e-02,  3.51213152e-03,  2.78372392e-02,\n",
+       "                        7.65756797e-03, -1.04906233e-02,  3.58949192e-02,  3.21657956e-02,\n",
+       "                        2.03288458e-02,  1.17718976e-03, -9.83388349e-03,  1.01774065e-02,\n",
+       "                        2.34259386e-02,  4.87414235e-03,  6.19397615e-04, -4.87850979e-03,\n",
+       "                        6.10528141e-03,  1.96777973e-02, -4.79804678e-03,  3.20185535e-03,\n",
+       "                        1.08724358e-02,  2.48679845e-03,  1.04768435e-02,  1.50508005e-02,\n",
+       "                       -2.04404313e-02,  8.93356372e-03,  3.47434171e-03,  5.11971477e-04,\n",
+       "                        1.05784240e-03,  1.37281520e-02, -1.45734590e-03,  2.07192767e-02,\n",
+       "                        4.55050357e-03,  1.93968341e-02, -6.62009744e-03, -1.97455566e-02,\n",
+       "                       -9.91699193e-03,  9.87284351e-03, -1.31387112e-03,  7.16593955e-03,\n",
+       "                        5.01987198e-03, -3.20331450e-03,  7.43561145e-03, -4.62228339e-03,\n",
+       "                        2.19815858e-02, -7.85590988e-03, -7.33769266e-03,  3.23284529e-02,\n",
+       "                        1.56302769e-02, -6.01055566e-03, -1.79425776e-02,  4.41427436e-03,\n",
+       "                       -2.07814388e-02, -6.37243548e-03, -2.83799577e-03,  5.25688939e-03,\n",
+       "                       -8.77550617e-03,  2.46067587e-02,  1.07153840e-02, -1.32179158e-02,\n",
+       "                        2.18793386e-04,  4.08930471e-03,  8.53821915e-03, -1.09368330e-02,\n",
+       "                        3.37619870e-03, -1.35646742e-02,  7.72237452e-03,  1.29408129e-02,\n",
+       "                       -1.53529420e-02, -9.28624719e-03, -1.21006239e-02,  1.54590970e-02,\n",
+       "                        2.16401205e-03,  1.04791895e-02,  5.56073198e-03,  1.37728415e-02,\n",
+       "                        1.07720145e-04,  5.28109539e-03,  1.08795706e-02, -2.47379648e-04,\n",
+       "                        3.11144930e-03, -5.73526463e-03, -5.40194986e-03,  3.43680102e-03,\n",
+       "                        6.36896258e-03,  7.28031015e-03, -7.98167568e-03,  1.46586786e-03,\n",
+       "                       -4.85271215e-03, -4.15298855e-03, -6.27090875e-03,  1.09038770e-03,\n",
+       "                        8.43349565e-03,  2.42243428e-02,  9.21734143e-03,  5.99709572e-03,\n",
+       "                        2.16714274e-02,  4.89401957e-03,  6.89816754e-03,  2.22890708e-03,\n",
+       "                        1.38756193e-04, -7.83765409e-03, -2.66516721e-03,  1.58686489e-02,\n",
+       "                        2.09250636e-02,  3.43082286e-03,  1.25900293e-02,  1.66601446e-02,\n",
+       "                        9.77085717e-03, -1.23784819e-03,  1.31846191e-02, -3.35601717e-03,\n",
+       "                        4.42687795e-03,  2.11218297e-02, -5.38641028e-03,  8.89543328e-04,\n",
+       "                        2.86574606e-02,  1.23174144e-02, -1.08364336e-02,  3.73017695e-03,\n",
+       "                       -2.47203764e-02, -4.73329565e-03,  1.31655764e-02, -6.27630530e-03,\n",
+       "                       -7.01956218e-03, -8.57002940e-03, -8.32860358e-03,  1.99239105e-02,\n",
+       "                       -4.52243630e-03,  2.18442213e-02,  2.81916582e-03,  1.94954555e-02,\n",
+       "                        1.47216879e-02,  1.14483749e-02,  9.50219017e-03,  1.93981547e-02,\n",
+       "                        1.98315759e-03,  1.17658265e-03,  8.65733624e-03, -3.82895139e-03,\n",
+       "                       -1.39406975e-02, -2.18565037e-04, -1.54521847e-02,  2.31004003e-02,\n",
+       "                       -1.43806655e-02,  1.07183242e-02, -4.23687370e-03, -8.43816437e-03,\n",
+       "                        9.99713037e-03,  1.01488354e-02,  4.36592521e-03,  4.06254223e-03,\n",
+       "                       -2.29024841e-03,  7.33671652e-04, -3.99773149e-03, -5.26233064e-03,\n",
+       "                       -5.51322009e-04,  1.99180748e-03,  2.11210479e-03, -1.47964270e-03,\n",
+       "                        1.85694620e-02, -7.09511619e-03,  1.37091307e-02,  1.77404413e-03,\n",
+       "                        3.04236803e-02,  1.63651221e-02,  1.01921558e-02,  2.87520438e-02,\n",
+       "                       -1.26408609e-02,  2.02455334e-02, -2.59257131e-03,  1.92524418e-02,\n",
+       "                       -1.05007098e-03,  8.00876645e-04, -1.07963514e-02, -1.00983009e-02,\n",
+       "                        3.39633483e-03, -5.70922857e-03,  2.50644069e-02,  1.06100654e-02,\n",
+       "                        7.89651275e-03,  9.92713869e-03, -4.23942460e-03,  8.36806651e-03,\n",
+       "                        1.46544278e-02,  9.03321337e-03, -1.24921696e-02, -4.23613749e-03,\n",
+       "                        8.12342390e-03,  2.61031408e-02,  8.26149434e-03,  1.93422493e-02,\n",
+       "                        1.59315765e-02,  4.34346450e-03, -1.92503165e-02,  7.93095399e-03,\n",
+       "                       -1.98308267e-02,  2.23907847e-02,  6.30652346e-03, -1.34924352e-02,\n",
+       "                       -7.86772370e-03,  2.03298517e-02,  1.62668228e-02,  8.84508621e-03,\n",
+       "                        1.78096499e-02,  1.08726043e-02,  9.57162119e-03,  1.47212772e-02,\n",
+       "                        2.21935660e-02, -1.45868107e-03, -8.12897284e-04, -7.34515116e-03,\n",
+       "                        8.64875689e-03,  7.40144961e-03,  6.41043903e-03,  4.63293120e-03,\n",
+       "                        4.28604428e-03,  2.04059836e-02, -8.72917753e-03,  9.75611620e-03,\n",
+       "                        1.00321267e-02,  1.31200878e-02,  2.10976950e-03,  5.71965007e-04,\n",
+       "                        1.03311744e-02, -1.68516766e-03, -1.79438982e-02, -1.74083021e-02,\n",
+       "                       -4.92391782e-03, -1.39317811e-02,  1.48546761e-02, -1.66444052e-02,\n",
+       "                       -3.73365986e-03, -1.36026256e-02,  8.19035619e-03,  4.33718460e-03,\n",
+       "                        4.58232686e-03,  7.53803365e-03,  7.45450845e-03,  7.19609112e-03,\n",
+       "                        1.62290093e-02,  1.26000466e-02, -1.52490484e-02, -2.25856341e-03,\n",
+       "                        2.89014243e-02,  9.44819208e-03,  2.67197583e-02,  6.94153551e-03,\n",
+       "                        1.24824699e-02,  1.95698701e-02, -1.01897297e-02, -1.00039514e-02,\n",
+       "                       -1.04320236e-02, -5.10433037e-03, -8.07258673e-03,  2.40934156e-02,\n",
+       "                       -1.08093852e-02,  3.51674552e-03,  1.24634281e-02,  1.61194839e-02,\n",
+       "                       -4.07268107e-03, -1.28737884e-03, -9.59544443e-04, -1.11112036e-02,\n",
+       "                        1.40558928e-03,  4.56377538e-03,  1.02128573e-02, -6.15438679e-03,\n",
+       "                       -1.33012095e-03,  1.53693510e-02,  1.19307695e-03, -3.19028762e-03,\n",
+       "                        9.25229862e-03,  9.54286443e-05,  3.19778686e-03,  3.43006453e-03,\n",
+       "                        6.68310421e-03, -2.00596638e-03,  2.85807136e-03,  1.19629130e-02,\n",
+       "                       -1.41574815e-02,  1.94316776e-03,  1.87879975e-03,  7.44125294e-03,\n",
+       "                        1.26068098e-02, -1.95779037e-02, -6.75179390e-03,  1.15828542e-02,\n",
+       "                        6.07337616e-03,  4.42268746e-03,  4.94396780e-03,  1.21988477e-02,\n",
+       "                        1.14446990e-02,  1.16123529e-02, -1.07849846e-02,  2.87843146e-03,\n",
+       "                       -1.42739005e-02, -4.04459005e-03, -9.62248445e-03, -5.20158932e-03,\n",
+       "                        6.75694225e-03, -4.65211784e-03,  8.97594448e-03,  1.08250836e-02,\n",
+       "                       -9.49004479e-03,  8.20130017e-03,  8.76851380e-03,  7.95888528e-03,\n",
+       "                        1.37145184e-02,  1.75602008e-02, -8.12873431e-03,  4.97413147e-03,\n",
+       "                       -9.14748292e-03,  1.12449210e-02,  1.59501564e-02,  2.49886438e-02,\n",
+       "                        4.06043883e-03, -6.10539550e-03,  7.11079978e-04,  3.61572509e-03,\n",
+       "                       -7.32730026e-04,  3.84381087e-03,  1.06619615e-02,  2.37780120e-02,\n",
+       "                        1.45025449e-02,  4.25680401e-03, -4.45264997e-03,  1.09784387e-03,\n",
+       "                        2.25181933e-02,  2.84491549e-03,  6.20998326e-04,  2.56988090e-02,\n",
+       "                        1.40275266e-02,  7.56263779e-03, -7.95345195e-03,  2.59988755e-02,\n",
+       "                        1.14943031e-02, -3.48383840e-03,  1.20270695e-03, -6.31895149e-03,\n",
+       "                        6.45010313e-03, -6.69839000e-03,  2.74554864e-02,  1.23840626e-02,\n",
+       "                       -7.85988197e-03,  7.35028647e-03,  1.56578515e-02,  2.94154929e-03,\n",
+       "                        3.62430466e-03, -5.50300488e-03, -4.76662040e-04,  1.59057863e-02,\n",
+       "                       -4.85554570e-03, -1.82895325e-02, -2.30622664e-03, -9.59027000e-03,\n",
+       "                        2.40675379e-02,  5.72432298e-03,  8.61885119e-03,  1.81669146e-02,\n",
+       "                       -7.79482257e-03,  8.06681905e-03,  7.92973395e-03,  8.86156689e-03,\n",
+       "                        1.07650831e-02,  1.68679189e-02,  1.77217312e-02,  1.61346719e-02,\n",
+       "                        2.15555485e-02, -4.34635347e-03, -1.01557719e-02, -7.55260175e-04,\n",
+       "                       -1.61906844e-03, -6.42401120e-03, -5.87663008e-03,  8.43080506e-03,\n",
+       "                        1.68590657e-02,  2.30838265e-02, -9.95164085e-03, -3.70766473e-04,\n",
+       "                        4.54875827e-03,  1.40316486e-02,  6.50463440e-03, -9.05440375e-03,\n",
+       "                        1.86522224e-03,  3.77172534e-03, -1.21039599e-02,  6.24031387e-03,\n",
+       "                        6.86559547e-03,  3.87154031e-03,  7.53928721e-03, -3.78697389e-03,\n",
+       "                        8.47220607e-03,  5.19724749e-03, -1.68645848e-02, -6.83352305e-03,\n",
+       "                        6.16311003e-03,  2.06075478e-02, -3.36128706e-03, -4.54347255e-03,\n",
+       "                       -4.43226658e-03,  9.47801396e-03,  1.34469452e-03, -2.78269453e-03,\n",
+       "                        1.07496325e-03,  5.72886225e-03, -4.58427705e-03,  4.34674323e-03,\n",
+       "                        1.00894533e-02,  6.01954013e-03,  1.18409786e-02,  1.02127623e-02,\n",
+       "                       -3.16850585e-03, -1.01286909e-02,  2.17334591e-02,  1.12441396e-02,\n",
+       "                       -4.21741139e-03,  5.98146534e-03,  1.92161649e-02, -9.98497382e-03,\n",
+       "                        1.02236588e-02,  3.91611643e-03,  1.38576785e-02, -4.98477183e-03,\n",
+       "                        2.07855050e-02,  1.55463815e-02,  1.42694395e-02,  1.70583408e-02,\n",
+       "                       -2.10462380e-02,  7.90667254e-03,  1.00777100e-03,  2.03150448e-05,\n",
+       "                       -9.65817273e-03,  1.48673952e-02, -4.30348329e-03,  1.13944628e-03,\n",
+       "                        2.93337228e-03, -8.70792102e-03, -1.75675575e-03,  8.86655040e-03,\n",
+       "                        1.60456393e-02,  1.19324429e-02,  9.20977350e-03,  1.57949142e-02,\n",
+       "                        3.98718752e-03,  5.14104264e-03, -2.80088722e-03,  2.14166343e-02,\n",
+       "                       -1.71560235e-02, -8.84766877e-03, -9.08766873e-03,  4.13088640e-03,\n",
+       "                        7.41530722e-03, -7.14520458e-03,  1.43901035e-02,  1.57008432e-02,\n",
+       "                        3.48176365e-03,  1.34258689e-02, -7.77519168e-03,  2.52181496e-02,\n",
+       "                        1.94994695e-02, -1.00142611e-02,  4.24301857e-03,  4.00523946e-04,\n",
+       "                        1.96565893e-02,  1.52775235e-02,  1.19475620e-02,  3.16524319e-03,\n",
+       "                        1.98126957e-02,  1.54079534e-02,  2.37543555e-03,  9.40866210e-03,\n",
+       "                        4.05140314e-03,  7.91203696e-04,  1.09335911e-02,  1.97298676e-02,\n",
+       "                       -1.93075929e-02,  1.94303587e-03,  3.35570797e-02, -2.26485580e-02,\n",
+       "                        1.55655332e-02,  7.09330058e-03,  4.23489313e-04,  9.61118191e-03,\n",
+       "                        1.63517352e-02,  1.42600127e-02, -5.09561691e-03, -3.46544152e-03,\n",
+       "                       -7.05293380e-03,  5.47119463e-03, -1.19369272e-02,  3.55220283e-03,\n",
+       "                       -6.47027092e-03, -4.66864277e-03, -1.12860324e-03,  1.57437511e-02,\n",
+       "                        8.27108324e-03,  2.43137102e-03, -1.15485163e-02, -1.33490609e-02,\n",
+       "                        1.06290532e-02,  1.28479563e-02, -1.36187626e-03,  1.18819866e-02,\n",
+       "                        1.30752167e-02, -8.14791210e-03,  1.79868210e-02, -1.14236902e-02,\n",
+       "                       -1.29655702e-02,  2.08648783e-03, -7.74235511e-03,  1.28833978e-02,\n",
+       "                        6.50411658e-03,  7.50467088e-03, -1.07559422e-02,  1.75879411e-02,\n",
+       "                       -8.50211736e-03, -1.01776710e-02,  2.42663119e-02,  1.62711286e-03,\n",
+       "                        6.88572740e-03,  5.71457949e-03,  6.17601851e-04, -1.78704094e-02,\n",
+       "                       -1.71567197e-04, -8.67385324e-03,  1.68735757e-02,  3.69164161e-03,\n",
+       "                       -1.05630793e-02,  6.74468745e-03,  1.98948095e-04,  7.28386408e-03,\n",
+       "                       -2.24167085e-03,  7.09309569e-03,  2.85558943e-02,  1.32500548e-02,\n",
+       "                        1.69137903e-02, -2.37387780e-04, -2.18597203e-02, -4.46859561e-03,\n",
+       "                        1.04082571e-02,  4.03283583e-03,  9.06235911e-03,  2.31208205e-02,\n",
+       "                        1.02282958e-02,  7.54507864e-03, -2.02157628e-03,  1.72267552e-03,\n",
+       "                        7.76690198e-04, -2.34109838e-03,  2.48324894e-03, -1.77459500e-03,\n",
+       "                        1.74034499e-02,  1.18780583e-02,  2.42147446e-02,  4.53634560e-03,\n",
+       "                       -7.13373011e-04,  6.53022528e-03,  1.31792929e-02,  3.03253159e-03,\n",
+       "                       -1.16036963e-02,  1.38841802e-02, -9.61985672e-04,  1.56072509e-02,\n",
+       "                        1.83839221e-02, -1.26425391e-02, -8.58081039e-03,  1.77578256e-02,\n",
+       "                       -1.57705601e-02,  6.07309677e-03,  1.58127826e-02, -4.43605706e-03,\n",
+       "                        3.01327799e-02,  1.62303597e-02,  1.62664112e-02,  9.25481878e-03,\n",
+       "                       -2.17470736e-03, -2.18344177e-03,  1.02113271e-02,  2.36091372e-02,\n",
+       "                        1.14256535e-02, -1.63149880e-03, -1.76011212e-02,  7.09930295e-03,\n",
+       "                        7.96853937e-03,  1.75659396e-02, -3.90994363e-03, -1.06832599e-02,\n",
+       "                       -8.94176587e-03, -1.21121760e-02,  5.23515511e-03, -1.00380024e-02,\n",
+       "                       -9.87766962e-03,  2.45441310e-02,  3.19681270e-03,  1.41334981e-02,\n",
+       "                        2.02579927e-02,  2.55680783e-03,  8.56060628e-03, -2.40424345e-03,\n",
+       "                       -1.69302542e-02, -4.54237964e-03, -1.20616211e-02,  1.82611158e-03,\n",
+       "                        2.76846206e-03,  1.38199525e-02, -1.33961961e-02,  7.89576955e-03,\n",
+       "                        1.97190102e-02,  7.84316193e-03,  1.24047138e-02, -1.47519272e-03,\n",
+       "                       -9.65619646e-03,  8.34757928e-03, -2.17827642e-03, -3.88957502e-04,\n",
+       "                        1.64355468e-02,  2.64623687e-02, -9.89953335e-03,  1.12777716e-02,\n",
+       "                       -2.95404904e-03,  8.74106493e-03,  1.55162811e-03, -3.00494349e-03,\n",
+       "                        2.69142073e-03,  2.39436403e-02, -9.84442607e-03,  1.80167556e-02],\n",
+       "                      dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (layer_2): Dense(\n",
+       "                192, activation=linear, use_bias=True\n",
+       "                (kernel): <tf.Variable 'transformer/layer_._0/ff/layer_2/kernel:0' shape=(768, 192) dtype=float32, numpy=\n",
+       "                array([[ 0.03105873,  0.02197045,  0.01535711, ..., -0.02207142,\n",
+       "                        -0.00204962,  0.01233771],\n",
+       "                       [-0.00683493, -0.01493787,  0.00323838, ..., -0.00578931,\n",
+       "                         0.01483128,  0.02967459],\n",
+       "                       [-0.02099711,  0.00616769, -0.00663288, ...,  0.02499438,\n",
+       "                         0.01299867, -0.00927783],\n",
+       "                       ...,\n",
+       "                       [-0.01390732,  0.01844309, -0.01650524, ...,  0.00378714,\n",
+       "                         0.00615161,  0.00803701],\n",
+       "                       [ 0.00750632, -0.00458682, -0.01339437, ..., -0.00503869,\n",
+       "                        -0.00725265, -0.00729213],\n",
+       "                       [-0.00832169,  0.01612099, -0.02206275, ..., -0.03785598,\n",
+       "                        -0.01250057, -0.02561413]], dtype=float32)>\n",
+       "                (bias): <tf.Variable 'transformer/layer_._0/ff/layer_2/bias:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([-1.18231699e-02,  1.03601832e-02, -8.29804223e-03,  1.99701991e-02,\n",
+       "                        1.76643080e-04,  4.44231071e-02,  2.99130473e-02,  3.19546983e-02,\n",
+       "                       -1.12999994e-02,  3.43591869e-02, -1.61521472e-02,  1.36177503e-02,\n",
+       "                        1.15128085e-02, -1.09507621e-03, -3.37390555e-03,  6.89360220e-03,\n",
+       "                       -4.13123937e-03,  1.62499081e-02, -8.00683629e-04, -2.11246312e-02,\n",
+       "                       -1.37601141e-02,  3.46819125e-02,  9.78396088e-03, -4.11889283e-03,\n",
+       "                        5.74809080e-03,  1.44397409e-03,  3.15773301e-03,  7.75392726e-03,\n",
+       "                       -1.11424308e-02, -1.06719630e-02,  1.12653803e-02, -1.79730225e-02,\n",
+       "                        8.06322228e-03, -2.28440948e-03,  2.09859367e-02, -1.07666533e-02,\n",
+       "                       -1.69093590e-02,  1.28620099e-02,  3.85885276e-02,  2.59677637e-02,\n",
+       "                       -2.09366418e-02,  1.07704918e-03, -4.80084028e-03, -1.99089963e-02,\n",
+       "                        2.55218279e-02,  1.77786537e-02,  7.77578400e-03,  1.14584505e-03,\n",
+       "                       -1.43661699e-03,  1.05165811e-02,  4.13904246e-03, -1.51320302e-03,\n",
+       "                        7.36002252e-03, -2.05752421e-02,  5.02680764e-02,  5.19761303e-03,\n",
+       "                       -3.12606804e-04, -1.33357486e-02,  1.02019459e-02, -2.60877237e-03,\n",
+       "                        7.74074951e-03, -5.22067491e-03,  1.11552700e-02, -5.16852923e-03,\n",
+       "                        8.53748340e-03, -6.34515099e-03,  2.92164087e-02, -1.34276906e-02,\n",
+       "                       -2.07019337e-02, -6.97588595e-03, -9.50461428e-04, -5.22856563e-02,\n",
+       "                       -4.60096495e-03, -1.05865430e-02, -7.99557834e-04,  1.64804514e-03,\n",
+       "                       -1.11557161e-02, -2.90366467e-02,  1.41196838e-02, -9.79548972e-03,\n",
+       "                       -4.00953926e-03,  1.12849819e-02,  2.55571981e-03, -1.16084691e-03,\n",
+       "                        2.75370330e-02,  3.10603790e-02,  5.13396645e-03,  9.99009516e-03,\n",
+       "                        1.81308165e-02, -1.73914377e-02, -6.52272627e-03, -4.53224359e-03,\n",
+       "                       -1.50986025e-02,  1.44944564e-02, -1.71106905e-02, -3.57185379e-02,\n",
+       "                       -1.84081197e-02,  6.25483785e-03, -3.86861190e-02, -1.24735022e-02,\n",
+       "                       -3.20191239e-03, -5.15542505e-03, -2.35393108e-03,  1.86459981e-02,\n",
+       "                       -7.51753850e-03, -4.82365210e-03,  3.32103260e-02,  7.17555871e-03,\n",
+       "                        7.25519285e-03, -9.94957238e-03,  1.35318565e-04, -2.35690605e-02,\n",
+       "                       -3.16280313e-03, -1.14406820e-03,  2.74472986e-03,  6.59645908e-03,\n",
+       "                       -1.41589751e-03,  4.13854569e-02, -1.44355716e-02, -6.92052348e-03,\n",
+       "                        5.55959530e-03, -3.30252536e-02, -1.38800498e-02,  8.02037679e-03,\n",
+       "                       -2.93474011e-02,  3.47584710e-02,  9.14734043e-03, -9.73121449e-03,\n",
+       "                       -1.23930294e-02,  2.06993651e-02, -3.12827341e-03, -2.32891343e-03,\n",
+       "                       -3.46817225e-02,  6.07703906e-03,  2.06695050e-02,  1.19140390e-02,\n",
+       "                       -3.75964679e-02,  7.35174678e-03, -4.06955648e-03, -4.85159121e-02,\n",
+       "                        6.43890491e-03, -2.10845768e-02, -2.46330500e-02, -1.20099075e-03,\n",
+       "                       -4.61101271e-02,  5.49700065e-03,  4.75712121e-03, -3.62440175e-03,\n",
+       "                        1.52475038e-03,  4.00585197e-02,  1.48058282e-02, -2.08347831e-02,\n",
+       "                       -7.71040935e-03,  3.24013340e-03, -4.08119755e-04,  1.07808020e-02,\n",
+       "                       -8.54405575e-03,  1.08643081e-02, -2.49987431e-02, -9.56417341e-03,\n",
+       "                        7.06814753e-05,  1.61526855e-02,  8.29778844e-04,  5.27869863e-03,\n",
+       "                        1.83209090e-03,  5.17274626e-03, -9.73243825e-03,  1.77772976e-02,\n",
+       "                        9.07951314e-03,  2.06841063e-02, -1.68221779e-02, -3.72066498e-02,\n",
+       "                        2.13726964e-02, -2.43793298e-02,  7.82521069e-03,  1.40628982e-02,\n",
+       "                       -1.62246283e-02,  1.40211182e-02, -2.62036663e-03,  6.93138875e-03,\n",
+       "                       -1.47657488e-02,  2.04760805e-02,  2.87828641e-03,  1.40901785e-02,\n",
+       "                        5.04952762e-03,  1.17212813e-02,  2.30959542e-02, -1.17893247e-02,\n",
+       "                        1.45166460e-02,  3.32305534e-03, -7.83565454e-03, -7.87868979e-04],\n",
+       "                      dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (dropout): Dropout(\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "            (dropout): Dropout(\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "            (_feature_shapes): Dict()\n",
+       "            (_feature_dtypes): Dict()\n",
+       "          )\n",
+       "          (1): TFXLNetLayer(\n",
+       "            (rel_attn): TFXLNetRelativeAttention(\n",
+       "              (layer_norm): LayerNormalization(\n",
+       "                (axis): List(\n",
+       "                  (0): 2\n",
+       "                )\n",
+       "                (gamma): <tf.Variable 'transformer/layer_._1/rel_attn/layer_norm/gamma:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([1.0261322 , 1.0269046 , 0.9773781 , 1.0247962 , 1.0097598 ,\n",
+       "                       1.0459249 , 1.0389155 , 1.0094162 , 0.9840094 , 1.0255837 ,\n",
+       "                       1.0145838 , 1.029601  , 0.9919759 , 1.0503366 , 1.000113  ,\n",
+       "                       0.98745275, 0.9951172 , 0.98850536, 1.0047354 , 1.0157787 ,\n",
+       "                       1.0056013 , 1.0997953 , 1.0325745 , 1.0181527 , 0.9886395 ,\n",
+       "                       1.0032426 , 0.9645967 , 1.0369183 , 1.0305737 , 1.022639  ,\n",
+       "                       0.98697466, 1.0407704 , 1.0208054 , 1.0117294 , 1.0012168 ,\n",
+       "                       1.0317819 , 1.0090001 , 1.0274644 , 1.0130668 , 0.99157923,\n",
+       "                       1.032259  , 1.0095482 , 1.0317316 , 1.0250219 , 1.0415062 ,\n",
+       "                       0.99819475, 1.0200968 , 1.0049968 , 1.0128824 , 1.0352737 ,\n",
+       "                       1.0368786 , 0.96232355, 1.0403799 , 1.0008532 , 1.0264657 ,\n",
+       "                       0.9998839 , 0.97538733, 0.991134  , 1.0391068 , 0.9888234 ,\n",
+       "                       1.0180827 , 0.9775322 , 1.0192289 , 1.0150893 , 1.000222  ,\n",
+       "                       1.0049831 , 0.9870896 , 1.0674498 , 1.0196699 , 1.0082041 ,\n",
+       "                       1.0324329 , 0.99676013, 1.0091047 , 1.0248021 , 1.0044961 ,\n",
+       "                       1.0053085 , 1.0009363 , 0.9970736 , 0.94617426, 1.0338936 ,\n",
+       "                       1.0148971 , 0.96663743, 1.0128137 , 1.0034641 , 1.0319886 ,\n",
+       "                       1.0064343 , 1.0028603 , 1.002649  , 1.0243838 , 1.0064948 ,\n",
+       "                       1.0377748 , 0.9891696 , 0.9866293 , 0.99707025, 0.99078393,\n",
+       "                       1.0176572 , 1.0241402 , 1.0049547 , 1.000801  , 1.034779  ,\n",
+       "                       1.0198549 , 0.9966189 , 0.9957258 , 1.0326344 , 0.99225044,\n",
+       "                       1.0071577 , 1.0114198 , 1.0367244 , 1.0063225 , 0.9908461 ,\n",
+       "                       1.0214857 , 1.0045844 , 0.97997284, 0.98385096, 1.0132415 ,\n",
+       "                       1.0294743 , 1.0063779 , 1.0424733 , 1.0020639 , 1.0190448 ,\n",
+       "                       0.9811757 , 1.0200567 , 1.0410883 , 1.0080585 , 1.0111438 ,\n",
+       "                       1.0438564 , 1.0073017 , 1.0119686 , 1.0274266 , 1.0132748 ,\n",
+       "                       0.9857355 , 0.98808295, 1.0102935 , 1.0228415 , 0.99962467,\n",
+       "                       1.0004269 , 0.99588555, 1.0006347 , 1.0041206 , 0.990004  ,\n",
+       "                       0.9891518 , 1.0437917 , 1.0374291 , 0.99602705, 1.0428259 ,\n",
+       "                       0.97428006, 1.0055739 , 1.0196538 , 1.0008999 , 1.0310303 ,\n",
+       "                       1.002109  , 0.9910634 , 0.9972151 , 1.0127355 , 0.98564386,\n",
+       "                       1.0203615 , 1.0232209 , 1.0296504 , 0.9873712 , 1.0131739 ,\n",
+       "                       0.9984371 , 1.0343952 , 0.9563564 , 1.0268995 , 1.0328572 ,\n",
+       "                       1.002335  , 0.98883   , 1.0180264 , 0.9681929 , 0.9756003 ,\n",
+       "                       1.070814  , 1.0193576 , 0.98169804, 1.0006468 , 1.0085332 ,\n",
+       "                       0.9559967 , 1.0291041 , 1.0083201 , 1.0401794 , 0.99601644,\n",
+       "                       1.0606512 , 1.0057952 , 0.98249924, 1.0013803 , 0.9975868 ,\n",
+       "                       1.0436803 , 0.9974033 , 1.0232234 , 1.0014886 , 0.95568186,\n",
+       "                       1.0128983 , 1.0420789 ], dtype=float32)>\n",
+       "                (beta): <tf.Variable 'transformer/layer_._1/rel_attn/layer_norm/beta:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([ 2.52928934e-03,  2.75707990e-02, -7.46368477e-03,  2.60973740e-02,\n",
+       "                       -2.99260370e-03,  2.73417979e-02,  4.90686111e-02,  1.38162207e-02,\n",
+       "                        8.11486784e-03,  1.70336086e-02,  3.51925148e-03, -7.69003760e-03,\n",
+       "                        2.59532798e-02, -1.75180901e-02, -1.08880019e-02,  1.38446065e-02,\n",
+       "                       -2.13629357e-03,  8.55799112e-03,  8.28036014e-03,  2.36780709e-03,\n",
+       "                       -1.72654982e-05,  9.31350291e-02,  2.88223773e-02,  3.16347592e-02,\n",
+       "                       -1.64339896e-02,  2.52713393e-02, -8.71144608e-03,  4.91184108e-02,\n",
+       "                       -2.37441119e-02, -1.38560440e-02,  6.72000367e-03, -8.39894861e-02,\n",
+       "                       -1.03174821e-02, -1.49761168e-02, -1.07429633e-02,  6.57213945e-03,\n",
+       "                        2.32967455e-03,  6.64166058e-04,  1.59889422e-02, -3.34091089e-03,\n",
+       "                        3.97001253e-03,  3.76692340e-02, -3.19892950e-02,  1.11396972e-03,\n",
+       "                        3.83891873e-02,  1.59136765e-02,  1.96111146e-02, -1.42334513e-02,\n",
+       "                        3.52888145e-02,  1.33105358e-02,  5.51172113e-03,  2.60192398e-02,\n",
+       "                       -8.31306912e-03,  5.08351345e-03,  1.16162142e-02,  9.07008070e-03,\n",
+       "                       -1.77313585e-03, -1.13073476e-02, -2.63853911e-02, -7.58569455e-03,\n",
+       "                        1.23039568e-02, -9.51751322e-03,  3.47649269e-02, -8.37521441e-03,\n",
+       "                       -3.41385603e-03, -1.35939382e-02, -2.31663603e-02, -3.02777179e-02,\n",
+       "                       -1.23716239e-02, -2.14149896e-02, -2.31477581e-02, -1.99445989e-02,\n",
+       "                       -1.63127650e-02, -1.80728100e-02, -8.70492589e-03, -1.29072918e-02,\n",
+       "                       -2.68601850e-02, -6.94075646e-03, -4.48201085e-03, -3.69689763e-02,\n",
+       "                       -2.38052551e-02,  9.86985397e-03,  1.81750860e-02, -2.17389762e-02,\n",
+       "                        1.58198401e-02,  1.82335339e-02,  1.69853829e-02,  8.53019953e-03,\n",
+       "                        1.26137808e-02,  4.35138913e-03, -1.42680006e-02, -7.37039372e-03,\n",
+       "                       -9.13672987e-03,  8.27492448e-04,  2.01249495e-02, -3.34417671e-02,\n",
+       "                       -8.82770121e-03,  7.83569762e-04,  1.45847378e-02, -2.61937417e-02,\n",
+       "                       -5.73098920e-02,  2.56210603e-02,  1.96438842e-02,  1.58894695e-02,\n",
+       "                        2.79775411e-02,  4.48896922e-02,  7.81496707e-03,  3.24482359e-02,\n",
+       "                       -2.23230664e-03, -9.27990023e-03, -3.37327085e-02, -2.58272141e-02,\n",
+       "                       -2.16552466e-02,  1.95785761e-02,  1.95409935e-02,  1.11613050e-02,\n",
+       "                       -1.71062257e-02,  1.76059026e-02, -1.35756070e-02, -1.33802658e-02,\n",
+       "                        1.22849524e-04, -3.00864950e-02, -3.07294056e-02,  8.43367260e-03,\n",
+       "                        1.71686104e-03,  1.77911706e-02,  2.96829501e-03,  6.71349885e-03,\n",
+       "                       -1.27283167e-02,  1.89087614e-02,  2.34963223e-02, -8.70413706e-03,\n",
+       "                       -2.57595368e-02,  3.97355249e-03,  2.23790798e-02,  1.55618126e-02,\n",
+       "                       -1.90211681e-03,  9.54312459e-03,  1.30000506e-02, -1.60749331e-02,\n",
+       "                        1.90574955e-02, -2.48913411e-02, -1.22065293e-02, -1.17140273e-02,\n",
+       "                       -7.87160620e-02,  7.49537256e-03,  1.81484632e-02,  4.25873324e-03,\n",
+       "                       -2.96639949e-02,  9.80244949e-03, -2.01651305e-02, -2.05957796e-02,\n",
+       "                       -1.32818706e-02,  2.80134995e-02,  1.27927978e-02,  1.28203519e-02,\n",
+       "                        7.55941402e-03,  1.86280571e-02, -2.17847694e-02,  3.51456041e-03,\n",
+       "                       -9.69546381e-05,  2.68017650e-02, -1.62972324e-02,  4.14601108e-03,\n",
+       "                        1.23571977e-02,  1.97119489e-02, -7.15771178e-03,  5.23134600e-03,\n",
+       "                        3.03786639e-02, -1.63936466e-02, -3.25149409e-02, -5.39167337e-02,\n",
+       "                        3.43849994e-02, -1.77244600e-02, -8.30308069e-03, -2.26102229e-02,\n",
+       "                       -3.20713557e-02, -4.66967747e-02, -4.05329056e-02, -1.22320019e-02,\n",
+       "                       -3.25014628e-02,  5.88958384e-03, -1.72737613e-02,  3.55301984e-02,\n",
+       "                       -1.11767389e-02,  4.04588655e-02,  3.43203195e-04, -3.55312340e-02,\n",
+       "                        8.39638431e-03, -2.83913617e-03, -4.11246624e-03, -1.91871380e-03],\n",
+       "                      dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (dropout): Dropout(\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (q): <tf.Variable 'transformer/layer_._1/rel_attn/q:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[-9.14077908e-02,  1.13878334e-02, -8.51188079e-02, ...,\n",
+       "                        7.58047625e-02,  4.81901653e-02, -1.57964990e-01],\n",
+       "                      [-3.61972786e-02, -6.05871342e-03,  4.62203361e-02, ...,\n",
+       "                        1.02220975e-01,  3.31187397e-02, -2.00551637e-02],\n",
+       "                      [-1.78344436e-02,  1.10841259e-01, -8.28037853e-04, ...,\n",
+       "                       -2.72256564e-02, -3.21121849e-02,  2.49014031e-02],\n",
+       "                      ...,\n",
+       "                      [-1.44089619e-02,  3.92392725e-02,  2.32233517e-02, ...,\n",
+       "                        3.18129919e-03, -9.68393534e-02,  7.63502344e-02],\n",
+       "                      [ 4.15719226e-02,  5.68181686e-02,  1.57067806e-01, ...,\n",
+       "                        1.03105821e-01,  7.46680945e-02, -1.58567447e-02],\n",
+       "                      [-4.14981209e-02,  1.08322926e-01,  6.22609854e-02, ...,\n",
+       "                        9.51158553e-02, -4.82069701e-03,  3.56614999e-02]],\n",
+       "              \n",
+       "                     [[ 2.21992377e-02, -5.97883500e-02,  5.15988655e-02, ...,\n",
+       "                       -1.11302346e-01,  4.72044796e-02,  5.94906546e-02],\n",
+       "                      [ 8.15225467e-02, -1.04043297e-02,  1.18145466e-01, ...,\n",
+       "                       -1.53390374e-02, -5.59366755e-02, -1.01808645e-02],\n",
+       "                      [ 5.30351363e-02, -7.88138062e-02,  5.97658455e-02, ...,\n",
+       "                        3.89603190e-02, -2.52384972e-02, -4.04863395e-02],\n",
+       "                      ...,\n",
+       "                      [ 5.18525168e-02, -1.18374228e-01,  1.22500304e-02, ...,\n",
+       "                        7.76050566e-03, -2.46625934e-02, -1.08838245e-01],\n",
+       "                      [-2.82060308e-03, -3.73417921e-02, -7.43817911e-02, ...,\n",
+       "                       -6.81613460e-02, -9.98374727e-03,  3.63878049e-02],\n",
+       "                      [-2.33192071e-02, -7.30483979e-02, -1.47890881e-01, ...,\n",
+       "                       -2.56333891e-02, -1.82271786e-02, -1.11294717e-01]],\n",
+       "              \n",
+       "                     [[ 7.07995743e-02,  1.02071442e-01, -4.62083258e-02, ...,\n",
+       "                       -3.06372382e-02, -8.96562729e-03, -1.60935847e-03],\n",
+       "                      [ 4.93399464e-02,  5.80327064e-02, -4.21695262e-02, ...,\n",
+       "                       -4.44087908e-02,  6.36480451e-02,  9.20375884e-02],\n",
+       "                      [ 2.61474848e-02,  1.04868315e-01,  8.21986571e-02, ...,\n",
+       "                        6.94721192e-02, -4.26909029e-02,  3.19289789e-02],\n",
+       "                      ...,\n",
+       "                      [ 5.12780324e-02,  2.22272910e-02,  7.36066028e-02, ...,\n",
+       "                       -1.02062506e-04, -2.78015006e-02, -2.21668612e-02],\n",
+       "                      [ 3.76984179e-02, -5.69667593e-02,  9.02416408e-02, ...,\n",
+       "                       -1.17468983e-02, -3.04301623e-02,  7.01869503e-02],\n",
+       "                      [ 1.47923687e-02,  7.80922920e-02, -8.18262398e-02, ...,\n",
+       "                       -7.04243034e-02,  1.69871803e-02, -1.93864703e-02]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[-7.37240771e-03, -1.19801663e-01,  6.94409460e-02, ...,\n",
+       "                       -5.98479286e-02,  1.27701059e-01,  1.34302229e-01],\n",
+       "                      [ 1.42167673e-01, -3.61821651e-02,  8.10781941e-02, ...,\n",
+       "                       -5.00151552e-02, -1.02305926e-01, -2.29969881e-02],\n",
+       "                      [ 7.70621598e-02, -3.88466418e-02,  1.30510852e-01, ...,\n",
+       "                       -2.38810554e-02,  1.85351875e-02, -7.33468086e-02],\n",
+       "                      ...,\n",
+       "                      [ 8.39333534e-02, -1.29041314e-01, -1.34542719e-01, ...,\n",
+       "                        9.67865635e-04,  8.93794596e-02, -5.52671216e-02],\n",
+       "                      [ 6.98279887e-02, -7.33840745e-04,  1.12927826e-02, ...,\n",
+       "                       -8.48613232e-02,  1.15450528e-02,  8.48317146e-02],\n",
+       "                      [-1.45672085e-02, -4.56641093e-02,  3.52248806e-03, ...,\n",
+       "                       -9.79588628e-02,  1.43803144e-02, -1.96329392e-02]],\n",
+       "              \n",
+       "                     [[-2.24300846e-02, -9.70121622e-02, -5.53180464e-02, ...,\n",
+       "                        1.14226513e-01, -1.15935691e-01, -8.40203557e-03],\n",
+       "                      [ 2.19793785e-02,  2.20347419e-02,  3.52332145e-02, ...,\n",
+       "                       -4.72014174e-02, -4.09451835e-02, -1.41605914e-01],\n",
+       "                      [-7.50652626e-02, -4.78943847e-02, -2.94669345e-02, ...,\n",
+       "                       -2.04580035e-02,  2.83687301e-02,  7.36517832e-02],\n",
+       "                      ...,\n",
+       "                      [ 6.45165937e-03, -5.17790206e-02,  6.01154417e-02, ...,\n",
+       "                       -6.84089139e-02,  2.98251119e-02,  1.11601777e-01],\n",
+       "                      [ 1.68807507e-02,  4.85507809e-02, -5.92818707e-02, ...,\n",
+       "                       -3.60055789e-02, -1.57371853e-02,  3.19426693e-02],\n",
+       "                      [-2.77272481e-02, -3.94149087e-02,  1.89277288e-02, ...,\n",
+       "                        7.10227247e-03, -1.24480035e-02,  1.21919438e-01]],\n",
+       "              \n",
+       "                     [[-1.07383234e-02,  2.83993669e-02, -7.25662708e-02, ...,\n",
+       "                       -1.08398020e-01,  5.89501522e-02, -2.39164885e-02],\n",
+       "                      [-5.66680133e-02, -1.15045384e-01,  1.19717479e-01, ...,\n",
+       "                       -7.25880936e-02, -8.00165460e-02,  2.48625781e-02],\n",
+       "                      [-5.32022268e-02, -6.84107393e-02, -4.79449611e-03, ...,\n",
+       "                        1.19777806e-02, -6.41888380e-02, -1.23907752e-01],\n",
+       "                      ...,\n",
+       "                      [ 1.39709413e-01, -1.15669481e-02,  1.02200054e-01, ...,\n",
+       "                        3.99158709e-02, -3.26740108e-02, -4.94181402e-02],\n",
+       "                      [-1.52411321e-02,  6.57810271e-02, -1.58718899e-01, ...,\n",
+       "                        5.38997818e-03, -2.09698156e-01,  6.31303014e-03],\n",
+       "                      [-6.14385307e-03, -3.01341526e-04, -3.58580053e-02, ...,\n",
+       "                        2.14667432e-02,  2.57892162e-02, -1.59396425e-01]]],\n",
+       "                    dtype=float32)>\n",
+       "              (k): <tf.Variable 'transformer/layer_._1/rel_attn/k:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[-0.02706272, -0.01475603,  0.01799243, ..., -0.01109189,\n",
+       "                       -0.10876201,  0.0518376 ],\n",
+       "                      [-0.0031296 , -0.02590217, -0.02579277, ..., -0.05076121,\n",
+       "                        0.01024422, -0.0047144 ],\n",
+       "                      [ 0.01895484, -0.03475295, -0.03113441, ..., -0.00184126,\n",
+       "                        0.01880827,  0.00846547],\n",
+       "                      ...,\n",
+       "                      [-0.0230201 , -0.00894863,  0.00495793, ..., -0.00316434,\n",
+       "                        0.04121248,  0.00622395],\n",
+       "                      [-0.05963105,  0.01012768, -0.03366488, ...,  0.00041262,\n",
+       "                        0.00683424, -0.01068041],\n",
+       "                      [ 0.02895327, -0.02416312,  0.01993154, ..., -0.01618524,\n",
+       "                       -0.01545478,  0.00205119]],\n",
+       "              \n",
+       "                     [[-0.04576638,  0.04656557, -0.01677025, ...,  0.02344459,\n",
+       "                       -0.12276172, -0.00676864],\n",
+       "                      [-0.00978681,  0.04487051, -0.08663532, ..., -0.03004673,\n",
+       "                        0.01007075,  0.03550502],\n",
+       "                      [ 0.02785692,  0.02792483,  0.00051675, ...,  0.00370448,\n",
+       "                        0.00668171,  0.04424441],\n",
+       "                      ...,\n",
+       "                      [-0.02920452,  0.02893456, -0.02343769, ..., -0.04401347,\n",
+       "                       -0.02856454,  0.03050387],\n",
+       "                      [ 0.04369762, -0.03524409,  0.04656316, ...,  0.00108793,\n",
+       "                       -0.02215741,  0.01845626],\n",
+       "                      [-0.01543178,  0.01866272,  0.01845369, ..., -0.02931005,\n",
+       "                        0.03298638,  0.01737015]],\n",
+       "              \n",
+       "                     [[-0.135364  , -0.0664507 ,  0.01112893, ..., -0.00859859,\n",
+       "                        0.00755295,  0.01676364],\n",
+       "                      [-0.02737699, -0.04769333,  0.05760125, ...,  0.02541748,\n",
+       "                       -0.03828989, -0.06387301],\n",
+       "                      [-0.01690764, -0.0606076 , -0.01655304, ..., -0.02443056,\n",
+       "                        0.04120573, -0.04320288],\n",
+       "                      ...,\n",
+       "                      [-0.00565883,  0.04010722,  0.00216758, ...,  0.02029311,\n",
+       "                        0.039828  ,  0.01575541],\n",
+       "                      [ 0.00487086,  0.0582353 , -0.0297171 , ..., -0.01682885,\n",
+       "                       -0.00391845, -0.0216135 ],\n",
+       "                      [ 0.00531683, -0.01306163,  0.04055905, ...,  0.02679659,\n",
+       "                       -0.05756253,  0.01769848]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[ 0.00473029,  0.0232644 , -0.0174927 , ...,  0.01263051,\n",
+       "                       -0.10177041, -0.03314629],\n",
+       "                      [-0.05181501,  0.01826319, -0.00387804, ...,  0.00019099,\n",
+       "                        0.0264037 ,  0.00855082],\n",
+       "                      [-0.02973071,  0.01030848, -0.01891961, ...,  0.05118888,\n",
+       "                       -0.08611775,  0.08852727],\n",
+       "                      ...,\n",
+       "                      [-0.02925289,  0.04309483,  0.04216203, ...,  0.00242066,\n",
+       "                       -0.05256388,  0.00049124],\n",
+       "                      [-0.01112139,  0.01980946, -0.03196227, ...,  0.03356062,\n",
+       "                       -0.010408  , -0.02198589],\n",
+       "                      [-0.03535127, -0.00773543, -0.00885877, ...,  0.02874871,\n",
+       "                        0.00311856,  0.02825575]],\n",
+       "              \n",
+       "                     [[ 0.04659694,  0.07548056,  0.01092906, ..., -0.0534005 ,\n",
+       "                        0.09931507,  0.01606977],\n",
+       "                      [-0.01193147,  0.00658854, -0.01162503, ...,  0.05445072,\n",
+       "                       -0.00323939,  0.06076182],\n",
+       "                      [ 0.01014838,  0.02871931,  0.01193392, ...,  0.03308337,\n",
+       "                       -0.01210698, -0.05587041],\n",
+       "                      ...,\n",
+       "                      [-0.00237026, -0.00477155, -0.02654402, ...,  0.05717536,\n",
+       "                       -0.00253815, -0.04528459],\n",
+       "                      [-0.00140787, -0.03180642,  0.03757759, ...,  0.00683571,\n",
+       "                        0.01135639, -0.00226221],\n",
+       "                      [ 0.0223318 ,  0.02836771, -0.00715415, ...,  0.00253245,\n",
+       "                       -0.000718  , -0.0467924 ]],\n",
+       "              \n",
+       "                     [[ 0.00486831, -0.03448185,  0.03256648, ...,  0.01382556,\n",
+       "                       -0.07196326,  0.02667288],\n",
+       "                      [ 0.02565878,  0.04478304, -0.08682576, ...,  0.01990675,\n",
+       "                        0.03794343, -0.01332447],\n",
+       "                      [ 0.03825634,  0.01602439, -0.01602452, ..., -0.00877481,\n",
+       "                        0.0457263 ,  0.05769112],\n",
+       "                      ...,\n",
+       "                      [-0.05350161,  0.00859326, -0.06572261, ..., -0.04210747,\n",
+       "                        0.00275381,  0.01149508],\n",
+       "                      [ 0.01882138, -0.10080525,  0.04411182, ...,  0.00712686,\n",
+       "                        0.05586889, -0.01648431],\n",
+       "                      [ 0.03689698,  0.0139469 ,  0.01361012, ..., -0.00313812,\n",
+       "                       -0.06611379,  0.05732429]]], dtype=float32)>\n",
+       "              (v): <tf.Variable 'transformer/layer_._1/rel_attn/v:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[ 5.67087531e-02, -1.12824850e-01, -1.23196626e-02, ...,\n",
+       "                        1.13645149e-02,  3.56883346e-03,  8.45598057e-02],\n",
+       "                      [-5.77752071e-04, -3.07194218e-02, -3.13357264e-02, ...,\n",
+       "                        1.41118700e-03,  6.12614527e-02,  2.55001243e-02],\n",
+       "                      [-1.70748532e-02,  2.77932920e-02,  5.13067888e-03, ...,\n",
+       "                       -3.03416830e-02, -1.18992000e-03, -9.29238871e-02],\n",
+       "                      ...,\n",
+       "                      [ 6.08567186e-02, -3.09913028e-02,  6.24712817e-02, ...,\n",
+       "                        2.55415663e-02,  5.63996136e-02,  5.12658581e-02],\n",
+       "                      [-3.21428478e-03,  3.66793349e-02, -1.32496789e-01, ...,\n",
+       "                        4.32726927e-02,  3.97490151e-02, -9.73474830e-02],\n",
+       "                      [-1.93562526e-02, -8.61222204e-03, -3.43473293e-02, ...,\n",
+       "                       -7.81473890e-02,  2.80602742e-02, -2.07295921e-02]],\n",
+       "              \n",
+       "                     [[ 8.56459141e-02,  7.02582160e-03, -3.84326689e-02, ...,\n",
+       "                       -3.87096703e-02,  5.14100343e-02, -1.08823977e-01],\n",
+       "                      [ 3.11664082e-02,  5.39870076e-02, -3.77238803e-02, ...,\n",
+       "                       -7.26625845e-02, -8.51336494e-03,  2.42818613e-03],\n",
+       "                      [-9.49790236e-03, -2.87521519e-02,  7.47229755e-02, ...,\n",
+       "                       -3.13882641e-02,  3.28157991e-02, -8.38298276e-02],\n",
+       "                      ...,\n",
+       "                      [-5.39512420e-03,  2.12775674e-02, -8.39983523e-02, ...,\n",
+       "                        6.08833181e-03,  1.98775176e-02,  5.47741689e-02],\n",
+       "                      [ 1.73927955e-02, -1.89691111e-02, -7.81969577e-02, ...,\n",
+       "                       -1.51080592e-02, -1.12658530e-01,  3.66142765e-03],\n",
+       "                      [ 2.85869651e-02, -7.98759833e-02, -2.40408368e-02, ...,\n",
+       "                       -4.39561494e-02, -1.08551057e-02,  6.84287250e-02]],\n",
+       "              \n",
+       "                     [[-8.98210257e-02, -8.23260564e-03, -7.24420995e-02, ...,\n",
+       "                       -8.25054646e-02,  8.48042034e-03, -3.15508172e-02],\n",
+       "                      [-2.38543581e-02, -5.01328148e-02,  8.82579293e-03, ...,\n",
+       "                        1.87256172e-01,  3.01636308e-02,  1.17524453e-01],\n",
+       "                      [ 3.30534093e-02,  5.23727853e-03, -7.37811029e-02, ...,\n",
+       "                       -7.10760653e-02, -2.29823533e-02, -2.13149209e-02],\n",
+       "                      ...,\n",
+       "                      [-2.47698408e-02,  9.20365751e-02, -3.46506089e-02, ...,\n",
+       "                        5.87393865e-02, -1.65056158e-02, -5.69600463e-02],\n",
+       "                      [ 2.32015271e-02, -5.16756326e-02,  1.28099397e-01, ...,\n",
+       "                        1.12314336e-01,  2.16532238e-02, -6.47730455e-02],\n",
+       "                      [ 2.03323364e-02, -7.36131817e-02,  1.41372532e-02, ...,\n",
+       "                        1.25761315e-01,  4.53136163e-03,  3.45687717e-02]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[-9.56907310e-03, -9.95358732e-03,  3.63281965e-02, ...,\n",
+       "                        2.58678198e-02,  4.62427326e-02, -6.91857040e-02],\n",
+       "                      [-9.87947453e-03,  8.94671008e-02, -8.27581808e-03, ...,\n",
+       "                        3.94476205e-02,  5.41206822e-02, -1.00297781e-04],\n",
+       "                      [ 1.17582083e-02,  7.56660998e-02, -1.23020314e-01, ...,\n",
+       "                        4.89301793e-02, -9.47242454e-02,  3.28166457e-03],\n",
+       "                      ...,\n",
+       "                      [ 1.15716793e-01,  3.90926264e-02, -4.99027520e-02, ...,\n",
+       "                        8.36827308e-02,  2.90968139e-02, -1.35319196e-02],\n",
+       "                      [ 9.96496007e-02,  4.21701605e-03, -9.55350790e-03, ...,\n",
+       "                        2.05535050e-02, -5.73687628e-02, -4.45158668e-02],\n",
+       "                      [ 1.23274401e-02,  4.88903075e-02, -2.19891965e-02, ...,\n",
+       "                        2.60861218e-02,  5.44191115e-02,  5.99674210e-02]],\n",
+       "              \n",
+       "                     [[-1.65354963e-02,  6.05088361e-02, -1.34862944e-01, ...,\n",
+       "                       -5.98663576e-02,  3.65664996e-02, -1.03359101e-02],\n",
+       "                      [-9.25186276e-03, -2.66341027e-02,  1.94170848e-02, ...,\n",
+       "                        2.30957083e-02, -4.58738953e-02, -4.78612706e-02],\n",
+       "                      [ 2.87209991e-02,  1.50819980e-02,  2.55784392e-02, ...,\n",
+       "                        3.31534520e-02, -3.39708515e-02,  6.50511608e-02],\n",
+       "                      ...,\n",
+       "                      [-2.69539766e-02,  4.67734933e-02, -2.07383726e-02, ...,\n",
+       "                        2.51334589e-02,  7.85554647e-02, -4.04318161e-02],\n",
+       "                      [-5.97617403e-02, -5.09780608e-02, -4.87654544e-02, ...,\n",
+       "                        7.31536280e-03, -2.58004926e-02, -1.06805447e-03],\n",
+       "                      [ 6.96763117e-03, -2.40809843e-03,  5.32752043e-03, ...,\n",
+       "                        1.89656429e-02, -2.77937427e-02, -4.43040021e-03]],\n",
+       "              \n",
+       "                     [[ 1.08559877e-01,  5.06516881e-02,  4.46610991e-03, ...,\n",
+       "                        2.41088998e-02, -5.01579493e-02, -1.30853996e-01],\n",
+       "                      [ 2.72694021e-03,  4.16806415e-02,  2.18579862e-02, ...,\n",
+       "                        8.55507031e-02,  2.64558773e-02, -2.36834567e-02],\n",
+       "                      [ 9.53411013e-02, -2.69163363e-02,  4.98878472e-02, ...,\n",
+       "                        1.33439843e-02,  6.63656220e-02,  1.11669907e-02],\n",
+       "                      ...,\n",
+       "                      [ 1.26299094e-02, -9.85859185e-02, -1.44153526e-02, ...,\n",
+       "                       -1.92226265e-02,  7.13283569e-02, -1.10161053e-02],\n",
+       "                      [ 6.45558536e-02, -7.60441087e-03,  1.30066760e-02, ...,\n",
+       "                       -3.82443629e-02,  1.06134437e-01, -1.21100806e-01],\n",
+       "                      [-4.24301848e-02, -1.86020695e-02,  1.10428683e-01, ...,\n",
+       "                        2.61989217e-02, -1.09599389e-01,  8.63663629e-02]]],\n",
+       "                    dtype=float32)>\n",
+       "              (o): <tf.Variable 'transformer/layer_._1/rel_attn/o:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[ 8.66029318e-03, -1.14577517e-01,  2.51828320e-03, ...,\n",
+       "                       -9.27881300e-02, -1.15491651e-01,  1.76676996e-02],\n",
+       "                      [-7.61712566e-02, -4.53079939e-02, -3.83440144e-02, ...,\n",
+       "                       -6.27577379e-02,  2.21626088e-03, -5.94992712e-02],\n",
+       "                      [-2.56332336e-03,  5.90471923e-02, -4.72475886e-02, ...,\n",
+       "                        3.67398188e-02, -7.33544538e-03,  3.78904641e-02],\n",
+       "                      ...,\n",
+       "                      [-2.13392675e-02,  2.53363270e-02,  6.85974360e-02, ...,\n",
+       "                        3.40457745e-02,  8.49376842e-02,  5.36587182e-03],\n",
+       "                      [ 1.60655994e-02, -7.56803527e-02,  4.73908894e-02, ...,\n",
+       "                        3.05386297e-02,  5.41357175e-02,  7.49823898e-02],\n",
+       "                      [ 4.58855778e-02,  3.71842496e-02,  7.53282160e-02, ...,\n",
+       "                        3.70172504e-03, -3.53820138e-02, -5.28645553e-02]],\n",
+       "              \n",
+       "                     [[-3.55167175e-03, -2.94522091e-04, -3.51395980e-02, ...,\n",
+       "                        3.41055691e-02,  3.03370338e-02, -5.06093465e-02],\n",
+       "                      [ 2.40699574e-02,  5.95200136e-02, -6.21140413e-02, ...,\n",
+       "                        1.14351902e-02,  1.85474288e-02,  9.06990189e-03],\n",
+       "                      [-1.19964657e-02,  8.26470368e-03,  7.37269372e-02, ...,\n",
+       "                       -1.01896927e-01, -1.25561088e-01,  5.12074912e-03],\n",
+       "                      ...,\n",
+       "                      [-1.59163550e-02,  4.47448492e-02, -5.62733822e-02, ...,\n",
+       "                       -1.58314186e-03,  3.07480115e-02,  2.12907395e-03],\n",
+       "                      [ 5.29436469e-02,  8.85004643e-03, -5.96460328e-03, ...,\n",
+       "                        3.14378440e-02, -4.15493660e-02, -2.16497947e-02],\n",
+       "                      [ 2.48335098e-04, -2.38254899e-03, -8.83876067e-03, ...,\n",
+       "                        1.26072252e-02, -3.53750363e-02,  3.07404995e-03]],\n",
+       "              \n",
+       "                     [[-8.30164403e-02, -2.34115589e-02, -4.61669937e-02, ...,\n",
+       "                       -6.64920658e-02,  6.33270964e-02, -1.78227499e-02],\n",
+       "                      [-7.69058391e-02, -7.60177821e-02,  3.90506051e-02, ...,\n",
+       "                        1.22973844e-02,  8.64065159e-03,  1.01280168e-01],\n",
+       "                      [-6.82748621e-04, -2.65821535e-02, -3.84966880e-02, ...,\n",
+       "                       -1.80162862e-02,  9.76960920e-03,  3.76105122e-02],\n",
+       "                      ...,\n",
+       "                      [-5.84762208e-02,  5.76327890e-02, -1.74372140e-02, ...,\n",
+       "                       -7.67533854e-02, -1.02110216e-02, -3.60212587e-02],\n",
+       "                      [-3.30317393e-02,  1.38184456e-02,  6.58438280e-02, ...,\n",
+       "                        1.21754026e-02,  1.70937050e-02, -1.40107097e-02],\n",
+       "                      [-5.16036898e-02, -6.22054636e-02,  1.16310194e-02, ...,\n",
+       "                        6.95217699e-02,  8.53841566e-03,  4.68714796e-02]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[ 1.17255980e-02,  7.38588301e-03,  2.76839491e-02, ...,\n",
+       "                        1.90327652e-02,  5.16140573e-02, -1.37946710e-01],\n",
+       "                      [ 2.57208347e-02,  1.09104672e-02,  3.15251462e-02, ...,\n",
+       "                        4.07493114e-02,  5.25305085e-02,  3.15010697e-02],\n",
+       "                      [ 1.89815201e-02,  6.16960227e-02,  3.34828347e-02, ...,\n",
+       "                       -1.66332368e-02, -9.41335633e-02, -3.90448980e-02],\n",
+       "                      ...,\n",
+       "                      [ 8.98937732e-02, -3.22609837e-03, -6.63657114e-02, ...,\n",
+       "                        3.03167403e-02, -6.76293130e-05,  5.02400473e-03],\n",
+       "                      [ 5.70965782e-02,  7.24036619e-03,  3.85382585e-03, ...,\n",
+       "                        9.01868120e-02, -5.91169717e-03, -6.02913462e-02],\n",
+       "                      [-5.98075092e-02, -3.06096841e-02, -1.54292081e-02, ...,\n",
+       "                        6.55795634e-02,  3.12577635e-02,  9.34221670e-02]],\n",
+       "              \n",
+       "                     [[-3.18901590e-03,  1.63269453e-02, -3.31503851e-03, ...,\n",
+       "                       -8.52069855e-02,  5.58818225e-03,  4.01768200e-02],\n",
+       "                      [ 1.10879391e-02,  3.53012718e-02,  6.00853097e-03, ...,\n",
+       "                        8.96103773e-03, -2.04980783e-02, -1.00578843e-02],\n",
+       "                      [ 6.01615310e-02,  7.26685487e-03, -1.52228177e-02, ...,\n",
+       "                        1.37231862e-02, -2.04465948e-02, -1.61056891e-02],\n",
+       "                      ...,\n",
+       "                      [-5.08951209e-02,  1.84552092e-02, -5.32345055e-03, ...,\n",
+       "                       -2.72054737e-03,  6.48149550e-02,  7.55127743e-02],\n",
+       "                      [ 1.13570224e-02, -1.89477820e-02,  2.59459894e-02, ...,\n",
+       "                       -3.25487554e-02, -5.39538898e-02, -4.34179567e-02],\n",
+       "                      [-1.20608704e-02, -5.62019320e-03, -1.85313057e-02, ...,\n",
+       "                        2.01634150e-02,  1.00505576e-02, -1.57885384e-02]],\n",
+       "              \n",
+       "                     [[-4.44078520e-02,  6.07606210e-03, -2.59394348e-02, ...,\n",
+       "                       -7.71517456e-02, -8.42755064e-02, -1.66165549e-02],\n",
+       "                      [ 1.88575257e-02,  3.10134366e-02,  3.20087746e-02, ...,\n",
+       "                        4.75202836e-02,  2.75874902e-02,  5.98586611e-02],\n",
+       "                      [ 1.48858996e-02, -2.13626288e-02, -1.11806169e-01, ...,\n",
+       "                       -3.95744778e-02, -1.11924306e-01, -4.32251021e-02],\n",
+       "                      ...,\n",
+       "                      [-3.16806063e-02,  6.08082600e-02,  5.26219085e-02, ...,\n",
+       "                       -2.04716958e-02,  3.42884101e-02,  1.69068556e-02],\n",
+       "                      [ 9.24186129e-03,  2.30468120e-02,  1.84935275e-02, ...,\n",
+       "                        3.59074026e-02,  5.17238043e-02,  1.21195316e-02],\n",
+       "                      [-2.55695079e-02,  2.09787451e-02, -8.66606180e-03, ...,\n",
+       "                        5.14007397e-02, -2.81591658e-02,  8.15731846e-03]]],\n",
+       "                    dtype=float32)>\n",
+       "              (r): <tf.Variable 'transformer/layer_._1/rel_attn/r:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[-1.46897674e-01,  1.74011409e-01, -2.07041457e-01, ...,\n",
+       "                        2.09365278e-01,  7.04047009e-02, -1.94730520e-01],\n",
+       "                      [-1.91919565e-01, -1.88010305e-01, -1.38464078e-01, ...,\n",
+       "                        1.75045997e-01,  1.83993801e-01, -1.66332796e-01],\n",
+       "                      [-1.87968820e-01,  1.81354731e-01, -1.86937690e-01, ...,\n",
+       "                       -1.73305765e-01,  1.42847419e-01,  1.37066424e-01],\n",
+       "                      ...,\n",
+       "                      [-1.81287214e-01,  1.93034187e-01,  2.10268214e-01, ...,\n",
+       "                        2.11266726e-01,  2.23274544e-01,  2.13569388e-01],\n",
+       "                      [-1.77906901e-01,  1.88187703e-01,  2.09059939e-01, ...,\n",
+       "                        2.07140788e-01,  2.14991555e-01, -2.00226620e-01],\n",
+       "                      [ 1.72938675e-01,  1.84366092e-01,  2.02027947e-01, ...,\n",
+       "                        1.92545146e-01, -1.70009255e-01,  1.74475133e-01]],\n",
+       "              \n",
+       "                     [[-9.72831920e-02,  1.58304572e-01, -1.73237279e-01, ...,\n",
+       "                        1.58044904e-01,  5.10960259e-02, -1.99876621e-01],\n",
+       "                      [-1.29664943e-01, -1.37299687e-01, -1.13309212e-01, ...,\n",
+       "                        1.44313514e-01,  1.40009508e-01, -1.26466140e-01],\n",
+       "                      [-1.62108094e-01,  1.70799494e-01, -1.40059158e-01, ...,\n",
+       "                       -1.51002154e-01,  8.46845284e-02,  1.36088893e-01],\n",
+       "                      ...,\n",
+       "                      [-1.32899761e-01,  1.71471238e-01,  1.51986942e-01, ...,\n",
+       "                        1.66069463e-01,  1.65516198e-01,  1.63684517e-01],\n",
+       "                      [-1.30655318e-01,  1.75758496e-01,  1.73514783e-01, ...,\n",
+       "                        1.73679933e-01,  1.55112520e-01, -1.70741528e-01],\n",
+       "                      [ 1.23091467e-01,  1.46520704e-01,  1.53373584e-01, ...,\n",
+       "                        1.40420586e-01, -1.25283971e-01,  1.81063727e-01]],\n",
+       "              \n",
+       "                     [[-8.82046670e-02,  1.20563805e-01, -1.54819176e-01, ...,\n",
+       "                        1.37534931e-01,  7.11622387e-02, -1.69938922e-01],\n",
+       "                      [-1.27852052e-01, -1.35840997e-01, -8.00763592e-02, ...,\n",
+       "                        1.18804909e-01,  1.17752388e-01, -6.82469532e-02],\n",
+       "                      [-1.27978489e-01,  1.30864084e-01, -1.21015176e-01, ...,\n",
+       "                       -1.36511073e-01,  9.61252674e-02,  8.98678079e-02],\n",
+       "                      ...,\n",
+       "                      [-1.27951488e-01,  1.54330939e-01,  1.37083441e-01, ...,\n",
+       "                        1.36708304e-01,  1.42049015e-01,  1.24714136e-01],\n",
+       "                      [-8.22131708e-02,  8.92748907e-02,  1.30160138e-01, ...,\n",
+       "                        1.36945337e-01,  1.26669794e-01, -1.22825712e-01],\n",
+       "                      [ 1.11137711e-01,  1.09357782e-01,  1.39476791e-01, ...,\n",
+       "                        1.16972752e-01, -1.02480344e-01,  1.31967843e-01]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[ 9.53109644e-04,  2.36279629e-02,  2.00178288e-03, ...,\n",
+       "                        5.88640803e-03,  3.05523304e-03, -7.16660544e-03],\n",
+       "                      [-1.66137051e-02,  2.43202504e-02,  1.39665473e-02, ...,\n",
+       "                        1.29140597e-02,  3.85063398e-03,  8.05215444e-03],\n",
+       "                      [-1.17559778e-03,  1.35235796e-02,  1.29539445e-02, ...,\n",
+       "                        1.29707437e-02,  5.79934474e-03, -1.83496403e-03],\n",
+       "                      ...,\n",
+       "                      [-4.06753412e-03,  5.26591064e-03, -8.99039581e-03, ...,\n",
+       "                        4.24702466e-02,  2.50355471e-02, -1.18161682e-02],\n",
+       "                      [ 1.86481122e-02,  4.72524873e-04, -2.97491509e-03, ...,\n",
+       "                       -7.89663754e-04,  1.45817995e-02,  1.99292991e-02],\n",
+       "                      [ 6.24428876e-03,  4.76739649e-03, -2.52191699e-03, ...,\n",
+       "                        1.14012184e-03,  1.34989284e-02,  2.64687147e-02]],\n",
+       "              \n",
+       "                     [[ 1.98490229e-02,  1.32721895e-02,  2.04636739e-03, ...,\n",
+       "                       -1.59615539e-02,  3.51932757e-02,  1.42656248e-02],\n",
+       "                      [-4.00670309e-04, -3.32874944e-04,  2.40566581e-02, ...,\n",
+       "                        1.08023062e-02, -1.90807581e-02, -5.00886608e-03],\n",
+       "                      [-1.52654015e-02,  1.49440160e-02, -2.63901725e-02, ...,\n",
+       "                       -1.51216965e-02,  6.56380411e-03, -1.47011476e-02],\n",
+       "                      ...,\n",
+       "                      [-2.04982725e-03, -1.84093118e-02, -8.56019929e-03, ...,\n",
+       "                       -5.50516229e-03, -1.67570729e-02,  1.74919405e-04],\n",
+       "                      [-9.94952582e-03, -4.25786190e-02, -1.12591460e-02, ...,\n",
+       "                       -1.10278605e-02, -1.64491571e-02,  8.36265925e-03],\n",
+       "                      [ 2.35332940e-02, -4.40680422e-03, -1.85185752e-03, ...,\n",
+       "                        1.28285857e-02, -3.74334864e-02, -6.49360567e-03]],\n",
+       "              \n",
+       "                     [[-4.03778590e-02,  3.10220500e-03, -3.23167108e-02, ...,\n",
+       "                        1.71264191e-03,  5.96588850e-03, -2.12317165e-02],\n",
+       "                      [-2.02080980e-02, -7.53459148e-03, -4.10040235e-03, ...,\n",
+       "                        3.79406707e-03,  2.68777627e-02, -1.61216389e-02],\n",
+       "                      [-4.50483896e-03,  7.15539558e-03, -9.55935009e-03, ...,\n",
+       "                       -4.80790297e-03,  2.41799094e-03, -3.76463821e-03],\n",
+       "                      ...,\n",
+       "                      [-1.57353263e-02,  8.99432600e-03,  5.29706152e-03, ...,\n",
+       "                        1.19281923e-02,  9.35687870e-03, -2.13156436e-02],\n",
+       "                      [ 8.13638791e-03,  9.65433847e-03, -9.12594423e-03, ...,\n",
+       "                        2.02135020e-03, -4.37395182e-03, -6.05759968e-04],\n",
+       "                      [-2.53979210e-02,  8.30472796e-04,  1.21758673e-02, ...,\n",
+       "                        8.98340251e-03,  2.04570275e-02,  8.64630472e-03]]],\n",
+       "                    dtype=float32)>\n",
+       "              (r_r_bias): <tf.Variable 'transformer/layer_._1/rel_attn/r_r_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "              array([[ 0.14899914, -0.34153602,  0.3803297 ,  0.36917952, -0.38786203,\n",
+       "                      -0.13080384,  0.344216  , -0.35379156, -0.3844165 , -0.36286288,\n",
+       "                      -0.08941454,  0.37458393],\n",
+       "                     [ 0.33911064,  0.32911122,  0.31310028,  0.29833585, -0.30792385,\n",
+       "                       0.33739606, -0.32293308,  0.3369534 , -0.31201705, -0.3280124 ,\n",
+       "                      -0.32297572,  0.3089489 ],\n",
+       "                     [ 0.36541435, -0.36004987,  0.35938582, -0.36907914,  0.3486618 ,\n",
+       "                      -0.0593513 , -0.34139338,  0.35678086, -0.36190793,  0.34279796,\n",
+       "                      -0.31591862, -0.29939887],\n",
+       "                     [-0.28541145, -0.28479883,  0.2857083 ,  0.29083747, -0.28382772,\n",
+       "                      -0.27742648,  0.27382922, -0.262767  , -0.28953055,  0.22580072,\n",
+       "                       0.2792229 ,  0.26833603],\n",
+       "                     [-0.31788912,  0.32046515,  0.30290008,  0.31088528, -0.31547454,\n",
+       "                       0.30249548, -0.26167852,  0.30141065, -0.32778227,  0.30795413,\n",
+       "                      -0.31171426, -0.25726327],\n",
+       "                     [ 0.314079  , -0.30792624, -0.3221542 , -0.30551824,  0.24594624,\n",
+       "                       0.31892028, -0.3053024 , -0.00082669,  0.29853317, -0.29422322,\n",
+       "                       0.30099693,  0.2978344 ],\n",
+       "                     [-0.37505603,  0.3527668 , -0.35440302,  0.30887768,  0.35537973,\n",
+       "                       0.34240764, -0.36563224, -0.32328182,  0.3066197 ,  0.3783165 ,\n",
+       "                       0.36704957, -0.07152183],\n",
+       "                     [-0.24481814, -0.25152895, -0.26902637, -0.25899634,  0.26075813,\n",
+       "                       0.25052536, -0.18769039,  0.24073453, -0.23911558, -0.264942  ,\n",
+       "                      -0.24604012, -0.25978062],\n",
+       "                     [ 0.3448066 ,  0.35508814,  0.3277917 , -0.36480623, -0.36373508,\n",
+       "                       0.34252417, -0.26490748, -0.3698438 , -0.37082767, -0.38157573,\n",
+       "                      -0.35605282, -0.34466416],\n",
+       "                     [ 0.30798635,  0.36460385, -0.3754039 ,  0.3400862 , -0.35259473,\n",
+       "                       0.34701774,  0.18916364, -0.3498748 , -0.356646  , -0.36569807,\n",
+       "                      -0.36399728, -0.30652383],\n",
+       "                     [ 0.25416747, -0.27864173,  0.24143916,  0.2589485 ,  0.26826364,\n",
+       "                      -0.276374  ,  0.28044358, -0.26923546, -0.23912592, -0.272487  ,\n",
+       "                      -0.26509777,  0.27066582],\n",
+       "                     [-0.2960118 , -0.29988503, -0.29283497,  0.2847119 ,  0.30326426,\n",
+       "                      -0.29098433,  0.29103255, -0.29597896,  0.27998862,  0.29750696,\n",
+       "                       0.3016155 , -0.2862795 ],\n",
+       "                     [-0.33974963, -0.3114596 , -0.3245498 , -0.33191413, -0.26564565,\n",
+       "                      -0.31937695,  0.32511777, -0.3418174 ,  0.3280482 , -0.32252905,\n",
+       "                       0.31764168, -0.3219256 ],\n",
+       "                     [ 0.36129203, -0.3835813 , -0.34948146, -0.38187614, -0.10551658,\n",
+       "                      -0.35736713,  0.36742166, -0.10739829,  0.3812859 , -0.38279817,\n",
+       "                      -0.38232875, -0.37825328],\n",
+       "                     [ 0.3321833 , -0.33618993, -0.35035315, -0.11618523, -0.31958073,\n",
+       "                      -0.34353533, -0.3631967 , -0.32926843, -0.3406108 , -0.40713176,\n",
+       "                      -0.35072395,  0.3597266 ],\n",
+       "                     [-0.35400867, -0.35107192, -0.37232462, -0.37361598,  0.36000717,\n",
+       "                      -0.33463717,  0.38095737, -0.34364143, -0.33852988, -0.35104772,\n",
+       "                       0.2981984 , -0.3554742 ]], dtype=float32)>\n",
+       "              (r_s_bias): <tf.Variable 'transformer/layer_._1/rel_attn/r_s_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "              array([[0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.]], dtype=float32)>\n",
+       "              (r_w_bias): <tf.Variable 'transformer/layer_._1/rel_attn/r_w_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "              array([[-4.62216102e-02,  1.16589062e-01, -1.36763275e-01,\n",
+       "                      -1.22126430e-01,  1.48961708e-01,  1.45974793e-02,\n",
+       "                      -1.61591738e-01,  1.87203407e-01,  2.07243934e-01,\n",
+       "                       1.52396217e-01,  2.49146335e-02, -2.02902481e-01],\n",
+       "                     [-1.07586920e-01, -1.06996477e-01, -7.84136206e-02,\n",
+       "                      -5.37643544e-02,  8.04927945e-02, -1.09561071e-01,\n",
+       "                       1.08106196e-01, -1.32538766e-01,  9.16128457e-02,\n",
+       "                       6.15168475e-02,  6.16029464e-02, -6.31495491e-02],\n",
+       "                     [-1.13178924e-01,  1.40476599e-01, -1.35648683e-01,\n",
+       "                       1.80651262e-01, -9.42587331e-02,  4.49052267e-02,\n",
+       "                       1.27758279e-01, -3.65762338e-02,  1.44819573e-01,\n",
+       "                      -1.08886130e-01,  7.25614876e-02,  5.72540285e-03],\n",
+       "                     [ 1.28033966e-01,  4.27292474e-02, -5.35008721e-02,\n",
+       "                      -1.09917521e-01,  4.55539674e-02,  9.57781374e-02,\n",
+       "                      -1.04749307e-01,  5.18838726e-02,  8.35832134e-02,\n",
+       "                      -1.41942231e-02, -7.90465996e-02, -1.42346501e-01],\n",
+       "                     [ 7.61313289e-02, -4.59336676e-02, -1.19175784e-01,\n",
+       "                      -8.25000405e-02,  1.09469183e-01, -1.36095643e-01,\n",
+       "                       2.47284826e-02, -2.28797179e-02,  1.37981102e-01,\n",
+       "                      -1.14949889e-01,  4.44846004e-02,  3.99738923e-02],\n",
+       "                     [-1.65838182e-01,  9.48740020e-02,  1.44404322e-01,\n",
+       "                       8.53616223e-02, -2.70830076e-02, -6.19642437e-02,\n",
+       "                       8.94338936e-02,  7.70374341e-03, -8.17450806e-02,\n",
+       "                       1.17244996e-01, -7.69629925e-02, -1.09416604e-01],\n",
+       "                     [ 1.57854617e-01, -1.56897545e-01,  1.29691288e-01,\n",
+       "                      -8.42681080e-02, -8.85965973e-02, -1.28146768e-01,\n",
+       "                       8.91689807e-02,  1.08561374e-01, -9.64733809e-02,\n",
+       "                      -1.55561730e-01, -8.79286975e-02, -1.13232369e-02],\n",
+       "                     [ 7.38919228e-02,  1.09030314e-01,  6.82480931e-02,\n",
+       "                       5.55296168e-02, -6.17072172e-02, -1.04720660e-01,\n",
+       "                      -6.92145200e-03, -3.91406119e-02,  4.73909490e-02,\n",
+       "                       7.34069794e-02,  5.68175763e-02,  4.85593155e-02],\n",
+       "                     [-1.74990490e-01, -1.20659910e-01, -1.35730013e-01,\n",
+       "                       1.51203781e-01,  1.48414791e-01, -7.34399632e-02,\n",
+       "                       7.54770786e-02,  2.29218081e-01,  9.63332728e-02,\n",
+       "                       1.05563387e-01,  1.79456845e-01,  1.29063517e-01],\n",
+       "                     [-4.34173606e-02, -1.30563438e-01,  1.60625249e-01,\n",
+       "                      -1.41897142e-01,  1.51958242e-01, -6.46752417e-02,\n",
+       "                       1.28286381e-04,  5.29836081e-02,  1.19528137e-01,\n",
+       "                       2.21275479e-01,  1.76483870e-01,  5.65731786e-02],\n",
+       "                     [ 7.86350667e-03,  1.22386105e-01, -3.76115479e-02,\n",
+       "                      -3.60284224e-02, -9.76402089e-02,  1.65668249e-01,\n",
+       "                      -8.34911838e-02,  7.12872595e-02,  3.44360694e-02,\n",
+       "                       7.70075917e-02,  6.81297109e-02, -3.08290645e-02],\n",
+       "                     [ 1.20040596e-01,  6.12675473e-02,  1.29310817e-01,\n",
+       "                      -7.74290562e-02, -7.78047889e-02,  8.89190733e-02,\n",
+       "                      -3.96793000e-02,  7.09067658e-02, -7.84836560e-02,\n",
+       "                      -5.97045012e-02, -5.77512644e-02,  1.05530277e-01],\n",
+       "                     [ 5.21370508e-02,  9.81653333e-02,  1.14423938e-01,\n",
+       "                       1.14286542e-01,  5.82821295e-02,  1.18820079e-01,\n",
+       "                      -8.86438638e-02,  5.43031134e-02, -8.52945074e-02,\n",
+       "                       8.23517442e-02, -9.12688896e-02,  3.97731513e-02],\n",
+       "                     [-9.26975161e-02,  1.76723376e-01,  1.12929732e-01,\n",
+       "                       1.46531433e-01,  9.49880015e-03,  1.27589166e-01,\n",
+       "                      -2.04214618e-01,  3.05328611e-03, -1.69557929e-01,\n",
+       "                       1.36818811e-01,  9.52240303e-02,  2.15536699e-01],\n",
+       "                     [-5.74819483e-02,  5.62564880e-02,  1.98273271e-01,\n",
+       "                      -1.17968698e-03,  1.26326323e-01,  1.54033735e-01,\n",
+       "                       1.18295722e-01,  4.89505827e-02,  1.98732257e-01,\n",
+       "                       1.31851271e-01,  1.58291176e-01, -1.05149098e-01],\n",
+       "                     [ 8.80631879e-02,  1.58400908e-01,  1.52702242e-01,\n",
+       "                       1.10614061e-01, -8.25159028e-02,  2.31264345e-02,\n",
+       "                      -1.75350800e-01,  9.48455557e-02,  8.91729742e-02,\n",
+       "                       1.68625101e-01, -4.55371849e-02,  1.06890120e-01]], dtype=float32)>\n",
+       "              (seg_embed): <tf.Variable 'transformer/layer_._1/rel_attn/seg_embed:0' shape=(2, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[ 7.61602633e-03, -1.85396653e-02,  1.41175482e-02,\n",
+       "                        1.02747520e-02, -1.02692777e-02, -5.79114538e-03,\n",
+       "                       -2.25887215e-03,  1.97049114e-03,  5.02155814e-03,\n",
+       "                       -6.39485754e-03, -4.06287983e-03,  1.60969961e-02],\n",
+       "                      [-1.68735627e-02, -4.82341414e-03,  6.73457189e-03,\n",
+       "                        9.00006853e-04, -2.81745940e-03, -5.75073343e-03,\n",
+       "                        6.85399212e-03, -3.11884983e-03,  1.24747735e-02,\n",
+       "                       -5.00333635e-03,  1.04523534e-02, -9.33902338e-03],\n",
+       "                      [ 3.03338887e-03,  1.81995309e-03, -4.44657216e-03,\n",
+       "                       -6.89545879e-04,  8.68439456e-05,  4.08066344e-03,\n",
+       "                        6.55966694e-04, -1.95205770e-02, -2.45983759e-03,\n",
+       "                        2.33589532e-03,  3.92747996e-03, -1.79917943e-02],\n",
+       "                      [-7.01340672e-04,  1.79661233e-02, -1.47282165e-02,\n",
+       "                       -1.05006841e-03,  1.18477382e-02,  4.56858613e-03,\n",
+       "                       -1.35715781e-02,  1.63909830e-02, -1.83726789e-03,\n",
+       "                       -4.62263270e-05, -1.51350088e-02,  1.84442364e-02],\n",
+       "                      [ 3.17642442e-03, -1.64884496e-02,  1.18464208e-03,\n",
+       "                        6.03873935e-03,  1.23784514e-02, -6.32783957e-03,\n",
+       "                        3.94236110e-03,  7.08509982e-03,  1.44205999e-03,\n",
+       "                        8.04485381e-03,  3.18194245e-04, -3.99992894e-03],\n",
+       "                      [-1.37944268e-02, -4.84130438e-03,  1.68232359e-02,\n",
+       "                        1.21006211e-02,  1.01589188e-02, -8.44671298e-03,\n",
+       "                       -1.34035468e-03, -2.33793142e-03,  1.44077949e-02,\n",
+       "                        1.12157769e-03,  9.63134400e-04, -1.19164761e-03],\n",
+       "                      [-5.74960979e-03,  6.86749723e-03,  1.20431418e-02,\n",
+       "                       -4.14077239e-03, -1.14332717e-02,  1.46603184e-02,\n",
+       "                       -2.92793987e-03, -5.18011584e-05,  5.89169236e-03,\n",
+       "                        5.62065002e-03, -1.54455882e-02, -1.93359759e-02],\n",
+       "                      [-1.32184587e-02, -8.09574313e-03,  1.73612162e-02,\n",
+       "                        1.75058469e-02,  1.21301925e-02,  1.62602477e-02,\n",
+       "                       -1.33753968e-02,  3.75581020e-03, -4.20281896e-03,\n",
+       "                        1.55054042e-02, -1.15841664e-02, -2.08650995e-03],\n",
+       "                      [ 7.34686246e-03,  1.02794832e-02,  1.31241558e-03,\n",
+       "                        2.87566753e-03,  5.84390247e-03,  3.02153081e-03,\n",
+       "                       -7.33443536e-03, -7.87269603e-03,  4.51662997e-03,\n",
+       "                        2.32343981e-03,  9.98496637e-03, -9.53329075e-03],\n",
+       "                      [ 9.44391824e-03, -1.56681787e-03,  5.64246729e-04,\n",
+       "                        8.50769039e-03, -5.61839016e-03,  1.00806393e-02,\n",
+       "                        4.45341272e-03,  1.17781861e-02, -9.62750241e-03,\n",
+       "                        1.01322914e-02,  1.13904784e-02, -2.56038038e-03],\n",
+       "                      [-6.31258730e-03, -7.30622979e-03, -4.83252574e-03,\n",
+       "                        1.29672261e-02, -2.86618783e-03, -6.99736294e-04,\n",
+       "                        8.63193162e-03,  1.24630332e-02, -1.86973754e-02,\n",
+       "                        9.60467104e-03,  4.52060765e-03,  7.15382455e-04],\n",
+       "                      [ 6.44308235e-03,  9.21295118e-03, -1.06562199e-02,\n",
+       "                        5.58915641e-03,  5.59847150e-03, -1.35788438e-03,\n",
+       "                       -9.19332448e-03, -2.69832183e-03, -3.68528347e-03,\n",
+       "                        1.15745421e-02, -1.17136361e-02, -1.45567106e-02],\n",
+       "                      [ 2.83513777e-03,  3.74191441e-04, -1.22113694e-02,\n",
+       "                        6.28614333e-03,  7.08920229e-03, -8.08887556e-03,\n",
+       "                        1.31595219e-02,  1.39163062e-03, -3.51439044e-03,\n",
+       "                       -4.80555138e-03,  1.24805709e-02,  4.39498993e-03],\n",
+       "                      [-6.46104245e-03, -1.21651953e-02,  4.77740867e-03,\n",
+       "                        1.86753627e-02,  6.51393831e-03,  5.62973600e-03,\n",
+       "                       -8.28108564e-03, -4.60683648e-03, -2.26973137e-03,\n",
+       "                        1.69612304e-03,  1.37645304e-02,  4.08384204e-03],\n",
+       "                      [ 1.00966161e-02,  4.48917999e-04, -7.04559498e-03,\n",
+       "                        8.03261995e-03, -8.51394236e-03, -1.22877944e-03,\n",
+       "                        1.14519382e-02,  1.36096608e-02,  1.72907033e-03,\n",
+       "                        7.85259437e-03,  1.05255041e-02,  8.69190600e-03],\n",
+       "                      [-8.03734455e-03, -1.39566569e-03,  2.11605406e-03,\n",
+       "                       -1.92271248e-02,  6.85958471e-03,  4.88640182e-03,\n",
+       "                       -1.38192775e-03, -1.90305218e-04,  4.97502321e-03,\n",
+       "                       -2.50085886e-03, -7.32155377e-03, -1.67938080e-02]],\n",
+       "              \n",
+       "                     [[ 1.62638456e-03,  2.68377247e-03,  3.17260344e-03,\n",
+       "                        5.79241151e-03, -7.17955036e-03,  8.01912975e-03,\n",
+       "                       -1.63808875e-02, -9.24083032e-03,  3.45636159e-03,\n",
+       "                       -1.23387324e-02, -7.20368931e-04, -9.56835225e-03],\n",
+       "                      [ 9.82169900e-03,  1.30084464e-02, -8.22803937e-03,\n",
+       "                        6.71537360e-04,  9.21022613e-03,  1.52312005e-02,\n",
+       "                       -5.26927318e-03,  1.06863305e-02,  2.06984673e-03,\n",
+       "                       -3.76264495e-03,  7.69555243e-07, -4.93265106e-04],\n",
+       "                      [ 2.69030291e-03,  1.87809858e-02,  6.67323358e-03,\n",
+       "                       -4.26321942e-03,  4.72564157e-03, -1.31812878e-02,\n",
+       "                       -7.40861241e-03, -2.29317695e-03, -1.57082290e-03,\n",
+       "                       -1.32690351e-02, -1.30699258e-02,  1.92320778e-03],\n",
+       "                      [ 9.12022125e-03, -5.23217348e-03, -2.81146332e-03,\n",
+       "                       -4.00763704e-03,  5.03227348e-03,  5.72717097e-03,\n",
+       "                        2.91952444e-03,  1.11247518e-03,  9.63956481e-05,\n",
+       "                       -4.55610408e-03, -8.37675110e-03,  1.22519284e-02],\n",
+       "                      [-1.25213778e-02,  8.71963392e-04,  5.76882577e-03,\n",
+       "                       -9.85392556e-03,  5.49371168e-03, -1.67311262e-02,\n",
+       "                        5.46998065e-03,  4.39474359e-03,  2.89234682e-03,\n",
+       "                        6.99596014e-03,  6.47728844e-03, -1.53464787e-02],\n",
+       "                      [-1.01970322e-02, -1.51678976e-02,  6.84761163e-03,\n",
+       "                       -1.76049639e-02, -6.48754463e-03, -7.78641377e-04,\n",
+       "                       -1.47116324e-02,  5.12523763e-03, -2.96233199e-03,\n",
+       "                        7.93477241e-03,  1.36973644e-02,  1.22740660e-02],\n",
+       "                      [-3.13485460e-03, -1.59246139e-02, -2.70899059e-03,\n",
+       "                        5.44029754e-03,  7.52424821e-03,  7.31652137e-03,\n",
+       "                        8.10533017e-03, -1.90883912e-02,  5.15720714e-03,\n",
+       "                        3.53280571e-04,  6.17373036e-03,  1.06591405e-03],\n",
+       "                      [-1.56332664e-02,  1.97712099e-04,  2.64872634e-03,\n",
+       "                        3.45370430e-03, -4.22930811e-03,  1.24690169e-02,\n",
+       "                        5.05634700e-04,  1.37720944e-03, -6.16728095e-03,\n",
+       "                       -7.40552146e-04,  1.39584523e-02, -7.06139440e-03],\n",
+       "                      [ 9.77421529e-04,  3.80252837e-03, -7.89496861e-03,\n",
+       "                       -1.29530979e-02,  1.14574879e-02, -2.45792069e-03,\n",
+       "                        3.06926225e-03,  4.14119754e-03,  8.37595493e-04,\n",
+       "                       -6.71465555e-03,  1.04225632e-02,  8.42171349e-03],\n",
+       "                      [ 1.56976059e-02, -4.26411582e-03, -1.29620070e-02,\n",
+       "                        1.14640398e-02, -1.17234429e-02, -2.09121429e-03,\n",
+       "                        5.49160130e-03,  9.51116718e-03, -2.61860876e-03,\n",
+       "                        1.29721547e-03,  5.72805619e-03, -1.54486364e-02],\n",
+       "                      [-3.25736636e-03,  1.26759680e-02,  1.27404844e-02,\n",
+       "                        1.17001981e-02, -1.16444677e-02, -9.64581780e-03,\n",
+       "                       -2.40927562e-03, -5.55342529e-03,  9.27424431e-03,\n",
+       "                       -1.71160791e-04,  1.56472288e-02, -6.92155631e-03],\n",
+       "                      [ 7.27083022e-03, -4.46589151e-03,  1.09822885e-03,\n",
+       "                        2.19783024e-03, -8.46979953e-03, -1.37587897e-02,\n",
+       "                        8.10799282e-03, -7.17377802e-03,  8.80086981e-03,\n",
+       "                       -7.99593702e-03,  6.07788330e-03, -7.93825951e-04],\n",
+       "                      [ 1.49642804e-03, -1.11999689e-02,  4.39703232e-03,\n",
+       "                        4.85239923e-03,  1.54058973e-03, -1.47980507e-02,\n",
+       "                       -6.85563916e-03,  6.63761189e-03, -1.56310081e-04,\n",
+       "                       -6.49932865e-03,  3.30587942e-03, -1.08573148e-02],\n",
+       "                      [-2.20668572e-03,  4.14557988e-03, -1.93234999e-02,\n",
+       "                       -5.82999643e-03,  3.43196769e-03,  5.27025107e-03,\n",
+       "                        8.35015997e-03, -4.63553797e-03, -6.61056815e-03,\n",
+       "                       -3.66679509e-03,  4.02782438e-03, -3.52020166e-03],\n",
+       "                      [ 6.47542719e-03,  9.46311373e-03, -5.95815713e-03,\n",
+       "                       -3.98951210e-03, -1.26922242e-02, -8.83757137e-04,\n",
+       "                       -5.64072188e-03,  1.16748745e-02,  2.87583284e-03,\n",
+       "                       -2.04839162e-03, -9.87775158e-03,  8.34393501e-03],\n",
+       "                      [-5.55553939e-03, -2.07615201e-03, -5.13571315e-03,\n",
+       "                       -1.45472540e-02, -1.17446017e-02, -1.51618780e-03,\n",
+       "                       -2.92225089e-03, -1.33080781e-02, -6.99464139e-03,\n",
+       "                       -1.41988527e-02, -1.21150836e-02,  1.95427015e-02]]],\n",
+       "                    dtype=float32)>\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "            (ff): TFXLNetFeedForward(\n",
+       "              (layer_norm): LayerNormalization(\n",
+       "                (axis): List(\n",
+       "                  (0): 2\n",
+       "                )\n",
+       "                (gamma): <tf.Variable 'transformer/layer_._1/ff/layer_norm/gamma:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([1.0242676 , 1.0201554 , 0.981655  , 1.022025  , 1.007073  ,\n",
+       "                       1.045315  , 1.0340022 , 1.0059034 , 0.99349135, 1.0217655 ,\n",
+       "                       1.0187205 , 1.025378  , 0.994724  , 1.0449401 , 0.9978945 ,\n",
+       "                       0.9911819 , 1.0020549 , 0.9941773 , 1.0036273 , 1.0188001 ,\n",
+       "                       1.0051787 , 1.1197566 , 1.02651   , 1.0183053 , 0.98811615,\n",
+       "                       0.99960953, 0.9662069 , 1.023346  , 1.0210128 , 1.0216892 ,\n",
+       "                       0.9806572 , 1.0309644 , 1.0199112 , 1.0103893 , 0.9986699 ,\n",
+       "                       1.0303093 , 1.0149937 , 1.0205405 , 1.0189662 , 0.9963332 ,\n",
+       "                       1.0298607 , 1.0065924 , 1.0308235 , 1.0236278 , 1.0338595 ,\n",
+       "                       0.9944997 , 1.0148902 , 1.0015576 , 1.0081712 , 1.0300711 ,\n",
+       "                       1.0326444 , 0.9802065 , 1.031543  , 1.0039631 , 1.025484  ,\n",
+       "                       1.0000758 , 0.9787232 , 0.99785537, 1.0325978 , 0.9884796 ,\n",
+       "                       1.018895  , 0.98055667, 1.0263902 , 1.0205623 , 1.0014325 ,\n",
+       "                       1.0014066 , 0.98294795, 1.0587208 , 1.0157356 , 1.0120552 ,\n",
+       "                       1.0324315 , 1.0007839 , 0.99985874, 1.0201912 , 1.0071391 ,\n",
+       "                       1.00749   , 0.9991882 , 1.0052526 , 0.9652451 , 1.0244923 ,\n",
+       "                       1.0113801 , 0.9739409 , 0.9995484 , 1.0089414 , 1.0357728 ,\n",
+       "                       1.0092472 , 1.0074127 , 0.99813294, 1.0280186 , 0.99566907,\n",
+       "                       1.033792  , 0.99090743, 0.98742676, 1.00218   , 0.9944762 ,\n",
+       "                       1.0180073 , 1.0204257 , 0.9978386 , 1.0030422 , 1.0376201 ,\n",
+       "                       1.0196778 , 1.0020446 , 0.9946544 , 1.0287017 , 1.0023233 ,\n",
+       "                       1.0151851 , 1.0085427 , 1.0258116 , 1.0106041 , 0.9923284 ,\n",
+       "                       1.0228347 , 1.0039704 , 0.99091953, 0.9823107 , 1.016947  ,\n",
+       "                       1.0215237 , 1.0077496 , 1.0370032 , 0.9993619 , 1.0059168 ,\n",
+       "                       0.9826532 , 1.0285178 , 1.0367659 , 1.0070248 , 1.0034032 ,\n",
+       "                       1.0442673 , 0.99493504, 1.004249  , 1.0280426 , 1.0017502 ,\n",
+       "                       0.988515  , 0.9967804 , 1.0113221 , 1.0154219 , 1.0005659 ,\n",
+       "                       1.0015084 , 0.99482644, 1.0037222 , 1.009357  , 1.0022448 ,\n",
+       "                       0.9883776 , 1.0405829 , 1.0310917 , 0.9933524 , 1.0433357 ,\n",
+       "                       0.9818653 , 1.0083051 , 1.0214539 , 0.9923552 , 1.0301536 ,\n",
+       "                       1.0080968 , 0.9818375 , 0.9923027 , 1.0172874 , 0.98352754,\n",
+       "                       1.0107327 , 1.0151389 , 1.0274394 , 0.983884  , 1.0131593 ,\n",
+       "                       0.99889815, 1.0262815 , 0.96433216, 1.0211636 , 1.0312902 ,\n",
+       "                       1.0047783 , 0.9924638 , 1.0092816 , 0.9730608 , 0.9828258 ,\n",
+       "                       1.0578774 , 1.0200232 , 0.98963594, 0.9977363 , 1.0138032 ,\n",
+       "                       0.9713009 , 1.0304941 , 1.0180733 , 1.0288314 , 0.9973552 ,\n",
+       "                       1.0352954 , 1.0003406 , 0.98862803, 1.0030655 , 0.9941499 ,\n",
+       "                       1.0280615 , 1.0016365 , 1.0180489 , 1.0040277 , 0.9607358 ,\n",
+       "                       1.0037141 , 1.0396017 ], dtype=float32)>\n",
+       "                (beta): <tf.Variable 'transformer/layer_._1/ff/layer_norm/beta:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([ 3.43603594e-03,  2.67952736e-02, -3.19796521e-03,  2.77959052e-02,\n",
+       "                       -2.27564160e-05,  3.00053079e-02,  4.48617749e-02,  1.97070669e-02,\n",
+       "                        1.02396915e-02,  1.72215980e-02, -2.75892112e-03, -2.48206849e-03,\n",
+       "                        2.81982850e-02, -1.42260175e-02, -5.90529153e-03,  1.90874767e-02,\n",
+       "                       -2.45346106e-03,  9.29297972e-03,  4.25612368e-03, -1.09480857e-03,\n",
+       "                       -9.13006626e-03,  9.24918726e-02,  2.37285383e-02,  2.87201833e-02,\n",
+       "                       -1.14277247e-02,  1.90680362e-02, -5.39551210e-03,  4.02982607e-02,\n",
+       "                       -2.37562824e-02, -1.89014245e-02,  6.41179970e-03, -8.68414938e-02,\n",
+       "                       -1.77674480e-02, -1.51537284e-02, -3.89129203e-03,  8.26284010e-03,\n",
+       "                        3.10518011e-03,  4.06105816e-03,  2.47969031e-02,  2.05240212e-03,\n",
+       "                        3.35611892e-03,  3.25422660e-02, -3.05853598e-02, -4.77116788e-03,\n",
+       "                        3.65033038e-02,  1.88807324e-02,  2.03111116e-02, -8.56510364e-03,\n",
+       "                        2.65865661e-02,  1.14510898e-02,  1.09779397e-02,  2.67214663e-02,\n",
+       "                       -4.07271273e-03, -2.48218258e-03,  1.46750696e-02,  1.35427015e-02,\n",
+       "                       -4.20185179e-03, -2.13467292e-02, -2.53253579e-02, -5.92954690e-03,\n",
+       "                        1.69605445e-02, -1.05276778e-02,  4.37114276e-02, -1.17301363e-02,\n",
+       "                        2.32506916e-03, -1.35039715e-02, -2.17513070e-02, -3.11144497e-02,\n",
+       "                       -1.43129388e-02, -1.83722116e-02, -1.85610689e-02, -1.80336367e-02,\n",
+       "                       -2.43042596e-02, -1.66123174e-02, -2.11378951e-02, -7.68155232e-03,\n",
+       "                       -2.80298945e-02, -1.23204431e-02, -7.89987575e-03, -3.82007994e-02,\n",
+       "                       -1.71284825e-02,  1.24480464e-02,  2.00545415e-02, -2.08343454e-02,\n",
+       "                        1.72695480e-02,  2.07619276e-02,  2.32151970e-02,  1.25586363e-02,\n",
+       "                        1.58736091e-02, -1.25755509e-03, -2.24005152e-02, -1.52119324e-02,\n",
+       "                       -1.03766266e-02,  1.39645461e-04,  2.10134406e-02, -3.91801484e-02,\n",
+       "                       -1.45232119e-02,  7.89888389e-03,  1.21645015e-02, -2.37555783e-02,\n",
+       "                       -5.84158637e-02,  1.74354929e-02,  1.84537917e-02,  2.19647903e-02,\n",
+       "                        2.39719935e-02,  4.19057608e-02,  1.49248559e-02,  2.69626584e-02,\n",
+       "                        2.89687188e-03, -1.89197827e-02, -3.71705405e-02, -2.37737875e-02,\n",
+       "                       -1.55493245e-02,  2.42294502e-02,  2.57444680e-02,  6.11581467e-03,\n",
+       "                       -2.08301488e-02,  1.96516458e-02, -1.59827378e-02, -8.61831009e-03,\n",
+       "                       -8.13416112e-03, -3.82699817e-02, -3.71116959e-02,  1.84831508e-02,\n",
+       "                        2.84379604e-03,  2.33847219e-02,  6.22194773e-03,  1.49291959e-02,\n",
+       "                       -1.83297582e-02,  1.81909986e-02,  2.15157811e-02, -1.39271868e-02,\n",
+       "                       -2.89638322e-02,  1.10881520e-03,  2.82157250e-02,  1.69136934e-02,\n",
+       "                       -8.84730276e-03,  1.59577336e-02,  2.03611460e-02, -1.65258385e-02,\n",
+       "                        1.78473722e-02, -2.39159130e-02, -1.36998538e-02, -1.71729792e-02,\n",
+       "                       -8.58519524e-02,  5.03670378e-03,  2.72648726e-02, -3.53694940e-03,\n",
+       "                       -3.04428395e-02,  1.27652185e-02, -2.31311023e-02, -2.26891320e-02,\n",
+       "                       -1.19382478e-02,  2.88316160e-02,  1.76204331e-02,  8.55787750e-03,\n",
+       "                        7.90143199e-03,  1.71625689e-02, -2.07985323e-02, -3.48045398e-03,\n",
+       "                        5.18445577e-03,  2.67593451e-02, -1.53288562e-02,  1.13617973e-02,\n",
+       "                        2.61260439e-02,  2.27058493e-02, -9.55688581e-03,  1.24905221e-02,\n",
+       "                        3.68422344e-02, -1.28372628e-02, -3.99196036e-02, -5.12610860e-02,\n",
+       "                        4.03299890e-02, -3.13749239e-02, -4.93869931e-03, -2.10509915e-02,\n",
+       "                       -3.29953581e-02, -5.14064655e-02, -3.82981487e-02, -1.65885733e-03,\n",
+       "                       -2.91457716e-02,  9.37298220e-03, -1.69041883e-02,  3.74249443e-02,\n",
+       "                       -1.32612139e-02,  3.82047258e-02,  8.21203087e-03, -2.99716964e-02,\n",
+       "                        1.45867635e-02,  1.26736856e-03, -8.91199056e-03, -6.25200244e-03],\n",
+       "                      dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (layer_1): Dense(\n",
+       "                768, activation=linear, use_bias=True\n",
+       "                (kernel): <tf.Variable 'transformer/layer_._1/ff/layer_1/kernel:0' shape=(192, 768) dtype=float32, numpy=\n",
+       "                array([[-0.01936796, -0.01727297,  0.02798706, ..., -0.00043308,\n",
+       "                        -0.01548608,  0.01052339],\n",
+       "                       [ 0.0217678 ,  0.00543513, -0.0440179 , ...,  0.01921584,\n",
+       "                        -0.00281928, -0.00167585],\n",
+       "                       [-0.02762845,  0.01751809, -0.01518949, ..., -0.00809754,\n",
+       "                        -0.03134314, -0.02594296],\n",
+       "                       ...,\n",
+       "                       [-0.04703904, -0.06811567, -0.04486849, ...,  0.00712049,\n",
+       "                         0.04625429, -0.03096718],\n",
+       "                       [ 0.01649503, -0.0038292 ,  0.03609787, ...,  0.0124039 ,\n",
+       "                        -0.01003346, -0.00525536],\n",
+       "                       [-0.01172524, -0.03267535, -0.0185673 , ...,  0.03373903,\n",
+       "                        -0.01304786, -0.035545  ]], dtype=float32)>\n",
+       "                (bias): <tf.Variable 'transformer/layer_._1/ff/layer_1/bias:0' shape=(768,) dtype=float32, numpy=\n",
+       "                array([-2.02730969e-02, -1.72163453e-02, -3.96374911e-02,  9.25439177e-04,\n",
+       "                       -4.36484031e-02, -2.00147685e-02, -1.71882827e-02, -3.47368903e-02,\n",
+       "                        5.66399482e-04, -3.84117700e-02, -9.10965260e-03,  2.74756015e-03,\n",
+       "                       -1.80025201e-03,  9.61851515e-03,  4.73078527e-03,  4.82578995e-03,\n",
+       "                       -1.18976750e-03, -3.83619703e-02, -1.34952469e-02, -1.35540264e-02,\n",
+       "                       -1.20289333e-03, -6.07461929e-02, -2.38492060e-02, -7.87904486e-04,\n",
+       "                        9.72030219e-03, -2.31057182e-02,  1.04524931e-02,  6.30092947e-03,\n",
+       "                       -5.97665533e-02, -1.25674810e-03,  7.68401567e-03, -2.56892614e-04,\n",
+       "                        4.59111482e-03, -1.09384181e-02,  4.45268257e-03, -1.41052697e-02,\n",
+       "                       -1.63422208e-02,  4.66172909e-03,  8.07574391e-03, -4.54686359e-02,\n",
+       "                        1.60025507e-02, -9.59658623e-03,  8.28578882e-03, -2.48896070e-02,\n",
+       "                       -2.15898622e-02, -1.55484192e-02,  5.97327203e-03, -2.75620334e-02,\n",
+       "                       -4.66338173e-02, -3.95550160e-07,  8.05350486e-04, -2.27461364e-02,\n",
+       "                       -1.24393404e-02,  8.30512773e-03, -3.38091608e-03, -5.77073358e-03,\n",
+       "                       -2.96839513e-02, -4.13544625e-02,  2.24601105e-03, -1.36652626e-02,\n",
+       "                       -1.96060464e-02, -3.98634113e-02, -1.41905267e-02,  1.77390352e-02,\n",
+       "                       -1.33622885e-02, -6.83417497e-03,  3.87142715e-03, -1.46481190e-02,\n",
+       "                       -7.40471156e-03, -2.74524000e-02, -2.04818901e-02, -6.72868500e-03,\n",
+       "                       -2.39155442e-02, -4.22676764e-02, -1.39555512e-02, -5.67868992e-04,\n",
+       "                       -3.41841839e-02,  2.03465912e-02,  4.76055406e-03, -6.00655982e-03,\n",
+       "                        1.05688032e-02, -4.46136780e-02, -5.22093195e-03, -3.42974998e-02,\n",
+       "                       -4.84602014e-03, -1.54305240e-02, -2.88315918e-02, -2.42710151e-02,\n",
+       "                        6.89190486e-03, -1.06102470e-02,  1.16604185e-02, -6.36164285e-03,\n",
+       "                        1.76626742e-02, -2.76263505e-02, -1.81746799e-02,  1.68347117e-02,\n",
+       "                       -2.11666878e-02, -2.66354941e-02, -1.48490481e-02,  4.81047761e-03,\n",
+       "                        4.19533439e-03, -7.29140267e-03,  5.83578832e-03,  1.83147267e-02,\n",
+       "                       -2.89011337e-02,  1.99224800e-02,  2.33192053e-02, -1.17651206e-02,\n",
+       "                       -9.48132947e-03, -3.80671844e-02, -6.97254250e-03, -5.80234174e-03,\n",
+       "                       -2.95534590e-03, -1.68973021e-02,  6.81369333e-03, -2.98659261e-02,\n",
+       "                       -4.21552286e-02, -6.81099389e-03, -8.78395606e-03, -1.27584357e-02,\n",
+       "                       -2.28257608e-02,  1.10510215e-02, -9.74175520e-03, -5.33285458e-03,\n",
+       "                        2.30560894e-03,  1.34414751e-02, -1.65234245e-02, -3.12085904e-04,\n",
+       "                       -2.15259232e-02,  2.44667870e-03, -4.03293176e-04, -2.27069166e-02,\n",
+       "                       -2.79640649e-02, -1.86381284e-02, -2.70746183e-02, -3.35429721e-02,\n",
+       "                       -1.51718426e-02, -8.92117992e-03,  1.50545919e-02, -1.28146186e-02,\n",
+       "                       -2.84793153e-02,  1.30716702e-02,  1.73362158e-02,  1.04466139e-03,\n",
+       "                       -1.12203090e-02, -5.85076399e-02, -4.21808520e-03,  1.34438546e-02,\n",
+       "                       -1.10811321e-03,  1.77231431e-02, -2.33806157e-03,  2.92738043e-02,\n",
+       "                       -8.34393501e-03,  4.49858513e-03, -9.37382691e-03, -9.02433135e-03,\n",
+       "                       -8.02938081e-03, -1.90042872e-02, -3.04585975e-02, -3.98852862e-02,\n",
+       "                       -4.17789333e-02, -1.66377705e-02, -9.60725360e-03, -1.49319484e-03,\n",
+       "                        1.98501945e-02, -1.57562755e-02, -5.30303158e-02, -6.36109523e-03,\n",
+       "                       -2.39910167e-02,  1.18866307e-03, -1.68753341e-02, -8.01526383e-02,\n",
+       "                       -4.10544388e-02,  7.16660218e-03, -5.72163565e-03, -1.77054796e-02,\n",
+       "                       -3.42064979e-03, -1.32517936e-02,  2.85892412e-02,  2.75228405e-03,\n",
+       "                       -1.05867181e-02, -8.94123688e-03, -7.82309752e-03, -1.23709049e-02,\n",
+       "                        3.22665437e-03,  8.23641941e-03, -1.72391906e-02,  4.11677780e-03,\n",
+       "                       -1.57788415e-02,  2.83235274e-02,  1.20825451e-02,  9.10627469e-03,\n",
+       "                       -1.31589000e-03, -3.31720822e-02, -3.95477414e-02, -1.60696432e-02,\n",
+       "                        1.00599974e-03, -4.13404442e-02,  9.88238957e-03, -2.03417242e-02,\n",
+       "                       -2.17924453e-03, -2.85398886e-02,  5.66473557e-03,  1.53433271e-02,\n",
+       "                        1.60060227e-02, -1.68967023e-02, -2.83081476e-02, -2.64291056e-02,\n",
+       "                       -1.57325342e-02,  9.99413617e-03, -1.07601415e-02, -4.59073186e-02,\n",
+       "                       -7.32598477e-04,  2.11031605e-02, -2.77611818e-02,  1.44040724e-02,\n",
+       "                       -2.24381872e-02, -1.91908900e-03, -4.10638936e-02,  4.44361009e-04,\n",
+       "                       -2.92663351e-02,  2.04936545e-02,  6.32207748e-03, -3.43109742e-02,\n",
+       "                       -1.34509047e-02, -5.81239350e-02,  1.67944189e-02, -2.27752663e-02,\n",
+       "                        5.27992845e-03, -2.44366862e-02, -3.37892435e-02, -8.63631908e-03,\n",
+       "                       -3.40979779e-03, -2.28613541e-02,  1.03544090e-02, -1.03079081e-02,\n",
+       "                       -2.27480102e-02, -8.28197040e-03,  3.05404793e-03,  6.86701527e-03,\n",
+       "                        1.70611078e-03, -6.15844736e-04, -2.25477908e-02, -1.91879030e-02,\n",
+       "                       -1.09220268e-02, -1.05120335e-02,  7.52746407e-03, -6.16745558e-03,\n",
+       "                       -4.02863923e-04,  5.69625199e-03, -4.14612219e-02,  6.82809995e-03,\n",
+       "                        5.11092553e-03, -3.99447940e-02, -1.39821991e-02, -6.75095897e-03,\n",
+       "                       -1.76455695e-02, -3.17825340e-02, -2.47324333e-02, -1.16888667e-02,\n",
+       "                       -4.36839722e-02, -1.80751383e-02, -3.45760658e-02, -1.67294051e-02,\n",
+       "                        1.48514751e-02, -1.07286517e-02,  1.06422873e-02, -4.75126877e-03,\n",
+       "                       -1.78854894e-02, -1.26997447e-02,  1.95242390e-02,  8.47190060e-03,\n",
+       "                       -1.91945845e-04, -9.36024543e-03, -2.00828295e-02, -1.21161118e-02,\n",
+       "                       -4.84504132e-03,  1.75416321e-02, -1.37205329e-02, -2.43347771e-02,\n",
+       "                        4.87131439e-03,  5.27615938e-03, -1.47305001e-02, -2.15904955e-02,\n",
+       "                       -2.33575199e-02, -6.61554048e-03, -2.56092777e-03, -1.26826074e-02,\n",
+       "                        6.26714528e-03,  2.45168898e-03,  1.62922833e-02, -2.74149259e-03,\n",
+       "                       -5.68998680e-02,  1.56744905e-02, -9.12281312e-03,  1.78000834e-02,\n",
+       "                       -3.62905003e-02,  7.11219618e-03, -8.98136874e-04, -1.32871466e-02,\n",
+       "                       -1.43234096e-02,  2.74861394e-03, -4.30019433e-03, -3.29636261e-02,\n",
+       "                       -9.63856187e-03, -1.89240500e-02, -2.61130854e-02, -4.91014943e-02,\n",
+       "                       -1.34954117e-02, -2.40241829e-02, -3.60400975e-03,  8.44172947e-03,\n",
+       "                        2.74142437e-03,  4.92954510e-04,  8.39409605e-03, -1.02594271e-02,\n",
+       "                        1.24602579e-02, -1.07601611e-02, -1.88089907e-02, -6.94376091e-03,\n",
+       "                        1.07152490e-02, -2.51998808e-02, -3.05384048e-04, -2.22030841e-02,\n",
+       "                        2.27522459e-02,  4.93783038e-03,  4.13542788e-04, -5.84202865e-03,\n",
+       "                       -3.55486609e-02,  6.57991180e-03,  2.02657469e-02, -8.46680067e-03,\n",
+       "                        1.85093528e-03, -4.74362914e-03,  1.63280349e-02, -1.74182784e-02,\n",
+       "                        1.33596628e-03,  2.01811492e-02, -2.63537467e-02, -3.98929492e-02,\n",
+       "                        1.01095112e-03,  1.42210315e-03, -1.06787616e-02, -5.45299938e-03,\n",
+       "                       -4.68486287e-02, -1.30118029e-02, -2.19423864e-02, -1.33587964e-04,\n",
+       "                        3.92357528e-04, -8.55443031e-02, -1.89563315e-02, -1.14462031e-02,\n",
+       "                       -6.67757262e-03, -1.09370230e-02, -6.51147170e-03,  2.61508133e-02,\n",
+       "                       -3.04248054e-02, -1.70873217e-02, -3.45333070e-02,  1.14384610e-02,\n",
+       "                        3.57219647e-03,  2.35397834e-03, -1.16945207e-02,  7.03913299e-03,\n",
+       "                       -2.15787832e-02, -2.59910841e-02,  7.86962267e-03, -1.90627389e-02,\n",
+       "                       -9.06899385e-03, -1.13378987e-02, -1.59990210e-02, -2.40502376e-02,\n",
+       "                        7.58200511e-03, -2.38405541e-03, -1.56799629e-02, -6.49033580e-03,\n",
+       "                       -1.45801324e-02, -1.07867159e-02,  5.38399536e-03, -2.63710693e-02,\n",
+       "                        9.06795356e-03, -2.23380048e-02,  6.40973798e-04, -2.08435990e-02,\n",
+       "                       -3.54930665e-03, -2.61892695e-02, -2.43403837e-02,  1.45022171e-02,\n",
+       "                       -1.11294333e-02,  2.22975109e-02, -2.88649276e-02,  8.83427728e-03,\n",
+       "                       -1.71264182e-04, -2.00522859e-02, -2.22262572e-02, -2.64064576e-02,\n",
+       "                       -3.25897448e-02,  3.27128638e-03, -2.39347070e-02, -4.62485291e-02,\n",
+       "                       -2.10695155e-02,  1.28054693e-02, -7.54281729e-02,  4.13044542e-03,\n",
+       "                       -3.69404964e-02, -1.50013510e-02, -3.06449854e-03, -2.17315014e-02,\n",
+       "                        1.08699258e-02, -6.91265427e-03, -2.96049239e-03, -3.04010976e-02,\n",
+       "                       -1.17014181e-02, -1.68799460e-02,  1.65505484e-02, -2.11988632e-02,\n",
+       "                       -5.35056321e-03, -1.93487015e-02, -2.19009928e-02,  9.98965185e-03,\n",
+       "                       -4.48127203e-02, -1.70589089e-02, -1.49650453e-02, -3.53463888e-02,\n",
+       "                        1.08261164e-02,  8.66322126e-03,  1.09988675e-02,  5.07105980e-03,\n",
+       "                       -1.09785991e-02, -8.24725349e-03, -7.05766352e-03, -2.93953102e-02,\n",
+       "                       -1.99896973e-02,  1.87788866e-02,  7.44108669e-03, -1.36157889e-02,\n",
+       "                       -2.46517863e-02, -5.10792900e-03, -3.37912096e-03, -5.00590242e-02,\n",
+       "                       -3.30806077e-02,  3.06895375e-03, -1.39247607e-02, -1.32991076e-02,\n",
+       "                       -2.84706913e-02, -2.39872653e-02, -1.41443796e-02, -2.87217030e-04,\n",
+       "                       -5.37853176e-03, -2.31699413e-03,  1.24481134e-02,  2.81007700e-02,\n",
+       "                        1.63598135e-02, -5.36525249e-03,  4.11947863e-03, -8.87962710e-03,\n",
+       "                        7.01108202e-03, -2.79064216e-02,  1.86030604e-02, -1.84345972e-02,\n",
+       "                        9.82684270e-03, -3.05190459e-02, -1.66466013e-02,  7.72549713e-04,\n",
+       "                        1.54814508e-03,  3.96430143e-04,  3.52570880e-03, -2.07410306e-02,\n",
+       "                       -4.09877440e-03,  2.37259106e-03, -2.46705618e-02,  6.25023479e-03,\n",
+       "                       -1.99402794e-02,  1.34928676e-03,  1.01430779e-02, -3.21491691e-03,\n",
+       "                        6.11917814e-03, -1.14797940e-02, -6.87398063e-03,  1.76550762e-04,\n",
+       "                        1.37082450e-02,  1.26474327e-03,  1.39204646e-02, -2.22524889e-02,\n",
+       "                        8.97681457e-05,  1.88891031e-02, -1.98963750e-02, -2.37500835e-02,\n",
+       "                       -1.45162186e-02, -1.76579468e-02, -4.85126860e-03,  2.73216609e-03,\n",
+       "                       -2.76307054e-02,  1.23566557e-02,  7.31245056e-03,  1.25627527e-02,\n",
+       "                       -5.04276110e-03, -1.19638499e-02, -1.18406191e-02,  6.97168894e-03,\n",
+       "                        1.20525099e-02, -2.73218355e-03, -4.18124301e-03, -1.69247333e-02,\n",
+       "                       -3.16366227e-03, -4.72069159e-03, -3.73938009e-02, -1.98564995e-02,\n",
+       "                       -2.44545266e-02, -2.88034491e-02,  9.98098217e-03,  5.21743670e-03,\n",
+       "                        1.93960182e-02,  8.70525651e-03, -2.18096245e-02, -1.38377806e-03,\n",
+       "                       -4.20307964e-02, -2.30455790e-02, -2.23685917e-03, -3.45625132e-02,\n",
+       "                        2.33609974e-02,  8.25913530e-03, -6.18917309e-03, -2.46669389e-02,\n",
+       "                       -1.78897451e-03,  3.98437865e-03, -8.35600216e-03,  5.77223767e-03,\n",
+       "                       -2.84034549e-03, -3.58642917e-03, -6.18770486e-03, -8.90398864e-03,\n",
+       "                        5.72477176e-04,  1.38246790e-02, -1.21220071e-02, -1.20190228e-03,\n",
+       "                        9.34968051e-03, -2.07452327e-02, -3.20062190e-02, -2.53834538e-02,\n",
+       "                       -1.34317875e-02, -1.97784398e-02, -4.15071892e-03, -2.73645706e-02,\n",
+       "                       -1.25424266e-02,  7.18894880e-03, -2.15254407e-02, -2.59364340e-02,\n",
+       "                       -3.32168043e-02, -5.32375872e-02,  4.73892782e-03, -3.15329432e-02,\n",
+       "                        1.17336446e-03,  1.20503269e-02,  8.81805178e-03, -1.79140083e-02,\n",
+       "                       -6.54526567e-03,  1.82500295e-03,  1.05281603e-02,  1.61723625e-02,\n",
+       "                        2.05972083e-02, -1.97964087e-02,  6.55350232e-06,  1.87991858e-02,\n",
+       "                        2.06013061e-02, -1.17481954e-03,  5.10920864e-03, -6.09265687e-03,\n",
+       "                       -1.72222387e-02, -7.33022811e-04, -1.90670881e-02, -3.63333821e-02,\n",
+       "                       -1.54390512e-02,  7.49356346e-03,  2.69417036e-02, -1.88536178e-02,\n",
+       "                        9.53572243e-03, -8.18822626e-03,  2.66291890e-02, -3.50175761e-02,\n",
+       "                       -1.75517949e-03, -3.63707147e-03, -2.96578407e-02,  4.85087978e-03,\n",
+       "                        2.29683891e-02, -1.07311681e-02, -5.93151152e-03, -6.43233676e-03,\n",
+       "                       -9.02256090e-03,  5.71041647e-03, -1.11940848e-02, -7.63751753e-03,\n",
+       "                       -2.96609430e-03, -1.74308917e-03, -5.73345507e-03, -4.00085747e-02,\n",
+       "                       -1.08280014e-02,  2.45840847e-03, -1.65827647e-02, -3.04641202e-02,\n",
+       "                       -1.91303175e-02, -6.34902045e-02, -2.71443985e-02, -8.48556217e-03,\n",
+       "                       -5.78744244e-03, -1.78982951e-02, -1.84806883e-02, -1.90523081e-02,\n",
+       "                        4.01735492e-03,  2.23109615e-03, -1.74209196e-02,  1.19515928e-03,\n",
+       "                        1.03071714e-02, -8.02234039e-02,  1.24981962e-02, -1.32194627e-02,\n",
+       "                       -6.72617368e-03,  2.29350757e-03,  2.68838392e-03, -1.07558258e-02,\n",
+       "                       -7.45773548e-03, -3.24521516e-03, -3.60023528e-02, -5.36000133e-02,\n",
+       "                        5.89652080e-03, -3.65445241e-02,  1.57442577e-02, -1.11889504e-02,\n",
+       "                        2.01796740e-02, -1.89142656e-02,  3.69664375e-03, -9.64444969e-03,\n",
+       "                       -1.99025124e-02, -5.27735911e-02, -6.18071482e-03,  1.96429584e-02,\n",
+       "                        9.04919766e-03, -2.44172849e-03,  2.42983419e-02,  7.77297560e-03,\n",
+       "                        1.86291113e-02,  1.43718664e-02,  4.88520274e-03, -1.74652059e-02,\n",
+       "                       -3.91945206e-02, -2.85394844e-02, -6.52817870e-03, -4.53838333e-03,\n",
+       "                        5.24704205e-03, -3.72513458e-02, -2.26468854e-02,  2.32792087e-03,\n",
+       "                        1.88641832e-03,  5.58300922e-03, -9.78803448e-03,  2.33869310e-02,\n",
+       "                       -4.18912135e-02, -3.19908485e-02, -8.90049245e-03, -1.94256715e-02,\n",
+       "                        6.74062036e-03, -1.12374388e-02,  1.40834944e-02, -1.58932773e-04,\n",
+       "                       -3.85522889e-03, -2.52304543e-02,  1.09773213e-02, -3.49628739e-02,\n",
+       "                        2.02956498e-02, -1.83961205e-02, -9.16141830e-03, -6.89430069e-03,\n",
+       "                       -1.82250026e-03,  3.91215971e-03, -3.02790329e-02,  4.85412357e-03,\n",
+       "                        5.21492213e-03, -2.76922695e-02,  7.46305939e-03,  4.57040616e-04,\n",
+       "                       -2.80272998e-02,  5.70539059e-03, -2.35484336e-02,  5.97323524e-03,\n",
+       "                       -3.80400121e-02, -2.14953162e-03, -5.47003699e-03, -2.85517797e-03,\n",
+       "                        1.21851694e-02,  1.71587861e-03, -2.77664978e-02, -2.20162105e-02,\n",
+       "                        8.68351292e-03, -2.04854421e-02,  3.65737732e-03, -4.93340136e-04,\n",
+       "                       -6.58130087e-03,  8.45880434e-03,  9.36099607e-03, -6.69793831e-03,\n",
+       "                       -1.45707000e-02, -1.48070045e-02,  2.04449962e-03,  2.96859490e-03,\n",
+       "                       -2.96394285e-02,  1.08581251e-02, -1.75250992e-02,  1.53381256e-02,\n",
+       "                       -2.64075790e-02,  1.73933804e-02,  6.86512422e-03, -1.24971373e-02,\n",
+       "                        9.37248301e-03, -8.76329548e-04, -2.70201601e-02, -1.37452129e-02,\n",
+       "                       -2.48217899e-02, -2.12847032e-02, -2.02346016e-02,  4.97383205e-03,\n",
+       "                       -1.45821357e-02, -6.21638354e-03,  1.60615034e-02,  8.42541736e-03,\n",
+       "                       -1.73121586e-03,  1.84763055e-02,  1.38618983e-02,  6.79083809e-04,\n",
+       "                       -3.76517028e-02, -5.53824613e-03, -1.61262881e-02,  2.18251087e-02,\n",
+       "                       -1.41914962e-02, -2.67606135e-03, -9.26637370e-03,  1.47592397e-02,\n",
+       "                       -8.86621326e-03,  1.54802157e-02,  3.15189059e-03,  9.82165709e-03,\n",
+       "                        3.27752903e-03,  2.13089865e-02, -2.70583443e-02, -7.42953736e-03,\n",
+       "                       -2.50007659e-02, -1.14361225e-02, -9.81700886e-03, -8.11999850e-03,\n",
+       "                       -1.84244197e-02, -2.75552347e-02, -2.94755609e-03, -6.37403829e-03,\n",
+       "                       -1.25843631e-02, -3.07683572e-02, -3.49259959e-03,  7.75923207e-03,\n",
+       "                        1.38970942e-03, -2.76233349e-02,  6.77595520e-03,  1.63823506e-03,\n",
+       "                        5.47163363e-05, -2.44897380e-02, -6.46863133e-03, -7.09528523e-03,\n",
+       "                       -1.90487560e-02, -1.02440035e-02,  4.92857816e-03, -5.28441332e-02],\n",
+       "                      dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (layer_2): Dense(\n",
+       "                192, activation=linear, use_bias=True\n",
+       "                (kernel): <tf.Variable 'transformer/layer_._1/ff/layer_2/kernel:0' shape=(768, 192) dtype=float32, numpy=\n",
+       "                array([[-0.01873498,  0.02679233, -0.07056118, ...,  0.00398566,\n",
+       "                         0.02154048,  0.01009107],\n",
+       "                       [ 0.0023489 ,  0.03306963, -0.01094123, ..., -0.01874584,\n",
+       "                         0.02311078, -0.03246025],\n",
+       "                       [ 0.01395899, -0.01199064,  0.03589186, ..., -0.00253369,\n",
+       "                         0.00015564,  0.01200298],\n",
+       "                       ...,\n",
+       "                       [-0.0110327 ,  0.01484329, -0.02025447, ..., -0.01528619,\n",
+       "                        -0.00044155, -0.00768675],\n",
+       "                       [-0.00518769, -0.0190341 ,  0.00541804, ..., -0.04019772,\n",
+       "                         0.00462436,  0.00114423],\n",
+       "                       [-0.01649309, -0.022153  ,  0.00116507, ...,  0.00092028,\n",
+       "                         0.0192393 , -0.00191616]], dtype=float32)>\n",
+       "                (bias): <tf.Variable 'transformer/layer_._1/ff/layer_2/bias:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([-0.00875727,  0.00844772, -0.00638411,  0.00979791,  0.00631264,\n",
+       "                        0.01925564,  0.01764304,  0.01935392, -0.00319467,  0.00851334,\n",
+       "                       -0.00302966,  0.0017067 ,  0.01643271,  0.00013498,  0.01369039,\n",
+       "                        0.0075578 , -0.00901533,  0.00556126,  0.00525395,  0.00601836,\n",
+       "                       -0.00113361,  0.06682169,  0.01941927,  0.02516656, -0.00994125,\n",
+       "                        0.01200988, -0.01820031,  0.02928668, -0.02253202, -0.02094638,\n",
+       "                       -0.00215082, -0.04950898, -0.01214268, -0.00775701, -0.00567762,\n",
+       "                        0.00155565, -0.00412368,  0.01876251,  0.01938802,  0.01385835,\n",
+       "                       -0.00753018,  0.01650311, -0.01765283, -0.0175887 ,  0.01734858,\n",
+       "                        0.02780465,  0.01827991, -0.00259388,  0.00857305,  0.00877466,\n",
+       "                        0.01454839,  0.0185861 ,  0.00305506, -0.01850432,  0.00327083,\n",
+       "                        0.01592625, -0.02423782, -0.02307841, -0.02633888, -0.0118603 ,\n",
+       "                        0.00033595, -0.01579602,  0.03260851, -0.01295588,  0.00152569,\n",
+       "                       -0.01920031, -0.02093989, -0.00928893, -0.01716848,  0.00329048,\n",
+       "                       -0.03092022, -0.00813805, -0.02732819, -0.02910862, -0.00923078,\n",
+       "                       -0.02219846, -0.00552739, -0.01209938, -0.01768913, -0.03044659,\n",
+       "                        0.00433539,  0.01937628,  0.02478183, -0.01579314,  0.02210511,\n",
+       "                        0.02426847,  0.03000535,  0.02216269,  0.00996924, -0.01001132,\n",
+       "                       -0.01479168, -0.02210437, -0.01065945, -0.00187033,  0.00778272,\n",
+       "                       -0.03885601, -0.0236426 , -0.0003459 ,  0.00390934, -0.01730723,\n",
+       "                       -0.04346146,  0.00464112,  0.0187731 ,  0.02091447,  0.00887477,\n",
+       "                        0.03617691,  0.01600332,  0.01941076, -0.00550917, -0.02156864,\n",
+       "                       -0.02627692, -0.02292657, -0.0195347 ,  0.00989026,  0.01694178,\n",
+       "                       -0.00581628, -0.01517762,  0.02600943, -0.01791165, -0.00931305,\n",
+       "                       -0.01767998, -0.01953321, -0.0226922 ,  0.02001677, -0.00639939,\n",
+       "                        0.03065447,  0.0072672 ,  0.01034329, -0.01980901,  0.01084015,\n",
+       "                        0.01425455, -0.01764459, -0.02957735, -0.00409907,  0.0226249 ,\n",
+       "                        0.02194628, -0.01227286,  0.01358387,  0.02082218, -0.02336786,\n",
+       "                        0.01717109, -0.01016011, -0.01469659, -0.01017225, -0.05480007,\n",
+       "                        0.00403081,  0.02459577,  0.00297031, -0.01252157,  0.0100858 ,\n",
+       "                       -0.02109952, -0.01984255,  0.0088863 ,  0.02306723,  0.00677673,\n",
+       "                        0.00027088,  0.00272076,  0.01193484, -0.00655524, -0.02220269,\n",
+       "                        0.00476494,  0.02373325, -0.00927185,  0.0072583 ,  0.021671  ,\n",
+       "                        0.00589487, -0.00776884,  0.01278425,  0.024796  , -0.00481928,\n",
+       "                       -0.02029314, -0.03756877,  0.03063949, -0.0084965 ,  0.00194776,\n",
+       "                       -0.02170036, -0.03632088, -0.02481564, -0.02177641,  0.0025987 ,\n",
+       "                       -0.01534427,  0.01370342, -0.0128414 ,  0.02587708, -0.01888825,\n",
+       "                        0.02439466,  0.01731913, -0.00958412,  0.01613715,  0.01427922,\n",
+       "                       -0.01684757, -0.00175023], dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (dropout): Dropout(\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "            (dropout): Dropout(\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "            (_feature_shapes): Dict()\n",
+       "            (_feature_dtypes): Dict()\n",
+       "          )\n",
+       "          (2): TFXLNetLayer(\n",
+       "            (rel_attn): TFXLNetRelativeAttention(\n",
+       "              (layer_norm): LayerNormalization(\n",
+       "                (axis): List(\n",
+       "                  (0): 2\n",
+       "                )\n",
+       "                (gamma): <tf.Variable 'transformer/layer_._2/rel_attn/layer_norm/gamma:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([1.0217174 , 1.0251529 , 1.0009836 , 1.0462228 , 1.0023384 ,\n",
+       "                       1.0702455 , 1.0446848 , 1.0141752 , 1.016957  , 1.033185  ,\n",
+       "                       1.0181712 , 1.0153837 , 0.9992023 , 1.0347466 , 1.0211351 ,\n",
+       "                       1.0018849 , 1.0121537 , 0.99940306, 1.0072032 , 1.0192038 ,\n",
+       "                       1.0209839 , 1.187853  , 1.0392752 , 1.0235384 , 1.0065316 ,\n",
+       "                       1.022949  , 1.0093213 , 1.0211647 , 1.0060023 , 1.0248559 ,\n",
+       "                       1.0059446 , 1.0761709 , 1.0173205 , 1.0236268 , 0.98880196,\n",
+       "                       1.0349165 , 1.0256321 , 1.0104129 , 1.0246964 , 0.9955374 ,\n",
+       "                       1.0396379 , 1.0044645 , 1.028682  , 1.0409732 , 1.0322639 ,\n",
+       "                       1.0058585 , 1.0145588 , 0.99829394, 1.0104554 , 1.0500244 ,\n",
+       "                       1.0286031 , 1.0021374 , 1.0364661 , 0.9966459 , 1.022384  ,\n",
+       "                       1.017586  , 0.98369807, 1.0039334 , 1.0339525 , 1.0041248 ,\n",
+       "                       1.0204359 , 0.98249644, 1.032949  , 1.0197221 , 1.0263952 ,\n",
+       "                       0.9926133 , 0.99735445, 1.0876801 , 1.0224211 , 1.0198096 ,\n",
+       "                       1.0506258 , 1.0010437 , 0.99980325, 1.0300628 , 1.0086097 ,\n",
+       "                       1.0204959 , 1.0012923 , 1.0035007 , 0.9980045 , 1.0441691 ,\n",
+       "                       1.0204487 , 0.9990266 , 0.9966284 , 1.0186629 , 1.0485342 ,\n",
+       "                       1.0253004 , 1.0131625 , 1.0052114 , 1.0252738 , 1.0075058 ,\n",
+       "                       1.0343914 , 1.0002061 , 0.9924983 , 1.0421573 , 1.0040683 ,\n",
+       "                       1.0187975 , 1.0190364 , 1.0011268 , 0.99671876, 1.0547765 ,\n",
+       "                       1.025715  , 1.0177215 , 1.0108784 , 1.0226917 , 1.0155568 ,\n",
+       "                       0.9973636 , 1.0079739 , 1.0572509 , 1.0273353 , 1.0160165 ,\n",
+       "                       1.0249956 , 1.0097992 , 1.0126355 , 0.99393314, 1.0213517 ,\n",
+       "                       1.0287503 , 1.0278797 , 1.0104443 , 1.0232205 , 1.005057  ,\n",
+       "                       0.9942467 , 1.033091  , 1.0228969 , 1.007807  , 1.0081193 ,\n",
+       "                       1.0374564 , 0.9998273 , 1.0164163 , 1.0237519 , 1.0112252 ,\n",
+       "                       1.0251505 , 0.99518573, 1.0173032 , 1.017753  , 1.0192963 ,\n",
+       "                       1.0150547 , 0.99565893, 1.0140896 , 1.003712  , 1.000266  ,\n",
+       "                       1.001154  , 1.0525979 , 1.0441524 , 1.0055293 , 1.0802695 ,\n",
+       "                       1.003204  , 1.0219046 , 1.0287489 , 0.9960544 , 1.0255774 ,\n",
+       "                       1.026497  , 0.98832685, 0.9979249 , 1.0186322 , 1.0093694 ,\n",
+       "                       1.0192312 , 1.0199887 , 1.0398    , 0.9829798 , 1.0415385 ,\n",
+       "                       1.0186274 , 1.0384295 , 0.983487  , 1.0242232 , 1.0270193 ,\n",
+       "                       1.0064057 , 0.9939754 , 1.0075631 , 1.0031563 , 0.99732876,\n",
+       "                       1.0779532 , 1.0452689 , 1.0039006 , 0.98994976, 1.015347  ,\n",
+       "                       0.9903972 , 1.0386693 , 1.0151427 , 1.0464522 , 1.0083725 ,\n",
+       "                       1.038116  , 0.99612683, 1.0135477 , 1.0054603 , 1.0062294 ,\n",
+       "                       1.028863  , 1.0152918 , 1.0330389 , 1.0156182 , 0.9869547 ,\n",
+       "                       1.0048147 , 1.0276642 ], dtype=float32)>\n",
+       "                (beta): <tf.Variable 'transformer/layer_._2/rel_attn/layer_norm/beta:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([ 3.06162308e-03,  1.86115298e-02, -1.31628076e-02,  1.06461560e-02,\n",
+       "                       -4.11694031e-03,  3.30818594e-02,  4.02924716e-02,  6.59284927e-03,\n",
+       "                        3.38024739e-03,  4.59420588e-03,  4.78615239e-03,  6.62528677e-04,\n",
+       "                        6.70902058e-03, -2.52860878e-02, -1.48927094e-02,  4.62446781e-03,\n",
+       "                        6.38968835e-04,  7.71211181e-03,  7.99407065e-03,  1.95953436e-02,\n",
+       "                        7.16714747e-03,  9.20696408e-02,  2.76485197e-02,  5.97401522e-03,\n",
+       "                       -1.40910083e-02,  1.01603949e-02,  6.01712102e-03,  2.28405371e-02,\n",
+       "                       -7.97405839e-03, -1.86992937e-03,  5.27088996e-04, -7.22015649e-02,\n",
+       "                       -1.31994477e-02, -1.27156395e-02,  1.02564795e-02,  1.32799195e-02,\n",
+       "                       -1.20413559e-03, -4.15205443e-03, -9.66252945e-03, -1.11156877e-03,\n",
+       "                        1.75651070e-02,  2.47061532e-02, -3.22925635e-02,  6.95932051e-03,\n",
+       "                        9.56356898e-03, -1.50442692e-02,  1.64015479e-02,  5.24280732e-03,\n",
+       "                        3.17716822e-02, -5.53713785e-03, -1.06571664e-04,  9.43160616e-03,\n",
+       "                        9.63144936e-03, -5.56897651e-03,  1.13199570e-03,  1.25727803e-02,\n",
+       "                       -6.73677167e-03, -1.04960650e-02,  9.34011885e-04, -1.03336098e-02,\n",
+       "                        1.40871098e-02, -1.59239639e-02,  2.29182914e-02,  6.17692422e-05,\n",
+       "                       -3.35305231e-03,  7.19197124e-05, -1.17311468e-02, -3.22010480e-02,\n",
+       "                        5.37329866e-03, -9.16972011e-03, -4.40349337e-03, -1.91465244e-02,\n",
+       "                       -4.95484797e-03, -2.49018818e-02, -1.20322015e-02, -1.08357696e-02,\n",
+       "                       -1.00547625e-02, -2.94450088e-03,  5.77213243e-03, -1.24915829e-02,\n",
+       "                       -1.69879310e-02,  1.47916187e-04, -3.30431107e-03,  3.74537683e-03,\n",
+       "                       -6.71420526e-03,  2.85739498e-03, -5.88525691e-05,  4.38376237e-03,\n",
+       "                        8.50109477e-03,  5.33880573e-03, -1.12952897e-02, -8.53516534e-03,\n",
+       "                       -2.40853615e-03, -3.99530260e-03,  1.60534661e-02, -5.62854763e-03,\n",
+       "                       -3.77693970e-04,  1.23287737e-02,  2.00105105e-02, -1.42252818e-02,\n",
+       "                       -3.90752554e-02, -5.64790098e-03, -5.97694074e-04,  1.19732199e-02,\n",
+       "                        1.37916040e-02,  4.39003063e-03,  1.62776583e-03,  6.12852676e-03,\n",
+       "                       -2.70602433e-03, -1.48238158e-02, -2.96681095e-02, -1.44181950e-02,\n",
+       "                        8.72193649e-03,  1.24358824e-02,  1.52108464e-02,  1.06202485e-02,\n",
+       "                       -8.53042875e-05, -9.98889934e-03, -5.43701509e-03,  8.10975954e-03,\n",
+       "                        3.15054669e-03, -5.17641008e-03, -7.31557794e-03,  3.30039300e-03,\n",
+       "                        2.07848335e-03,  1.37262873e-03, -5.56092802e-03,  1.41495364e-02,\n",
+       "                       -1.32099232e-02,  1.03573129e-03,  1.63320545e-02, -6.14388322e-04,\n",
+       "                       -9.34190303e-03,  7.67122116e-03,  6.12509670e-04,  2.17823172e-03,\n",
+       "                       -5.67103876e-03,  1.09491777e-02,  6.37806486e-03,  5.85651305e-03,\n",
+       "                        2.79139308e-03, -3.87229025e-03, -3.13691562e-03, -4.91503440e-03,\n",
+       "                       -6.06452599e-02,  9.29491594e-03,  9.19607189e-03,  3.91248288e-03,\n",
+       "                       -1.18186893e-02,  2.82759406e-03, -9.46957152e-03, -1.18294284e-02,\n",
+       "                       -2.55618896e-03,  6.68200152e-03,  6.41459227e-03,  1.52630685e-02,\n",
+       "                        9.96001530e-03,  5.96510945e-03, -7.90067762e-03,  4.33216989e-03,\n",
+       "                        7.29350885e-03,  6.58101402e-03, -4.42307536e-03,  4.33848379e-03,\n",
+       "                        6.38639415e-03,  1.33568821e-02, -1.26913534e-02,  3.80871398e-03,\n",
+       "                        1.93254575e-02, -1.42886303e-02, -7.10068271e-03, -3.35032977e-02,\n",
+       "                        9.40572284e-03, -1.38211465e-02, -1.02185896e-02, -1.26630822e-02,\n",
+       "                       -2.23257244e-02, -1.92523561e-02, -3.01279314e-02,  2.53150007e-03,\n",
+       "                       -1.12993028e-02,  9.79227107e-03, -7.08208373e-03,  2.55916603e-02,\n",
+       "                        2.86390772e-03,  3.20686027e-02, -2.30147969e-03, -1.51887033e-02,\n",
+       "                        1.19875781e-02, -1.32277906e-02, -2.15940084e-03,  5.77947544e-03],\n",
+       "                      dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (dropout): Dropout(\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (q): <tf.Variable 'transformer/layer_._2/rel_attn/q:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[-4.81137522e-02,  1.51717179e-02,  1.91733846e-03, ...,\n",
+       "                       -2.15504169e-02, -8.80663171e-02, -5.14865741e-02],\n",
+       "                      [-2.29916703e-02, -5.24781160e-02, -6.03806712e-02, ...,\n",
+       "                       -8.62903253e-05, -4.47642431e-03,  7.90688917e-02],\n",
+       "                      [ 1.12126365e-01,  3.48391198e-02, -5.96038513e-02, ...,\n",
+       "                        1.68225244e-02,  2.80025396e-02, -1.32860793e-02],\n",
+       "                      ...,\n",
+       "                      [ 6.81161508e-03,  5.21353967e-02,  2.45775543e-02, ...,\n",
+       "                        2.16543674e-02,  8.77359789e-03, -2.10702680e-02],\n",
+       "                      [ 1.58886798e-02,  1.51693877e-02, -9.94204450e-03, ...,\n",
+       "                        9.39156860e-03,  1.01508182e-02, -3.07718641e-03],\n",
+       "                      [-2.86811162e-02, -2.62935236e-02,  1.51471458e-02, ...,\n",
+       "                        1.70202483e-03,  3.09125576e-02, -4.09694621e-03]],\n",
+       "              \n",
+       "                     [[ 3.37063894e-02, -1.63897295e-02,  6.96284231e-03, ...,\n",
+       "                       -7.82956369e-03,  5.46475984e-02, -4.21468318e-02],\n",
+       "                      [ 3.24924961e-02,  2.07625646e-02, -6.96102679e-02, ...,\n",
+       "                       -6.44863173e-02, -7.28632137e-02,  4.93840724e-02],\n",
+       "                      [ 3.49648520e-02,  4.40866686e-02,  4.10161763e-02, ...,\n",
+       "                        3.23176309e-02,  5.57911135e-02,  4.16656248e-02],\n",
+       "                      ...,\n",
+       "                      [ 3.62646729e-02, -2.21277811e-02,  1.90648821e-03, ...,\n",
+       "                        3.49440463e-02, -5.95782511e-02,  4.22822535e-02],\n",
+       "                      [-3.51860039e-02, -2.13885438e-02,  4.00259346e-02, ...,\n",
+       "                       -4.20402475e-02, -1.41877644e-02,  4.43436131e-02],\n",
+       "                      [ 2.43175644e-02,  1.39741208e-02,  3.49960700e-02, ...,\n",
+       "                        1.55997453e-02, -1.60364714e-02,  2.10535321e-02]],\n",
+       "              \n",
+       "                     [[ 3.32882740e-02, -1.96926738e-03, -1.55992284e-02, ...,\n",
+       "                        8.14008191e-02,  1.38205756e-02, -1.51603227e-03],\n",
+       "                      [ 3.59372562e-03,  2.50430964e-03,  2.58572530e-02, ...,\n",
+       "                        3.24064456e-02,  2.29581203e-02, -1.92896519e-02],\n",
+       "                      [ 1.43919000e-02,  1.51500767e-02, -2.80712657e-02, ...,\n",
+       "                        5.12368865e-02,  9.74925887e-03, -5.37651917e-03],\n",
+       "                      ...,\n",
+       "                      [ 3.90181039e-03,  3.26900743e-02,  9.40683577e-03, ...,\n",
+       "                        8.45516333e-04,  8.35157279e-03, -1.66299427e-03],\n",
+       "                      [ 3.23605747e-03, -6.58250833e-03,  1.32873598e-02, ...,\n",
+       "                        1.53540606e-02, -2.06754059e-02,  1.22069884e-02],\n",
+       "                      [ 3.42889782e-03, -5.71477169e-04, -1.83276646e-02, ...,\n",
+       "                        2.04541571e-02, -1.27389310e-02,  1.50542082e-02]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[ 3.72777767e-02, -5.42798452e-02,  3.09000630e-03, ...,\n",
+       "                       -2.05895375e-03,  4.08504084e-02, -3.67017463e-02],\n",
+       "                      [ 2.81978864e-02,  2.46209782e-02, -5.35734519e-02, ...,\n",
+       "                       -9.81846265e-03, -6.76249191e-02,  4.47309017e-02],\n",
+       "                      [-1.71915013e-02, -1.91664733e-02, -3.03540640e-02, ...,\n",
+       "                       -1.37790563e-02,  8.39917455e-03,  1.95486043e-02],\n",
+       "                      ...,\n",
+       "                      [ 4.39666398e-03,  1.65959522e-02,  4.79898555e-03, ...,\n",
+       "                        3.13505344e-03,  4.33057360e-03, -4.27076186e-04],\n",
+       "                      [ 1.57838222e-02,  2.59035290e-03,  1.50174825e-02, ...,\n",
+       "                       -5.15849795e-04, -3.30348127e-03,  6.75350800e-03],\n",
+       "                      [ 1.95149593e-02, -9.67641245e-04,  9.85140260e-03, ...,\n",
+       "                        1.70841943e-02, -2.58299336e-02,  7.08191376e-03]],\n",
+       "              \n",
+       "                     [[-1.05452873e-02,  2.40855291e-02, -3.36844176e-02, ...,\n",
+       "                       -4.62573469e-02, -1.49153080e-03,  6.79138154e-02],\n",
+       "                      [ 4.84222826e-03,  1.13523463e-02,  3.25595327e-02, ...,\n",
+       "                       -2.86528356e-02,  3.52971703e-02, -3.56208794e-02],\n",
+       "                      [-1.18880443e-01, -3.07634361e-02,  2.19099987e-02, ...,\n",
+       "                       -5.25062606e-02, -4.03628685e-02, -4.92011150e-03],\n",
+       "                      ...,\n",
+       "                      [-1.91243179e-02, -4.92599839e-03, -8.33099522e-03, ...,\n",
+       "                       -3.46056446e-02,  3.18350689e-03, -8.50734068e-04],\n",
+       "                      [ 3.76518033e-02,  3.41102369e-02, -5.76552041e-02, ...,\n",
+       "                        1.96692292e-02,  4.78661954e-02, -4.84392270e-02],\n",
+       "                      [-3.47922626e-03, -1.39467446e-02,  2.18370315e-02, ...,\n",
+       "                       -2.02156343e-02,  1.19114574e-02, -2.46745106e-02]],\n",
+       "              \n",
+       "                     [[ 6.54376950e-03,  3.02088279e-02, -5.81995286e-02, ...,\n",
+       "                       -7.68325403e-02,  6.12843484e-02,  3.78722101e-02],\n",
+       "                      [ 9.42414347e-03, -5.04070967e-02, -2.94177290e-02, ...,\n",
+       "                       -5.24935313e-03, -6.23170584e-02,  4.45930520e-03],\n",
+       "                      [-4.07862365e-02, -3.37571464e-02,  2.19498202e-02, ...,\n",
+       "                        7.29233166e-03, -5.56845069e-02, -2.92345323e-02],\n",
+       "                      ...,\n",
+       "                      [ 2.81625874e-02, -1.72678512e-02, -2.19437256e-02, ...,\n",
+       "                        8.62976443e-03, -4.02266011e-02,  2.57315841e-02],\n",
+       "                      [-8.77696928e-03, -1.04554817e-02,  6.81386003e-03, ...,\n",
+       "                       -2.19753687e-03,  5.88407274e-03, -7.93407857e-03],\n",
+       "                      [-1.05217602e-02,  9.43640154e-03, -6.24175705e-02, ...,\n",
+       "                       -3.55250388e-02, -6.71412144e-03,  2.17702035e-02]]],\n",
+       "                    dtype=float32)>\n",
+       "              (k): <tf.Variable 'transformer/layer_._2/rel_attn/k:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[-0.00293928, -0.0109784 , -0.00407117, ...,  0.06720299,\n",
+       "                        0.00220658, -0.01070606],\n",
+       "                      [ 0.02917756,  0.01057504,  0.0149243 , ..., -0.02115533,\n",
+       "                       -0.03522046,  0.00336731],\n",
+       "                      [ 0.0072771 ,  0.00142857, -0.00595553, ..., -0.01464644,\n",
+       "                       -0.02712567, -0.00692069],\n",
+       "                      ...,\n",
+       "                      [ 0.00619581,  0.00026811,  0.03295753, ..., -0.04673641,\n",
+       "                        0.00351168, -0.01507777],\n",
+       "                      [ 0.00376089,  0.0103442 , -0.0184721 , ..., -0.01987653,\n",
+       "                        0.01558526, -0.00548268],\n",
+       "                      [-0.00744516, -0.00281895, -0.01078221, ...,  0.00610567,\n",
+       "                       -0.01862272,  0.00915155]],\n",
+       "              \n",
+       "                     [[-0.02782594, -0.0039578 ,  0.07950357, ..., -0.02373442,\n",
+       "                       -0.05951536, -0.01053701],\n",
+       "                      [-0.00720376,  0.01994296,  0.05216808, ...,  0.00521234,\n",
+       "                        0.04455427, -0.03069338],\n",
+       "                      [ 0.00991428,  0.02514814,  0.03120906, ..., -0.03899101,\n",
+       "                        0.017482  ,  0.02697489],\n",
+       "                      ...,\n",
+       "                      [-0.05309541, -0.00619643, -0.05110249, ..., -0.0535032 ,\n",
+       "                        0.04024338, -0.0384163 ],\n",
+       "                      [-0.02037921, -0.01771634,  0.03101053, ..., -0.00896538,\n",
+       "                        0.00090393,  0.01484353],\n",
+       "                      [-0.00921424,  0.0160069 , -0.00579366, ...,  0.02471853,\n",
+       "                       -0.01938148, -0.00959876]],\n",
+       "              \n",
+       "                     [[ 0.00509293, -0.02846905, -0.06832287, ...,  0.01379875,\n",
+       "                        0.01978015,  0.00669768],\n",
+       "                      [-0.00238889, -0.03830735, -0.07192513, ...,  0.02121064,\n",
+       "                       -0.02788975,  0.04276541],\n",
+       "                      [ 0.01299973, -0.02591552, -0.03836127, ..., -0.0018938 ,\n",
+       "                       -0.0080095 , -0.04260714],\n",
+       "                      ...,\n",
+       "                      [-0.00532516,  0.0437762 , -0.01197581, ..., -0.00461747,\n",
+       "                        0.02074965, -0.03320842],\n",
+       "                      [ 0.01869402,  0.00926195, -0.03418873, ...,  0.01149853,\n",
+       "                        0.00745646, -0.01764916],\n",
+       "                      [-0.00859777, -0.03077263,  0.02499374, ..., -0.03628961,\n",
+       "                        0.02713079, -0.02098218]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[-0.00255963, -0.00792341, -0.01311781, ..., -0.01471253,\n",
+       "                        0.00773418,  0.0028765 ],\n",
+       "                      [-0.01693467, -0.01684431,  0.01218338, ..., -0.00594166,\n",
+       "                        0.01953993, -0.00055485],\n",
+       "                      [ 0.00725681, -0.01396647, -0.01421928, ..., -0.02032903,\n",
+       "                        0.00128055, -0.01244337],\n",
+       "                      ...,\n",
+       "                      [ 0.04216336, -0.01187535,  0.03545079, ...,  0.05167695,\n",
+       "                       -0.03074895,  0.02474623],\n",
+       "                      [ 0.01909629,  0.00693916,  0.00172379, ...,  0.0171647 ,\n",
+       "                        0.01141954, -0.00754204],\n",
+       "                      [ 0.03014773,  0.00731963,  0.05709034, ...,  0.02683626,\n",
+       "                       -0.02091517,  0.02028517]],\n",
+       "              \n",
+       "                     [[ 0.0074964 , -0.00856717,  0.02979018, ...,  0.03537965,\n",
+       "                        0.00690144, -0.0624721 ],\n",
+       "                      [-0.00064552, -0.02535983, -0.01051644, ..., -0.00985349,\n",
+       "                        0.00672527,  0.04417474],\n",
+       "                      [ 0.06582981,  0.01555467,  0.0155565 , ...,  0.03326725,\n",
+       "                        0.01875504, -0.01086921],\n",
+       "                      ...,\n",
+       "                      [ 0.01764918,  0.02719252,  0.02960117, ...,  0.03690163,\n",
+       "                        0.02842108, -0.02001433],\n",
+       "                      [-0.03356929, -0.02933718,  0.04107409, ..., -0.02876418,\n",
+       "                       -0.03791892,  0.05297501],\n",
+       "                      [ 0.04199879,  0.03726116,  0.02551803, ...,  0.02520091,\n",
+       "                       -0.0426075 ,  0.04186616]],\n",
+       "              \n",
+       "                     [[-0.03414296,  0.00657422,  0.04984473, ..., -0.02375824,\n",
+       "                       -0.05163334, -0.02703283],\n",
+       "                      [-0.00742817,  0.03634953, -0.00377172, ..., -0.01132715,\n",
+       "                        0.03730771, -0.01465937],\n",
+       "                      [-0.02270306,  0.00535163, -0.02442615, ..., -0.06195223,\n",
+       "                        0.00054794,  0.0272242 ],\n",
+       "                      ...,\n",
+       "                      [-0.0495413 ,  0.02071496, -0.01031443, ..., -0.08232274,\n",
+       "                        0.0433554 , -0.05423561],\n",
+       "                      [ 0.02054976,  0.02180232, -0.00914375, ...,  0.02327339,\n",
+       "                        0.01977414, -0.02690084],\n",
+       "                      [ 0.00422481,  0.00880208,  0.04090318, ...,  0.03197616,\n",
+       "                        0.00156149, -0.00067797]]], dtype=float32)>\n",
+       "              (v): <tf.Variable 'transformer/layer_._2/rel_attn/v:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[ 0.00665421, -0.00124323,  0.00077421, ...,  0.03188131,\n",
+       "                        0.0309326 , -0.01376203],\n",
+       "                      [ 0.05372431,  0.03682763, -0.01067041, ..., -0.00807943,\n",
+       "                       -0.00639856,  0.01343099],\n",
+       "                      [ 0.01893931, -0.01041871, -0.0559322 , ...,  0.01476059,\n",
+       "                       -0.02740676,  0.00521749],\n",
+       "                      ...,\n",
+       "                      [ 0.01157789, -0.00384533,  0.01601262, ...,  0.03651634,\n",
+       "                       -0.02067197,  0.02215986],\n",
+       "                      [ 0.03778082, -0.01276081,  0.03520799, ..., -0.00878477,\n",
+       "                        0.01457549, -0.02071035],\n",
+       "                      [ 0.00282983, -0.03704467,  0.02245468, ...,  0.04747025,\n",
+       "                       -0.03342215, -0.00695839]],\n",
+       "              \n",
+       "                     [[ 0.01376876, -0.03680427, -0.02725985, ...,  0.00445622,\n",
+       "                       -0.01388015, -0.05727502],\n",
+       "                      [ 0.04148179,  0.01627039, -0.03839501, ..., -0.01536803,\n",
+       "                        0.02744391, -0.00661899],\n",
+       "                      [-0.01462931, -0.00733666,  0.00704345, ..., -0.01936535,\n",
+       "                        0.00024902,  0.00248078],\n",
+       "                      ...,\n",
+       "                      [ 0.00872552, -0.01589725,  0.00721518, ...,  0.01352625,\n",
+       "                       -0.03614037, -0.00738423],\n",
+       "                      [-0.01501117, -0.00353953,  0.03562136, ..., -0.01327041,\n",
+       "                        0.01113886,  0.02501536],\n",
+       "                      [-0.00858908,  0.04791915,  0.01760549, ...,  0.0177771 ,\n",
+       "                       -0.00661571, -0.03333431]],\n",
+       "              \n",
+       "                     [[-0.01187906, -0.04443332,  0.04576288, ...,  0.00167149,\n",
+       "                       -0.00927628,  0.00616596],\n",
+       "                      [-0.01270569,  0.02138975, -0.05224277, ...,  0.00306947,\n",
+       "                        0.00871206, -0.05778804],\n",
+       "                      [ 0.01868859, -0.05713747, -0.0174821 , ..., -0.03733874,\n",
+       "                        0.02836852, -0.04284712],\n",
+       "                      ...,\n",
+       "                      [ 0.0349387 ,  0.03672682, -0.02753093, ...,  0.00166308,\n",
+       "                       -0.01772935,  0.00616858],\n",
+       "                      [-0.0030303 , -0.00437067, -0.0290189 , ...,  0.01580735,\n",
+       "                       -0.01613746, -0.03987672],\n",
+       "                      [ 0.01220608, -0.08185615,  0.02158659, ..., -0.02559558,\n",
+       "                        0.01645808, -0.03744602]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[ 0.0013312 , -0.05324713,  0.00172486, ..., -0.04377612,\n",
+       "                        0.05795961, -0.02054776],\n",
+       "                      [-0.01609062, -0.01902576,  0.00800247, ..., -0.02614984,\n",
+       "                        0.03733749,  0.00026225],\n",
+       "                      [-0.00247638, -0.01931726, -0.01522283, ...,  0.00588738,\n",
+       "                       -0.00190235, -0.00399782],\n",
+       "                      ...,\n",
+       "                      [ 0.06571385, -0.00344569, -0.00669769, ...,  0.001024  ,\n",
+       "                        0.03480022, -0.01587555],\n",
+       "                      [ 0.02889877,  0.03159959,  0.02333231, ..., -0.00581144,\n",
+       "                       -0.02998798, -0.03450729],\n",
+       "                      [-0.02668998, -0.0034108 , -0.0105373 , ..., -0.02762248,\n",
+       "                        0.00860727,  0.02687717]],\n",
+       "              \n",
+       "                     [[ 0.01648841, -0.01285174,  0.01358325, ..., -0.08152249,\n",
+       "                        0.04437737, -0.03391603],\n",
+       "                      [ 0.07113062, -0.0359729 , -0.01348723, ..., -0.0176398 ,\n",
+       "                        0.03200765,  0.06134365],\n",
+       "                      [ 0.01156471, -0.06770372,  0.02843059, ..., -0.01153438,\n",
+       "                       -0.01228396,  0.01346244],\n",
+       "                      ...,\n",
+       "                      [-0.00569895,  0.00055908,  0.06838486, ...,  0.08354934,\n",
+       "                        0.05700811,  0.00101427],\n",
+       "                      [ 0.01807693, -0.01333605, -0.00154606, ...,  0.01078754,\n",
+       "                        0.02314062,  0.01037679],\n",
+       "                      [-0.02781903, -0.05354921, -0.06595469, ..., -0.05279655,\n",
+       "                        0.01851269, -0.00904128]],\n",
+       "              \n",
+       "                     [[ 0.00583097,  0.04983573,  0.03094061, ..., -0.02316775,\n",
+       "                       -0.02365098,  0.01838909],\n",
+       "                      [-0.02851329,  0.01512148,  0.02271658, ..., -0.03578778,\n",
+       "                        0.0036391 , -0.01013733],\n",
+       "                      [-0.10941688, -0.05352794, -0.03661714, ...,  0.01911658,\n",
+       "                       -0.0331871 ,  0.01334788],\n",
+       "                      ...,\n",
+       "                      [ 0.02926285, -0.00778401, -0.00936453, ...,  0.05407878,\n",
+       "                       -0.02920299, -0.00677245],\n",
+       "                      [ 0.00341181, -0.01542326, -0.00013787, ...,  0.00919122,\n",
+       "                       -0.00327538,  0.00982734],\n",
+       "                      [ 0.04222366, -0.00887216,  0.04550539, ..., -0.03900504,\n",
+       "                        0.02140583, -0.05328723]]], dtype=float32)>\n",
+       "              (o): <tf.Variable 'transformer/layer_._2/rel_attn/o:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[-0.0459144 ,  0.04068733, -0.01355186, ..., -0.01989118,\n",
+       "                       -0.03472243,  0.01304346],\n",
+       "                      [-0.03370773, -0.03767217,  0.01916665, ...,  0.02566565,\n",
+       "                        0.01706363,  0.0169379 ],\n",
+       "                      [ 0.02327448,  0.02124598, -0.00851453, ...,  0.04678395,\n",
+       "                       -0.03150146,  0.02959211],\n",
+       "                      ...,\n",
+       "                      [ 0.02368829,  0.03962338,  0.01558492, ...,  0.0044567 ,\n",
+       "                       -0.0315103 ,  0.04004923],\n",
+       "                      [ 0.01133197, -0.01993851,  0.027225  , ..., -0.02620822,\n",
+       "                        0.00454007,  0.01773539],\n",
+       "                      [-0.03604782, -0.03206643,  0.01872083, ...,  0.06024332,\n",
+       "                       -0.00716398,  0.0511735 ]],\n",
+       "              \n",
+       "                     [[ 0.00405366, -0.04948125,  0.03672703, ..., -0.00733926,\n",
+       "                       -0.01024133, -0.0456225 ],\n",
+       "                      [ 0.04979887,  0.01724279, -0.01421242, ..., -0.00306262,\n",
+       "                        0.02512117,  0.02159863],\n",
+       "                      [-0.03722695,  0.00468144,  0.0289183 , ..., -0.05651103,\n",
+       "                        0.02156329, -0.00495635],\n",
+       "                      ...,\n",
+       "                      [ 0.01668868,  0.01374733,  0.00024095, ...,  0.02230918,\n",
+       "                       -0.03669459, -0.01169418],\n",
+       "                      [-0.01635886, -0.00344317,  0.01114676, ..., -0.02080308,\n",
+       "                        0.01682055,  0.00250151],\n",
+       "                      [-0.01110393, -0.02011649,  0.01129264, ...,  0.02056844,\n",
+       "                       -0.02213018, -0.00444395]],\n",
+       "              \n",
+       "                     [[-0.00764826, -0.01075712, -0.065015  , ..., -0.00079673,\n",
+       "                       -0.04441076,  0.02999873],\n",
+       "                      [ 0.02219415, -0.04028346, -0.03506127, ...,  0.01997649,\n",
+       "                        0.00269448, -0.02619188],\n",
+       "                      [-0.04424787, -0.01318666, -0.00114819, ..., -0.04353184,\n",
+       "                        0.05100081, -0.00196214],\n",
+       "                      ...,\n",
+       "                      [-0.00140231,  0.04148398, -0.02321989, ..., -0.02140379,\n",
+       "                        0.00641817, -0.00452846],\n",
+       "                      [-0.00375441, -0.01005294,  0.00477563, ...,  0.03219246,\n",
+       "                       -0.0210044 , -0.00747442],\n",
+       "                      [ 0.01919622, -0.03384344,  0.02077735, ..., -0.01202968,\n",
+       "                        0.02690425,  0.01807844]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[-0.01119938, -0.01464343,  0.00398871, ...,  0.00364551,\n",
+       "                        0.00344581, -0.00462025],\n",
+       "                      [ 0.06504844, -0.01730673,  0.02013603, ..., -0.02582743,\n",
+       "                       -0.03860147, -0.0139975 ],\n",
+       "                      [-0.04559997,  0.00583538, -0.00664801, ..., -0.0149008 ,\n",
+       "                        0.03558432, -0.01965741],\n",
+       "                      ...,\n",
+       "                      [ 0.00025523,  0.00819261, -0.0307526 , ..., -0.01076851,\n",
+       "                        0.02486686, -0.02093521],\n",
+       "                      [ 0.02401941,  0.03498043,  0.0014439 , ...,  0.01171041,\n",
+       "                       -0.00058519, -0.02835972],\n",
+       "                      [ 0.00732349, -0.00456121, -0.03796291, ..., -0.03865096,\n",
+       "                       -0.01785722, -0.04314538]],\n",
+       "              \n",
+       "                     [[ 0.00726655,  0.03450558,  0.02211844, ..., -0.03010445,\n",
+       "                       -0.02838681, -0.0039719 ],\n",
+       "                      [-0.01016848,  0.01256592,  0.07358556, ..., -0.0117584 ,\n",
+       "                        0.04732952, -0.02382375],\n",
+       "                      [-0.02834523,  0.01466386,  0.03074974, ..., -0.00940978,\n",
+       "                       -0.00022519, -0.07195798],\n",
+       "                      ...,\n",
+       "                      [ 0.01355847,  0.01601157,  0.02397542, ...,  0.03484057,\n",
+       "                        0.04077799, -0.03013852],\n",
+       "                      [ 0.00740167,  0.02471284, -0.0393412 , ...,  0.02263542,\n",
+       "                        0.01461129,  0.01385937],\n",
+       "                      [ 0.02695005, -0.00959161, -0.01261136, ..., -0.00971951,\n",
+       "                        0.03261755,  0.00980215]],\n",
+       "              \n",
+       "                     [[ 0.02489883, -0.02117315, -0.01708841, ...,  0.02682983,\n",
+       "                        0.02765293, -0.03892074],\n",
+       "                      [ 0.00359684,  0.02647137, -0.0155964 , ..., -0.02545275,\n",
+       "                       -0.01858809, -0.01930472],\n",
+       "                      [-0.01306243,  0.00480867,  0.00555033, ...,  0.00739669,\n",
+       "                       -0.02284159, -0.00387958],\n",
+       "                      ...,\n",
+       "                      [ 0.01714972, -0.00192116,  0.00112109, ..., -0.01120449,\n",
+       "                       -0.02290132, -0.00165214],\n",
+       "                      [-0.02095219, -0.00792485,  0.00188622, ...,  0.01830022,\n",
+       "                        0.00613669, -0.02693458],\n",
+       "                      [-0.05250171, -0.0118492 , -0.01927755, ..., -0.01943363,\n",
+       "                        0.01223021, -0.01266978]]], dtype=float32)>\n",
+       "              (r): <tf.Variable 'transformer/layer_._2/rel_attn/r:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[-1.74154818e-01,  1.71483576e-01, -1.57918856e-01, ...,\n",
+       "                       -1.09398648e-01, -1.66214570e-01,  1.69107735e-01],\n",
+       "                      [-1.34248465e-01, -1.37429506e-01,  1.49386033e-01, ...,\n",
+       "                        1.27640173e-01,  1.43373027e-01, -1.56313241e-01],\n",
+       "                      [-1.09571531e-01, -1.28932819e-01, -1.36733443e-01, ...,\n",
+       "                       -1.53899968e-01, -1.61415860e-01, -1.55967340e-01],\n",
+       "                      ...,\n",
+       "                      [-2.67540216e-02,  9.91882980e-02, -5.10194190e-02, ...,\n",
+       "                       -3.43626109e-03,  3.33151408e-02, -3.82135659e-02],\n",
+       "                      [ 6.43306673e-02,  4.39539142e-02, -2.82719377e-02, ...,\n",
+       "                        5.20758294e-02,  4.51205000e-02, -1.25731584e-02],\n",
+       "                      [-1.54505864e-01, -1.45732820e-01, -1.48832098e-01, ...,\n",
+       "                       -1.36694744e-01,  1.42165855e-01, -1.38038144e-01]],\n",
+       "              \n",
+       "                     [[-1.34223402e-01,  1.29062846e-01, -1.10095568e-01, ...,\n",
+       "                       -4.56332713e-02, -1.35236993e-01,  1.25871733e-01],\n",
+       "                      [-1.04855791e-01, -9.51494128e-02,  1.04910910e-01, ...,\n",
+       "                        1.04753070e-01,  1.28032610e-01, -1.11456059e-01],\n",
+       "                      [-9.41539183e-02, -1.49656698e-01, -1.33008048e-01, ...,\n",
+       "                       -1.56195447e-01, -1.33284256e-01, -1.50071308e-01],\n",
+       "                      ...,\n",
+       "                      [-1.65088084e-02,  7.33572915e-02, -3.98807749e-02, ...,\n",
+       "                        2.30416749e-02,  1.75641049e-02, -4.62100022e-02],\n",
+       "                      [ 3.67465951e-02,  4.43068817e-02, -1.63640715e-02, ...,\n",
+       "                        4.77316864e-02,  4.48581763e-02,  1.15232123e-03],\n",
+       "                      [-1.06183678e-01, -9.87367705e-02, -1.01419248e-01, ...,\n",
+       "                       -8.46716315e-02,  8.80824402e-02, -1.13163486e-01]],\n",
+       "              \n",
+       "                     [[-9.73633751e-02,  8.78513753e-02, -1.10944688e-01, ...,\n",
+       "                       -5.38534336e-02, -9.78744626e-02,  1.34479314e-01],\n",
+       "                      [-8.19151998e-02, -9.94543955e-02,  5.58716655e-02, ...,\n",
+       "                        9.10466388e-02,  8.79919752e-02, -7.91056827e-02],\n",
+       "                      [-1.07165791e-01, -1.16330668e-01, -1.04530655e-01, ...,\n",
+       "                       -1.26266211e-01, -1.14166744e-01, -1.32683665e-01],\n",
+       "                      ...,\n",
+       "                      [-6.09156210e-03,  5.80127090e-02, -3.35601829e-02, ...,\n",
+       "                       -1.27315565e-04,  1.89231914e-02, -1.03578214e-02],\n",
+       "                      [ 3.55091467e-02,  3.06853075e-02, -3.44112329e-02, ...,\n",
+       "                        4.85388599e-02,  9.87971947e-03, -2.19964515e-02],\n",
+       "                      [-6.60627335e-02, -6.56424835e-02, -8.05212483e-02, ...,\n",
+       "                       -7.00480193e-02,  7.31544569e-02, -6.39438108e-02]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[-1.48311350e-02, -1.23089608e-02,  3.57820955e-03, ...,\n",
+       "                       -2.04090904e-02,  1.94556732e-03, -1.02494638e-02],\n",
+       "                      [ 4.35499102e-03, -6.63030194e-04,  1.95456371e-02, ...,\n",
+       "                       -6.83242688e-03, -1.00761633e-02, -1.73593359e-03],\n",
+       "                      [-1.80752464e-02, -1.66376941e-02, -1.10558709e-02, ...,\n",
+       "                       -2.73382664e-02,  1.69053709e-03, -1.61816720e-02],\n",
+       "                      ...,\n",
+       "                      [ 1.91931371e-02, -7.00070197e-03,  2.42002066e-02, ...,\n",
+       "                        3.97639628e-03, -8.44740868e-03,  1.29894456e-02],\n",
+       "                      [-8.07208288e-03, -4.40871762e-03,  4.02785353e-02, ...,\n",
+       "                       -2.72978912e-03, -2.89322101e-02,  1.82679240e-02],\n",
+       "                      [-2.15032008e-02, -2.35424191e-02, -3.08847502e-02, ...,\n",
+       "                       -2.68492289e-02,  9.08977166e-03, -2.62664557e-02]],\n",
+       "              \n",
+       "                     [[ 4.63743974e-03,  8.47169757e-03, -1.44635988e-02, ...,\n",
+       "                       -1.65978130e-02,  1.24762636e-02,  2.84114317e-03],\n",
+       "                      [ 2.10315473e-02,  3.91109427e-03,  1.73604600e-02, ...,\n",
+       "                       -2.32025096e-03,  5.87290479e-03,  9.85332299e-05],\n",
+       "                      [-2.55174581e-02, -5.42022474e-03,  4.37739212e-03, ...,\n",
+       "                       -2.30460241e-03,  3.03133507e-03, -1.33659486e-02],\n",
+       "                      ...,\n",
+       "                      [-1.23453815e-03, -1.62221733e-02,  1.88910943e-02, ...,\n",
+       "                       -2.35769432e-02,  1.02529228e-02,  9.97068919e-03],\n",
+       "                      [ 1.09659694e-02,  4.10200097e-03, -3.22548039e-02, ...,\n",
+       "                        9.11346730e-03,  1.90772861e-02, -2.13330518e-02],\n",
+       "                      [ 8.70900694e-03,  3.51738883e-03, -1.52583178e-02, ...,\n",
+       "                       -3.99373658e-03, -7.65542360e-03,  1.30024115e-02]],\n",
+       "              \n",
+       "                     [[-1.07049560e-02,  2.16062423e-02, -2.15930026e-02, ...,\n",
+       "                        1.26719456e-02,  7.11302564e-05,  8.03572778e-03],\n",
+       "                      [ 1.24141166e-04,  7.36288028e-03, -6.79872115e-04, ...,\n",
+       "                        2.49428093e-03, -1.16298664e-02,  2.27960074e-04],\n",
+       "                      [-9.86421760e-03, -2.49710362e-02, -2.40540970e-02, ...,\n",
+       "                       -4.42250725e-03, -2.89662927e-02, -1.20275375e-02],\n",
+       "                      ...,\n",
+       "                      [ 3.12622730e-03, -6.99984375e-03, -2.77643427e-02, ...,\n",
+       "                       -1.10041993e-02, -2.18351595e-02,  2.90531025e-05],\n",
+       "                      [-3.10673728e-03, -1.49604697e-02,  1.97154842e-02, ...,\n",
+       "                        2.03390904e-02, -1.56578294e-03, -5.11408225e-03],\n",
+       "                      [ 2.66231168e-02,  1.82542447e-02,  2.63125654e-02, ...,\n",
+       "                        1.70649234e-02, -2.89466791e-02,  2.94499528e-02]]],\n",
+       "                    dtype=float32)>\n",
+       "              (r_r_bias): <tf.Variable 'transformer/layer_._2/rel_attn/r_r_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "              array([[ 0.2688689 , -0.26965415,  0.24901254, -0.21432097, -0.2537209 ,\n",
+       "                      -0.25497636, -0.25866804, -0.26985508,  0.279801  ,  0.13522011,\n",
+       "                       0.25756484, -0.24836208],\n",
+       "                     [ 0.22552061,  0.24260372, -0.19067137,  0.22706836,  0.24444126,\n",
+       "                      -0.22470543, -0.20988142,  0.21856506, -0.21155524, -0.23370892,\n",
+       "                      -0.24733196,  0.22796093],\n",
+       "                     [ 0.17451425,  0.24542138,  0.25050005,  0.22542311,  0.23060308,\n",
+       "                       0.23414634, -0.24786818, -0.22182368, -0.26085967,  0.2449251 ,\n",
+       "                       0.23860171,  0.2544802 ],\n",
+       "                     [-0.26321352,  0.25723347, -0.26902857,  0.26281124, -0.2697539 ,\n",
+       "                      -0.25095993,  0.2511667 , -0.26299623,  0.25617778, -0.26167557,\n",
+       "                       0.23467393, -0.2685565 ],\n",
+       "                     [ 0.17467302, -0.16205215, -0.1877693 ,  0.19500752,  0.2010059 ,\n",
+       "                       0.19327593, -0.15914948, -0.15686454,  0.17404646, -0.18154949,\n",
+       "                      -0.19225396, -0.22171909],\n",
+       "                     [ 0.2911585 ,  0.2944224 ,  0.30023518, -0.28492442,  0.29406187,\n",
+       "                       0.27411905,  0.28787902,  0.2629663 , -0.2700486 ,  0.28186122,\n",
+       "                       0.26866576, -0.2760028 ],\n",
+       "                     [ 0.23711525,  0.24224289,  0.2396094 ,  0.23603547,  0.22876322,\n",
+       "                      -0.1514269 , -0.21984197, -0.25572085,  0.22679004, -0.22610106,\n",
+       "                      -0.18015033,  0.23062935],\n",
+       "                     [ 0.14032885,  0.17071794, -0.17316875, -0.16643512,  0.1764703 ,\n",
+       "                      -0.16535877,  0.16976672, -0.17395648, -0.18172397, -0.16909888,\n",
+       "                      -0.15671346,  0.17406578],\n",
+       "                     [ 0.27129218,  0.0269384 ,  0.30974644, -0.32017758,  0.30744395,\n",
+       "                       0.3084069 ,  0.29277486, -0.2918221 ,  0.30702245, -0.3208851 ,\n",
+       "                      -0.31668597,  0.30160227],\n",
+       "                     [ 0.20867229,  0.26565212,  0.240152  ,  0.25398126,  0.25057864,\n",
+       "                      -0.2671012 , -0.22444747, -0.25539088, -0.20067541,  0.24432313,\n",
+       "                       0.25486085,  0.24394904],\n",
+       "                     [-0.11263231, -0.10217136,  0.11905885,  0.11843061, -0.04683039,\n",
+       "                      -0.1214601 , -0.13461663, -0.11759   , -0.09937124, -0.11690577,\n",
+       "                      -0.11399411, -0.11268682],\n",
+       "                     [-0.3255043 ,  0.3025848 , -0.32363445,  0.31425825,  0.33041543,\n",
+       "                      -0.32620475,  0.33724216, -0.34903747,  0.33359587, -0.32901266,\n",
+       "                      -0.20129874, -0.27945545],\n",
+       "                     [-0.28321803,  0.30109507,  0.28544128, -0.2959158 , -0.2607007 ,\n",
+       "                      -0.3055412 , -0.2917673 ,  0.05050412,  0.29260388,  0.3141212 ,\n",
+       "                       0.2934034 ,  0.27473462],\n",
+       "                     [ 0.13607652, -0.15221834,  0.12748647,  0.13965258, -0.13058284,\n",
+       "                       0.11827224, -0.14616172, -0.1512048 , -0.14531319,  0.12655123,\n",
+       "                      -0.13622668,  0.14556718],\n",
+       "                     [-0.11822458, -0.13290364,  0.12828259, -0.10410035,  0.11239365,\n",
+       "                      -0.1154983 ,  0.11172337, -0.07072505, -0.13299397, -0.14156868,\n",
+       "                      -0.13565728,  0.12855493],\n",
+       "                     [ 0.21563186,  0.2163769 ,  0.20157547, -0.1918813 ,  0.2039993 ,\n",
+       "                      -0.17185296,  0.20537192, -0.22688936,  0.17318453,  0.20538278,\n",
+       "                      -0.20797041,  0.21802594]], dtype=float32)>\n",
+       "              (r_s_bias): <tf.Variable 'transformer/layer_._2/rel_attn/r_s_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "              array([[0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.]], dtype=float32)>\n",
+       "              (r_w_bias): <tf.Variable 'transformer/layer_._2/rel_attn/r_w_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "              array([[-0.05696932,  0.06740195, -0.04667107,  0.03021106,  0.06784655,\n",
+       "                       0.05382765,  0.11438312,  0.06822202, -0.05993791,  0.0104263 ,\n",
+       "                      -0.05300143,  0.05010788],\n",
+       "                     [-0.01765995, -0.00319457, -0.00498415, -0.02782676, -0.0098952 ,\n",
+       "                       0.0253829 ,  0.00407754, -0.00715973, -0.01590695,  0.03437943,\n",
+       "                      -0.00520796,  0.01617681],\n",
+       "                     [ 0.03272007, -0.02977583, -0.0506134 , -0.02890366, -0.02049887,\n",
+       "                      -0.01999169,  0.02516508,  0.0137186 ,  0.05666393,  0.01375697,\n",
+       "                      -0.00890318, -0.02950851],\n",
+       "                     [ 0.04980705, -0.10362899,  0.11056181, -0.00730947,  0.0607907 ,\n",
+       "                       0.11900052, -0.05051542,  0.00662729, -0.07860364,  0.10183192,\n",
+       "                      -0.06212043,  0.10200542],\n",
+       "                     [-0.01238653,  0.01794332,  0.01029513,  0.01060856,  0.06930448,\n",
+       "                       0.02380366,  0.03477835, -0.00071606, -0.01467696,  0.02097475,\n",
+       "                      -0.05677698, -0.02087275],\n",
+       "                     [-0.00938045, -0.10405949, -0.16658893,  0.11485966, -0.09381208,\n",
+       "                      -0.09224471, -0.08554322, -0.10385393,  0.05632018, -0.08339553,\n",
+       "                      -0.07872038,  0.08625405],\n",
+       "                     [-0.00826191,  0.00976967, -0.05739374, -0.0021869 , -0.01485464,\n",
+       "                       0.04506572,  0.01217067, -0.02800449, -0.05174134,  0.00862589,\n",
+       "                      -0.048445  , -0.01480543],\n",
+       "                     [-0.03782475,  0.02112421, -0.02993089,  0.02389399,  0.01590282,\n",
+       "                      -0.07890326,  0.02925709, -0.01764274, -0.01462149, -0.02284196,\n",
+       "                      -0.00965995,  0.03196143],\n",
+       "                     [-0.0716677 ,  0.02040408, -0.10738931,  0.01476234, -0.13842428,\n",
+       "                      -0.16400102, -0.10327879,  0.12093128, -0.10067357,  0.06000268,\n",
+       "                       0.1498203 , -0.13828841],\n",
+       "                     [-0.0734336 , -0.03922071,  0.04693641,  0.04044463, -0.02889867,\n",
+       "                       0.02146053,  0.02633213,  0.03645428,  0.01565466, -0.03198807,\n",
+       "                      -0.04235039, -0.03586181],\n",
+       "                     [-0.0363492 , -0.01702744,  0.01083277,  0.03850618, -0.03934945,\n",
+       "                       0.0334761 , -0.01588807, -0.02619908, -0.03216818, -0.01060551,\n",
+       "                      -0.02627585, -0.02604468],\n",
+       "                     [ 0.17790402, -0.12851508,  0.15003633, -0.08518519, -0.14476636,\n",
+       "                       0.15762399, -0.1230861 ,  0.11259855, -0.1162812 ,  0.04080873,\n",
+       "                      -0.05779656,  0.01974249],\n",
+       "                     [ 0.1006938 , -0.01474479, -0.12138946,  0.09284463, -0.03289664,\n",
+       "                       0.10987794,  0.07332658,  0.07245267, -0.06578953, -0.04563607,\n",
+       "                      -0.05779454, -0.10485042],\n",
+       "                     [ 0.02835969, -0.02732395, -0.03461828,  0.03488555, -0.0194285 ,\n",
+       "                      -0.02805083, -0.03940667, -0.04644369, -0.04771877,  0.0372751 ,\n",
+       "                      -0.04531232,  0.04370135],\n",
+       "                     [-0.03590996, -0.0298533 ,  0.03344881, -0.02929044,  0.0327831 ,\n",
+       "                      -0.03273273,  0.03038734, -0.01118592, -0.02868269, -0.02645629,\n",
+       "                      -0.03735423,  0.03250728],\n",
+       "                     [ 0.02255821, -0.00829006,  0.02793193, -0.03778297, -0.00788219,\n",
+       "                      -0.04285704,  0.02978727,  0.05981049, -0.03792181,  0.03670314,\n",
+       "                      -0.02965603,  0.01923521]], dtype=float32)>\n",
+       "              (seg_embed): <tf.Variable 'transformer/layer_._2/rel_attn/seg_embed:0' shape=(2, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[-1.76201500e-02,  7.23677780e-03,  2.01333477e-03,\n",
+       "                       -2.08359188e-03, -1.94589060e-03, -4.36071586e-03,\n",
+       "                       -2.57775449e-04,  7.59294024e-03, -1.73478248e-03,\n",
+       "                       -8.46251752e-03, -1.39660882e-02, -3.43717635e-03],\n",
+       "                      [-4.64910455e-03, -1.21313529e-02,  4.58984112e-04,\n",
+       "                       -1.35235321e-02, -1.04260454e-02, -1.50275379e-02,\n",
+       "                        1.48641376e-03,  1.55189037e-02,  5.91089716e-03,\n",
+       "                       -1.43639045e-03, -4.50501451e-03, -1.60674599e-03],\n",
+       "                      [ 1.60457045e-02,  1.19220214e-02, -1.28411585e-02,\n",
+       "                        9.09075513e-03, -1.58246304e-03,  1.31560909e-03,\n",
+       "                        1.35482438e-02,  5.81168523e-03, -1.05840880e-02,\n",
+       "                       -2.59173219e-03, -1.32385837e-02, -1.04863010e-02],\n",
+       "                      [-1.21809123e-02, -9.36632976e-03,  1.40900621e-02,\n",
+       "                        5.91376238e-03,  3.72369075e-03, -2.30165408e-03,\n",
+       "                        6.51500374e-03, -1.45569751e-02,  1.43247042e-02,\n",
+       "                        8.62884428e-03,  8.86701699e-03,  7.06208264e-03],\n",
+       "                      [ 1.02975138e-03, -1.51113952e-02,  1.51367933e-02,\n",
+       "                        9.86063853e-03, -2.37684697e-03,  1.99867710e-02,\n",
+       "                        8.06052238e-03, -7.84497056e-03,  3.50654381e-03,\n",
+       "                        3.82472947e-03, -3.21561890e-03,  7.42827263e-03],\n",
+       "                      [-1.18214521e-03, -1.43715926e-02, -8.06425512e-03,\n",
+       "                       -4.83092666e-03, -6.24039629e-03, -8.07906594e-03,\n",
+       "                       -8.29043146e-03, -1.61064218e-03,  4.77965921e-03,\n",
+       "                       -1.74443778e-02,  1.33291204e-02,  2.52250186e-03],\n",
+       "                      [-2.72214878e-04, -5.96261350e-03, -4.04428970e-03,\n",
+       "                       -6.11912599e-03, -6.60097087e-03,  1.76098440e-02,\n",
+       "                        2.69631855e-03,  1.54615650e-02, -2.30501313e-03,\n",
+       "                        1.05330944e-02,  6.35499740e-03,  9.17971018e-04],\n",
+       "                      [ 1.18885133e-02, -1.31673440e-02, -1.38173029e-02,\n",
+       "                       -3.70214053e-04,  5.35412400e-04, -1.37663968e-02,\n",
+       "                        1.87561940e-02, -2.42887018e-03,  1.48599371e-02,\n",
+       "                        3.21199768e-03, -1.09921275e-02, -5.65451774e-05],\n",
+       "                      [-3.74776288e-03,  1.38268322e-02,  9.05366149e-04,\n",
+       "                        1.20775551e-02,  1.10800657e-02, -8.72297771e-03,\n",
+       "                        4.18304279e-03,  4.37156297e-03, -1.07811140e-02,\n",
+       "                        1.92405155e-03,  3.25367018e-03,  8.75506643e-03],\n",
+       "                      [-1.75420940e-02,  6.48414111e-03, -9.18684620e-03,\n",
+       "                        1.14019576e-03, -1.57787383e-03,  5.56192547e-03,\n",
+       "                       -2.17733742e-03,  1.37266740e-02,  1.05201543e-04,\n",
+       "                        6.03883620e-03, -6.69960165e-03,  7.33956508e-03],\n",
+       "                      [-3.18406359e-03, -3.90002085e-03,  1.50526362e-02,\n",
+       "                       -1.12941780e-03,  7.90258031e-03,  5.57251694e-03,\n",
+       "                       -7.09417462e-03,  1.54607017e-02,  7.53346644e-03,\n",
+       "                        3.84633575e-04, -3.10583878e-03, -1.67749040e-02],\n",
+       "                      [ 1.35503442e-03,  1.14696333e-02,  1.69651874e-03,\n",
+       "                       -7.29335006e-03, -5.32992696e-03,  1.07378103e-02,\n",
+       "                        4.87127202e-03, -2.83743930e-03,  1.49954585e-02,\n",
+       "                       -4.96328762e-03,  3.51505092e-04, -1.27301645e-02],\n",
+       "                      [-1.52372206e-02,  1.93297828e-03,  1.31188966e-02,\n",
+       "                        1.51950726e-02, -5.42309275e-03,  5.40221622e-03,\n",
+       "                       -4.99887299e-03,  1.21317999e-02, -7.83546944e-04,\n",
+       "                       -1.46692842e-02,  3.18376743e-03,  6.29057584e-04],\n",
+       "                      [ 1.57519914e-02,  1.33262370e-02,  1.81965269e-02,\n",
+       "                       -7.42383441e-03, -1.89367812e-02, -6.97921682e-03,\n",
+       "                        1.48802875e-02,  1.46334016e-04,  7.02118780e-03,\n",
+       "                       -5.09436592e-04, -1.18623655e-02,  8.64821393e-03],\n",
+       "                      [ 7.67512945e-03, -8.17312021e-03,  2.41133641e-03,\n",
+       "                        6.33313879e-03,  7.54179759e-03, -3.57080396e-04,\n",
+       "                       -1.65680032e-02, -1.17100859e-02, -3.40799033e-03,\n",
+       "                       -1.27221271e-02,  8.30271374e-03,  7.56895775e-03],\n",
+       "                      [-9.88331065e-03, -1.54634397e-02,  3.01517267e-03,\n",
+       "                        1.49145685e-02,  3.77843564e-04,  5.24123758e-03,\n",
+       "                        7.02060014e-03, -1.07852966e-02,  1.04165310e-02,\n",
+       "                       -1.54804869e-03,  1.93265197e-03,  1.79295102e-03]],\n",
+       "              \n",
+       "                     [[-9.20055062e-03, -4.07590671e-03,  1.03095314e-02,\n",
+       "                        1.51754147e-03, -6.64392672e-03,  3.19885346e-03,\n",
+       "                       -4.18524677e-03, -1.13258476e-03, -1.70869473e-02,\n",
+       "                        1.26075298e-02, -1.30983908e-02, -7.83024263e-03],\n",
+       "                      [ 8.46219435e-03,  1.79808959e-02, -5.26713906e-03,\n",
+       "                       -1.21411623e-03,  1.86999720e-02, -3.02859768e-03,\n",
+       "                       -7.32064573e-03,  6.67995447e-03, -1.27523849e-02,\n",
+       "                       -9.06828791e-04,  9.74638015e-03, -1.72092929e-03],\n",
+       "                      [-2.01144046e-03, -5.63319679e-03, -5.22003649e-03,\n",
+       "                       -6.08433876e-03, -4.08862112e-03,  1.46857975e-02,\n",
+       "                        5.76145761e-03, -5.26309886e-04,  1.52066564e-02,\n",
+       "                       -9.31825582e-03,  1.23050511e-02, -4.26228344e-03],\n",
+       "                      [ 5.15877875e-03,  1.52563385e-03,  3.33353621e-03,\n",
+       "                        1.24664837e-02,  2.89318291e-03,  1.85139419e-03,\n",
+       "                        1.32558951e-02, -6.19108090e-03, -9.30891279e-03,\n",
+       "                       -1.32808858e-03,  7.90562108e-03, -1.03561748e-02],\n",
+       "                      [ 5.24061127e-03,  1.13433264e-02,  9.25735664e-03,\n",
+       "                       -4.02201712e-03,  2.17584849e-04,  5.15505997e-03,\n",
+       "                        1.17364945e-02, -2.31140363e-03, -5.13278367e-03,\n",
+       "                        1.39841707e-02,  6.70559751e-03, -6.61857938e-03],\n",
+       "                      [-8.77800304e-03,  2.86807003e-03, -2.38788500e-03,\n",
+       "                       -4.60851612e-03, -1.44038992e-02, -1.35576446e-02,\n",
+       "                        2.62864912e-03,  1.24858366e-02, -4.75487951e-03,\n",
+       "                       -1.43712144e-02,  7.60273263e-03,  3.79640306e-03],\n",
+       "                      [-7.03944918e-03,  1.97168030e-02, -7.26960087e-03,\n",
+       "                       -1.95749779e-03,  1.92702599e-02,  4.81317611e-03,\n",
+       "                        3.79350944e-03, -4.26485110e-03, -8.09873175e-03,\n",
+       "                        9.86441132e-03,  1.22883695e-03,  1.08946105e-02],\n",
+       "                      [-5.65246725e-03,  1.21349460e-02,  8.74449220e-03,\n",
+       "                        2.44105165e-03,  9.21645202e-04, -1.55313788e-02,\n",
+       "                       -5.02558984e-03, -8.27753078e-03,  1.90036907e-03,\n",
+       "                       -5.53005328e-03, -4.72517498e-03,  2.99230800e-03],\n",
+       "                      [ 9.09654330e-03,  3.31225386e-03, -9.27547738e-03,\n",
+       "                        1.19113754e-02, -1.02159902e-02,  6.25002244e-03,\n",
+       "                        1.22169312e-02, -9.51310806e-03,  1.30269127e-02,\n",
+       "                       -9.39868111e-03, -5.70971100e-03, -4.75845346e-03],\n",
+       "                      [-7.14318268e-03, -1.64083187e-02, -2.20953533e-03,\n",
+       "                        6.77416055e-03,  7.19653070e-03, -7.37716153e-04,\n",
+       "                       -9.68988799e-03, -8.25300999e-03, -4.56864573e-03,\n",
+       "                       -2.91621801e-03, -5.80342347e-03, -3.35400272e-03],\n",
+       "                      [-1.02773616e-02, -5.61380177e-04,  1.61001328e-02,\n",
+       "                        2.81318300e-03, -4.40954976e-03,  1.18312403e-03,\n",
+       "                        6.44329004e-03, -6.98125642e-03, -1.70135554e-02,\n",
+       "                       -3.60937743e-03, -7.53390486e-04, -2.80036475e-03],\n",
+       "                      [ 3.10404622e-03,  1.14401504e-02, -5.79726277e-03,\n",
+       "                        1.60975326e-02,  6.44704467e-03, -1.83150265e-02,\n",
+       "                        1.08390385e-02,  1.02912402e-02, -8.38461891e-03,\n",
+       "                        5.39217493e-04, -9.44596343e-03, -7.39992782e-03],\n",
+       "                      [-2.65034917e-03, -8.84522311e-03, -9.31692962e-03,\n",
+       "                        5.32580819e-03, -1.69087376e-03,  2.63938890e-03,\n",
+       "                        8.64508655e-03,  1.84377395e-02,  1.37084173e-02,\n",
+       "                       -1.89692043e-02,  1.31469080e-02,  1.86770391e-02],\n",
+       "                      [ 2.77522532e-03,  7.73473585e-04, -3.17918998e-03,\n",
+       "                        6.54795533e-03,  2.26482097e-03,  2.92668981e-03,\n",
+       "                        9.05719213e-03, -8.49937089e-03, -7.30413711e-04,\n",
+       "                        5.80394780e-03, -1.54569661e-02, -6.13560947e-03],\n",
+       "                      [-5.60323242e-03,  3.84009560e-03,  1.06589124e-02,\n",
+       "                       -8.98534432e-03,  1.82283614e-02, -5.89990197e-03,\n",
+       "                       -8.10589176e-03,  2.83340388e-03,  1.38193602e-02,\n",
+       "                       -9.81133338e-03,  1.99420359e-02,  9.88560077e-03],\n",
+       "                      [-9.26352944e-03, -9.68698412e-03, -2.24529719e-03,\n",
+       "                        5.43415966e-03,  1.32604288e-02, -3.96666024e-03,\n",
+       "                       -1.34215793e-02,  1.25270914e-02, -1.48909222e-02,\n",
+       "                        2.03456427e-03, -6.15184056e-03, -1.86165944e-02]]],\n",
+       "                    dtype=float32)>\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "            (ff): TFXLNetFeedForward(\n",
+       "              (layer_norm): LayerNormalization(\n",
+       "                (axis): List(\n",
+       "                  (0): 2\n",
+       "                )\n",
+       "                (gamma): <tf.Variable 'transformer/layer_._2/ff/layer_norm/gamma:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([1.2426662 , 1.0785499 , 1.1864272 , 1.1377372 , 1.1753842 ,\n",
+       "                       1.021473  , 0.9678357 , 1.075388  , 1.3095288 , 1.1425663 ,\n",
+       "                       1.1866144 , 1.2455702 , 1.2347478 , 1.1598873 , 1.1709665 ,\n",
+       "                       1.2157438 , 1.2720231 , 1.1773459 , 1.1897057 , 1.2453034 ,\n",
+       "                       1.2315087 , 0.8506601 , 1.070401  , 1.1797608 , 1.2647007 ,\n",
+       "                       1.2300415 , 1.3117491 , 1.0503579 , 1.1387292 , 1.1583905 ,\n",
+       "                       1.3045065 , 0.8964496 , 1.1164156 , 1.2434596 , 1.2388874 ,\n",
+       "                       1.2253768 , 1.1266948 , 1.0823714 , 1.1271874 , 1.1423486 ,\n",
+       "                       1.2114882 , 1.1171185 , 1.1692193 , 1.2141284 , 1.1173588 ,\n",
+       "                       1.2316343 , 1.1557999 , 1.1985208 , 1.1526998 , 1.1652381 ,\n",
+       "                       1.1020889 , 1.2839859 , 1.255206  , 1.2338889 , 1.1334827 ,\n",
+       "                       1.2606637 , 1.1768172 , 1.133126  , 1.1616554 , 1.2591982 ,\n",
+       "                       1.2608087 , 1.2771136 , 1.2220011 , 1.2126131 , 1.3102369 ,\n",
+       "                       1.161485  , 1.2388053 , 1.0854522 , 1.109191  , 1.2433244 ,\n",
+       "                       1.1612333 , 1.119974  , 1.1657274 , 1.2391368 , 1.2408532 ,\n",
+       "                       1.2713405 , 1.2003607 , 1.0934154 , 1.2725589 , 1.2331755 ,\n",
+       "                       1.1576575 , 1.2792869 , 1.0979929 , 1.2165016 , 1.2552319 ,\n",
+       "                       1.2154813 , 1.2387912 , 1.2113545 , 1.092492  , 1.287265  ,\n",
+       "                       1.2405735 , 1.086961  , 1.2186264 , 1.3057741 , 1.2447143 ,\n",
+       "                       1.145893  , 1.0720298 , 1.1931537 , 1.2258768 , 1.2223678 ,\n",
+       "                       1.1108402 , 1.2334076 , 1.2989581 , 1.0500095 , 1.2545264 ,\n",
+       "                       1.254883  , 1.06171   , 1.1827933 , 1.2883551 , 1.2290361 ,\n",
+       "                       1.1559633 , 1.0829264 , 1.2454283 , 1.2021191 , 1.1572067 ,\n",
+       "                       1.1571015 , 1.2683761 , 1.0523615 , 1.1081159 , 1.1978542 ,\n",
+       "                       1.2392715 , 1.1955217 , 1.154171  , 1.1076897 , 1.2144334 ,\n",
+       "                       1.0649818 , 1.2400447 , 1.1655055 , 1.1342129 , 1.2052649 ,\n",
+       "                       1.3010224 , 1.1970998 , 1.0977236 , 1.2325233 , 1.1176093 ,\n",
+       "                       1.1990188 , 1.1427927 , 1.1808167 , 1.1174316 , 1.1828363 ,\n",
+       "                       1.1767571 , 1.2167183 , 1.1697968 , 1.1744046 , 0.8939868 ,\n",
+       "                       1.2574182 , 1.2255412 , 1.2447684 , 1.1385155 , 1.1537726 ,\n",
+       "                       1.2788998 , 1.1112866 , 1.2417119 , 1.2249215 , 1.2867014 ,\n",
+       "                       1.1683307 , 1.2784356 , 1.1631655 , 1.1246334 , 1.2807626 ,\n",
+       "                       1.2504355 , 1.09938   , 1.2896625 , 1.2980561 , 1.1257046 ,\n",
+       "                       1.246858  , 1.0817022 , 1.0696605 , 1.2495583 , 1.2915183 ,\n",
+       "                       1.1820105 , 0.96095157, 1.1545107 , 1.1149871 , 1.1985911 ,\n",
+       "                       1.2794744 , 1.1154523 , 1.1982616 , 1.1381829 , 1.22324   ,\n",
+       "                       1.1455675 , 1.1988021 , 1.3195752 , 1.2144073 , 1.2616345 ,\n",
+       "                       1.1431206 , 1.2790085 , 1.0831236 , 1.125044  , 1.2778053 ,\n",
+       "                       1.1591135 , 1.1882532 ], dtype=float32)>\n",
+       "                (beta): <tf.Variable 'transformer/layer_._2/ff/layer_norm/beta:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([-0.01049791,  0.02152375, -0.03378561,  0.03164947,  0.00819711,\n",
+       "                       -0.01405335, -0.02091987,  0.00788867, -0.01027707, -0.00172993,\n",
+       "                       -0.01103046,  0.00836649,  0.00941498,  0.0382531 , -0.00642702,\n",
+       "                        0.01852331,  0.00470948,  0.02344545,  0.01141193,  0.00127532,\n",
+       "                        0.01603293, -0.04580598, -0.01747353,  0.02438874, -0.04060405,\n",
+       "                        0.00479471, -0.00592997, -0.00421144, -0.01156144, -0.00946089,\n",
+       "                       -0.00481299,  0.04446075, -0.04495647, -0.01447472,  0.02050785,\n",
+       "                       -0.00235888, -0.0057586 ,  0.01404028, -0.0084481 , -0.00079954,\n",
+       "                        0.00200081,  0.01832308, -0.01832635,  0.01489427,  0.00268834,\n",
+       "                       -0.02017709,  0.04548539,  0.05178156,  0.02737129, -0.00052763,\n",
+       "                        0.00891565,  0.01618693,  0.02362686, -0.01064536,  0.01651912,\n",
+       "                        0.03200817, -0.01955355, -0.00421685, -0.05510062, -0.00611641,\n",
+       "                       -0.01592397, -0.02227358, -0.02164057, -0.01181097,  0.00364242,\n",
+       "                       -0.01818874,  0.02677143,  0.00873136,  0.00520407,  0.00165503,\n",
+       "                       -0.0106048 , -0.0474345 , -0.01927847, -0.00275519, -0.05010425,\n",
+       "                        0.00443012, -0.02050812, -0.01938166,  0.02276452, -0.0491508 ,\n",
+       "                       -0.02156696,  0.00576269,  0.01251344, -0.00798486,  0.01934762,\n",
+       "                       -0.00466829,  0.02987502,  0.0449635 ,  0.02794607, -0.01035585,\n",
+       "                       -0.03455339, -0.02017214, -0.01751639,  0.00814069, -0.00960286,\n",
+       "                        0.02078385, -0.00918255,  0.04219389,  0.01527736, -0.00782714,\n",
+       "                       -0.01744033,  0.02201356, -0.01601992,  0.038303  ,  0.03574631,\n",
+       "                        0.04583006,  0.00173102,  0.02031284,  0.0127416 , -0.04929825,\n",
+       "                       -0.00745583, -0.00845573, -0.00315962,  0.0541168 ,  0.03200234,\n",
+       "                        0.00109879, -0.00174849,  0.01873765,  0.00980952,  0.03789899,\n",
+       "                       -0.00356435, -0.02858787, -0.01368637,  0.0037826 , -0.00455629,\n",
+       "                       -0.02301045, -0.03979176,  0.02152948, -0.0191615 ,  0.05090038,\n",
+       "                        0.01223159, -0.01177116, -0.01836306, -0.01753503,  0.00840725,\n",
+       "                        0.01081169, -0.03334855,  0.02582728, -0.00310735,  0.01060186,\n",
+       "                        0.02900856, -0.00193786, -0.00611028, -0.02355231,  0.02730693,\n",
+       "                        0.0168157 ,  0.0453185 , -0.00795171, -0.0490472 ,  0.01299703,\n",
+       "                       -0.01211376, -0.04820883, -0.00058289,  0.03355829,  0.00526739,\n",
+       "                       -0.00226219, -0.00548809,  0.01104187, -0.01620302, -0.01379755,\n",
+       "                        0.03002222,  0.01691281, -0.03559435,  0.02778582,  0.00775762,\n",
+       "                        0.00697485, -0.00750486,  0.02037126,  0.01142175,  0.00481389,\n",
+       "                        0.00276021,  0.05482011,  0.04322674, -0.00956445,  0.00750658,\n",
+       "                       -0.03632697, -0.00013556, -0.03406565, -0.01553119,  0.00891615,\n",
+       "                       -0.03667552,  0.0512755 ,  0.0034136 ,  0.03808332, -0.01828413,\n",
+       "                        0.01024727,  0.03339678, -0.01204124,  0.01003862, -0.00612356,\n",
+       "                       -0.00908286,  0.01659943], dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (layer_1): Dense(\n",
+       "                768, activation=linear, use_bias=True\n",
+       "                (kernel): <tf.Variable 'transformer/layer_._2/ff/layer_1/kernel:0' shape=(192, 768) dtype=float32, numpy=\n",
+       "                array([[ 0.0200138 ,  0.0453618 ,  0.05944573, ..., -0.03587371,\n",
+       "                         0.01224422, -0.00072175],\n",
+       "                       [ 0.02137091, -0.01859555, -0.04710541, ..., -0.02794299,\n",
+       "                         0.01419899, -0.0136291 ],\n",
+       "                       [-0.03292815,  0.00347762,  0.05609084, ...,  0.03168143,\n",
+       "                        -0.0128223 ,  0.00386102],\n",
+       "                       ...,\n",
+       "                       [-0.02450894, -0.02459157, -0.0068263 , ...,  0.04013702,\n",
+       "                        -0.00466742, -0.02921941],\n",
+       "                       [ 0.03239494, -0.00134928,  0.00123798, ...,  0.00292211,\n",
+       "                        -0.00111932,  0.02714985],\n",
+       "                       [-0.02418012,  0.01257174, -0.00812958, ..., -0.04709027,\n",
+       "                         0.01096694, -0.02088788]], dtype=float32)>\n",
+       "                (bias): <tf.Variable 'transformer/layer_._2/ff/layer_1/bias:0' shape=(768,) dtype=float32, numpy=\n",
+       "                array([-3.33372578e-02, -1.20304301e-02, -2.64285505e-02, -8.84530786e-03,\n",
+       "                        9.27949324e-03, -1.14668226e-02, -3.10168378e-02, -1.43622728e-02,\n",
+       "                       -1.12179536e-02, -3.48813981e-02, -7.80524500e-03, -6.67409645e-03,\n",
+       "                       -2.71618329e-02,  1.33763952e-02, -1.43442694e-02, -2.26112269e-02,\n",
+       "                       -1.89228449e-02,  4.67353873e-03, -7.46711437e-03, -4.57441760e-03,\n",
+       "                       -1.14336181e-02, -3.73703078e-03, -4.13804967e-03, -2.49586198e-02,\n",
+       "                       -2.95854453e-02,  6.92587765e-03, -2.84688734e-03, -8.96761846e-03,\n",
+       "                        2.66582938e-04,  2.34540319e-03, -1.01395976e-02, -1.24753118e-02,\n",
+       "                       -2.55310051e-02, -1.66565515e-02, -2.73905843e-02, -1.69004244e-03,\n",
+       "                       -9.20773949e-03, -1.39765264e-02, -1.25533100e-02, -6.37155911e-03,\n",
+       "                       -2.09209453e-02, -3.99773149e-03, -1.79250874e-02,  4.29014070e-03,\n",
+       "                       -5.00511331e-03, -9.72811226e-03,  1.04333623e-04, -1.89962573e-02,\n",
+       "                       -1.60261542e-02, -1.94814522e-02,  1.01348842e-02, -8.10685009e-03,\n",
+       "                        2.04461813e-03, -2.24812888e-02, -6.67038467e-03, -1.02129420e-02,\n",
+       "                       -1.79766286e-02, -8.14508274e-03,  8.25855602e-03, -2.43141619e-03,\n",
+       "                       -7.08713830e-02, -1.82897076e-02, -2.60730693e-03, -1.65768694e-02,\n",
+       "                       -1.64023545e-02, -1.30782751e-02, -4.28689923e-03,  6.52118400e-03,\n",
+       "                       -1.96230076e-02, -3.99262942e-02, -2.73289271e-02,  4.30044835e-04,\n",
+       "                       -1.49638178e-02, -5.51447086e-02, -9.65916365e-03,  3.96977365e-03,\n",
+       "                        1.84384976e-02, -5.73096680e-04, -2.91963312e-04, -1.73625816e-02,\n",
+       "                       -3.48348282e-02, -7.23623345e-03, -1.28294611e-02, -1.53274667e-02,\n",
+       "                       -4.12606215e-03, -1.72958728e-02, -1.18990690e-02, -3.26990895e-02,\n",
+       "                       -4.20313291e-02,  5.03082108e-03,  2.19244440e-03, -2.19866037e-02,\n",
+       "                       -1.68198347e-02, -3.78365703e-02, -9.67846625e-03, -6.25378080e-03,\n",
+       "                       -1.03926891e-03,  1.34079829e-02,  3.34297912e-03, -2.53701061e-02,\n",
+       "                       -9.54755396e-03, -1.01934336e-02, -1.20657152e-02, -2.67628189e-02,\n",
+       "                       -8.09953455e-03, -6.08193688e-03,  3.38082924e-03, -1.18695842e-02,\n",
+       "                       -3.71371172e-02, -7.80474115e-03,  1.11220693e-02, -8.33167508e-03,\n",
+       "                       -5.58236428e-03, -1.80757064e-02, -2.09607501e-02,  5.48776379e-03,\n",
+       "                       -2.94951964e-02, -2.46344414e-02, -1.53862284e-02, -3.09490436e-03,\n",
+       "                       -3.11847795e-02, -1.71698779e-02, -3.63941677e-03, -2.74066366e-02,\n",
+       "                       -1.05475530e-03, -9.25327931e-03, -2.82230861e-02, -1.94824096e-02,\n",
+       "                       -1.38977701e-02, -1.04714287e-02,  4.30400576e-03, -2.20607650e-02,\n",
+       "                       -1.64322909e-02, -2.57586893e-02, -1.70667171e-02,  6.02981949e-04,\n",
+       "                       -2.33562738e-02,  6.21822709e-03, -3.45053500e-03, -1.09830648e-02,\n",
+       "                       -8.82339850e-03, -3.73522788e-02, -4.52396683e-02, -2.81988066e-02,\n",
+       "                        1.19963416e-03, -1.27797676e-02, -2.18338128e-02, -2.80943122e-02,\n",
+       "                       -3.59988119e-03, -1.18604396e-02, -6.16526231e-03,  2.33954028e-03,\n",
+       "                       -1.63589418e-03, -2.47196518e-02,  2.08187494e-02, -4.36770730e-02,\n",
+       "                       -3.05688493e-02, -1.34526286e-03, -3.30831483e-02,  3.23941559e-03,\n",
+       "                       -3.06175444e-02, -2.90571637e-02, -2.06385646e-02,  8.43056943e-03,\n",
+       "                        2.05167918e-03,  1.05036711e-02, -4.97501083e-02,  8.82736221e-03,\n",
+       "                       -3.26694426e-04, -1.03351744e-02,  8.86771642e-03, -2.79260948e-02,\n",
+       "                       -9.40874964e-03, -2.87361499e-02,  5.42023219e-03, -2.59471256e-02,\n",
+       "                       -4.26682644e-03, -1.39961147e-03,  5.25543839e-03,  1.44586945e-03,\n",
+       "                       -4.93929535e-03, -1.81996729e-02, -3.66596431e-02, -7.88619276e-03,\n",
+       "                       -7.22077349e-03, -1.38734980e-02, -2.62850765e-02, -1.04199219e-02,\n",
+       "                        4.22720285e-03, -4.93065640e-02, -1.53207366e-04,  1.66621129e-03,\n",
+       "                       -2.31967121e-02,  7.48836808e-03, -2.90694274e-02, -6.71045436e-03,\n",
+       "                       -2.49706525e-02, -3.15400236e-03, -2.88101286e-02, -1.17433537e-02,\n",
+       "                        1.22765440e-03, -8.89103208e-03, -1.20216729e-02, -2.58050431e-02,\n",
+       "                       -2.23770384e-02, -5.27241342e-02,  4.58361907e-03, -9.20900144e-03,\n",
+       "                       -4.86494834e-03,  5.95131190e-03, -3.35572027e-02, -5.22214063e-02,\n",
+       "                       -2.77308151e-02, -2.04498172e-02, -1.13594290e-02,  4.46268264e-03,\n",
+       "                       -1.38799436e-02, -2.00398602e-02, -1.42829427e-02,  4.64145560e-03,\n",
+       "                        2.28046585e-04, -4.69782483e-03, -2.27966066e-02,  7.99322035e-03,\n",
+       "                       -3.26800458e-02, -1.99418738e-02,  9.19471588e-03, -2.12415587e-02,\n",
+       "                       -2.27290746e-02, -1.31595824e-02, -1.15283253e-02, -7.50241475e-03,\n",
+       "                       -2.39377823e-02, -6.95785088e-03, -1.58205442e-02, -1.71613060e-02,\n",
+       "                       -1.08889155e-02, -2.31623300e-03, -1.26144765e-02, -1.01996101e-02,\n",
+       "                       -5.04346937e-03, -4.60104551e-03, -5.06210662e-02, -6.60978723e-03,\n",
+       "                       -5.96453110e-03, -7.14415684e-02, -1.78630725e-02,  5.41150104e-03,\n",
+       "                       -1.03690885e-02, -5.87195996e-03, -1.95817929e-02, -1.92977004e-02,\n",
+       "                        1.77244954e-02,  1.22857792e-03, -2.35614125e-02,  8.67873151e-03,\n",
+       "                       -1.04582077e-02, -1.39173279e-02, -3.24732549e-02, -3.26969177e-02,\n",
+       "                       -1.23288631e-02,  5.84124122e-03,  3.75783164e-03, -6.03185035e-02,\n",
+       "                       -5.38562834e-02, -1.87854804e-02,  1.52939111e-02, -1.73892621e-02,\n",
+       "                        1.84238015e-03,  4.95142397e-03, -3.33155915e-02, -1.19728940e-02,\n",
+       "                       -3.54210101e-03, -3.57735856e-03, -1.00171883e-02,  1.33268954e-02,\n",
+       "                        5.69132995e-03,  1.47731975e-02, -1.83567614e-03, -3.20666321e-02,\n",
+       "                       -2.86797527e-02, -2.64031384e-02, -7.56429462e-03, -1.20009044e-02,\n",
+       "                        1.12973684e-02, -5.62287122e-03, -1.97638269e-03, -2.07206514e-02,\n",
+       "                       -8.64086524e-02,  1.15817529e-04, -1.07997051e-02, -5.99109055e-03,\n",
+       "                        5.98610938e-03, -3.76985781e-03, -1.16103915e-02, -4.73026782e-02,\n",
+       "                       -3.24012749e-02, -1.52687272e-02,  1.39175309e-02, -3.89402099e-02,\n",
+       "                        4.79430798e-03, -3.10392287e-02, -1.22434238e-03, -1.20959114e-02,\n",
+       "                       -6.41068676e-03,  1.71033880e-05, -6.88490784e-03, -1.94683392e-02,\n",
+       "                       -1.64008960e-02, -2.63622683e-02, -5.85283060e-03, -1.85996443e-02,\n",
+       "                       -2.71032117e-02, -2.38017156e-03, -4.95283352e-03, -9.60978493e-03,\n",
+       "                       -1.25073837e-02, -1.55702140e-02, -1.95839349e-02, -2.03742441e-02,\n",
+       "                       -1.85265532e-03,  5.65958768e-03, -6.40596682e-03, -4.88626864e-03,\n",
+       "                       -2.15109205e-03, -9.18837916e-03, -2.19131261e-02, -3.64525206e-02,\n",
+       "                       -1.73025541e-02, -2.00000545e-03, -8.19304609e-04,  6.57165097e-03,\n",
+       "                       -6.28626253e-03, -2.95665115e-02, -6.25590011e-02, -1.84975117e-02,\n",
+       "                        6.67490123e-04, -2.22133230e-02, -1.77290067e-02, -3.24275382e-02,\n",
+       "                        7.81799573e-03, -2.80588735e-02, -1.20364176e-02, -7.06162909e-03,\n",
+       "                       -5.66909835e-03, -5.73322969e-03, -1.52700823e-02,  8.84732977e-03,\n",
+       "                       -1.49889970e-02, -1.92730948e-02,  1.35639915e-03, -3.77680473e-02,\n",
+       "                       -2.19104849e-02, -2.64837239e-02, -9.12345655e-04, -2.44116709e-02,\n",
+       "                        1.09210573e-02, -1.41132390e-04,  1.17622353e-02, -3.11280079e-02,\n",
+       "                        7.26891309e-03, -4.66628969e-02, -1.35422535e-02, -3.92462946e-02,\n",
+       "                       -3.86740407e-03, -1.41668820e-03,  1.08932122e-03, -1.82715822e-02,\n",
+       "                       -1.30463401e-02, -2.50185985e-04, -1.38900643e-02,  1.21532627e-04,\n",
+       "                       -7.55504519e-03, -6.68428373e-03,  3.75840045e-03,  3.87968845e-03,\n",
+       "                       -2.96963658e-02, -3.35212089e-02, -2.25975411e-03,  3.00933095e-03,\n",
+       "                       -4.02128510e-02, -1.42791662e-02, -5.48909791e-03, -3.20998975e-03,\n",
+       "                       -1.32048894e-02, -1.12547325e-02, -1.24998428e-02, -2.58491207e-02,\n",
+       "                        9.08760849e-05,  1.16652362e-02, -1.65408142e-02,  5.10796235e-05,\n",
+       "                       -8.15010723e-03, -1.28825111e-02, -3.89126949e-02, -9.37087275e-03,\n",
+       "                       -6.18562428e-03, -6.63009584e-02, -9.35898162e-03, -2.45649852e-02,\n",
+       "                       -7.92087708e-03, -1.31273726e-02, -1.97531860e-02, -1.37249520e-02,\n",
+       "                       -8.93866643e-03, -4.28636521e-02, -3.74601525e-03, -2.80440412e-02,\n",
+       "                       -1.74158271e-02,  9.33865644e-03,  4.91131470e-03,  1.11120502e-02,\n",
+       "                       -2.57497951e-02, -4.39163633e-02,  6.66483399e-03, -5.06761135e-04,\n",
+       "                       -2.32957341e-02, -2.53415443e-02, -4.46022581e-03,  1.13388188e-02,\n",
+       "                        2.02134461e-03, -1.31819705e-02,  1.01864496e-02, -3.78090749e-03,\n",
+       "                       -3.53341899e-03, -1.36399046e-02, -1.20440796e-02, -1.36488294e-02,\n",
+       "                       -1.38256513e-02, -6.28865436e-02, -4.16373424e-02, -4.74301493e-03,\n",
+       "                       -2.44922694e-02,  1.66400254e-03, -1.12737331e-03, -3.13604530e-03,\n",
+       "                       -3.24759744e-02, -1.65949818e-02,  2.92222598e-03, -1.58712268e-03,\n",
+       "                       -1.77903417e-02, -1.66294689e-03, -5.67669561e-03, -1.32287908e-02,\n",
+       "                       -1.93906557e-02, -4.19550687e-02,  1.61865051e-03, -2.05391757e-02,\n",
+       "                       -2.26580556e-02,  1.11057591e-02, -6.92468788e-03, -5.12448046e-03,\n",
+       "                       -3.18950079e-02, -4.35872423e-03, -2.53419876e-02,  1.55006526e-02,\n",
+       "                        1.20479669e-02, -1.77465249e-02, -2.14677062e-02,  2.35745008e-03,\n",
+       "                       -1.81921013e-02, -7.76443025e-03, -3.23890446e-04, -5.32940868e-03,\n",
+       "                        1.67221632e-02, -1.97462440e-02,  1.09343296e-02,  1.14851557e-02,\n",
+       "                       -2.77556907e-02, -8.87866947e-04,  1.33279143e-04, -5.81024587e-02,\n",
+       "                       -3.61334137e-03, -2.81540696e-02, -1.51612861e-02, -1.97562072e-02,\n",
+       "                        5.15708001e-04, -6.83074538e-03, -1.87120978e-02, -2.43883245e-02,\n",
+       "                       -7.91893061e-03, -4.11415892e-03, -8.43337551e-03,  1.16346637e-02,\n",
+       "                       -2.43854988e-02, -2.16020066e-02, -3.26048471e-02, -1.09725781e-02,\n",
+       "                       -3.57973687e-02, -5.08582965e-02, -1.33388182e-02,  5.90886362e-03,\n",
+       "                       -1.32997604e-02, -9.13704652e-03,  1.77791761e-03, -1.10328160e-02,\n",
+       "                        1.60120130e-02, -2.30981521e-02, -1.49227204e-02,  5.10551268e-03,\n",
+       "                        6.10626582e-03, -2.87795793e-02,  1.70728483e-03, -1.78763717e-02,\n",
+       "                       -1.94948930e-02, -1.66736473e-03, -1.70627479e-02,  1.37127992e-02,\n",
+       "                       -1.32692317e-02,  6.65037474e-03, -1.29313814e-02,  5.57297794e-03,\n",
+       "                       -1.12800766e-02,  4.67792340e-03, -7.82010332e-03, -4.64824103e-02,\n",
+       "                       -2.65281610e-02,  1.47148669e-02, -4.31900006e-03, -2.03008670e-02,\n",
+       "                       -2.63399538e-03, -2.16606539e-02, -1.90197546e-02, -1.78931039e-02,\n",
+       "                       -1.38731794e-02, -3.75676341e-02, -8.64620414e-03, -6.58054799e-02,\n",
+       "                       -1.70020033e-02, -3.28940749e-02,  4.65774618e-04, -1.98039897e-02,\n",
+       "                       -2.59156171e-02, -7.85135943e-03, -1.25278654e-02, -1.11970643e-03,\n",
+       "                       -2.91844960e-02, -1.97878089e-02,  2.52304319e-03,  5.96133480e-03,\n",
+       "                       -5.23802266e-02, -2.73484532e-02, -3.66229527e-02, -1.43872052e-02,\n",
+       "                       -4.07523988e-03, -5.29169776e-02, -2.10777409e-02, -3.25676277e-02,\n",
+       "                       -9.24565084e-03, -5.09950239e-03, -1.04549387e-02, -2.45881788e-02,\n",
+       "                       -3.48805226e-02, -5.53940125e-02, -3.37969400e-02, -5.90338185e-03,\n",
+       "                       -5.14366738e-02, -2.08435231e-03, -7.82921351e-03, -1.05392961e-02,\n",
+       "                       -6.99244160e-03, -2.68173851e-02, -1.15421731e-02, -2.56756227e-02,\n",
+       "                        1.55956158e-03, -4.72193910e-03, -1.58323143e-02, -9.19513591e-03,\n",
+       "                       -2.00888999e-02, -3.19119655e-02, -3.35531938e-03, -1.04231259e-03,\n",
+       "                       -9.81072523e-03, -1.77766923e-02, -2.31661070e-02, -3.86816682e-03,\n",
+       "                       -5.58865443e-03, -1.16977030e-02, -2.61800736e-02, -1.86645531e-03,\n",
+       "                       -3.06399371e-02, -9.05887131e-03, -1.93412770e-02, -5.43606542e-02,\n",
+       "                        2.60276510e-03, -8.96754768e-03, -3.24303173e-02, -3.29047143e-02,\n",
+       "                        2.46463460e-03, -3.13622109e-03, -1.11212321e-02, -1.36358421e-02,\n",
+       "                       -1.89102590e-02, -3.58816683e-02, -8.04788154e-03, -3.75765860e-02,\n",
+       "                        1.24625880e-02, -3.20654698e-02, -6.90695737e-03,  1.00988441e-03,\n",
+       "                        2.75147846e-03, -1.61069054e-02,  2.06897836e-02,  1.87683210e-03,\n",
+       "                       -1.62859093e-02, -2.90039498e-02, -1.36160792e-03, -1.72167066e-02,\n",
+       "                        7.65678659e-03,  2.95401318e-04, -7.96781853e-03, -3.59004922e-02,\n",
+       "                       -1.22297904e-03,  1.20183127e-02, -3.44441235e-02,  3.89194262e-04,\n",
+       "                       -2.51837485e-02, -1.65693760e-02, -3.02922279e-02,  6.05576904e-03,\n",
+       "                        3.68867512e-03,  3.91587103e-03, -6.81368308e-03, -6.03012135e-03,\n",
+       "                       -1.47708375e-02, -1.30854193e-02, -9.50133801e-03, -3.45344692e-02,\n",
+       "                       -2.94285733e-02,  8.44507944e-03, -2.27477471e-03, -1.56889744e-02,\n",
+       "                        1.59581471e-02, -1.25193940e-02, -1.91157572e-02, -3.21304277e-02,\n",
+       "                        8.02859943e-03, -8.64375941e-03,  3.78777785e-03, -6.59673940e-03,\n",
+       "                       -3.39506269e-02,  5.64883510e-03, -6.13440014e-02, -7.93107785e-03,\n",
+       "                       -1.50270360e-02, -1.61594078e-02, -1.94392912e-02, -1.68349724e-02,\n",
+       "                        3.09064277e-02,  4.93095955e-03, -3.94429043e-02, -1.15872324e-02,\n",
+       "                       -1.28836315e-02, -2.01286804e-02, -3.84248607e-02, -3.05649750e-02,\n",
+       "                       -1.04364334e-02, -2.77922582e-03, -2.36243010e-02, -2.01014858e-02,\n",
+       "                       -4.84081805e-02, -2.26343190e-03,  6.25391584e-03, -6.36793440e-03,\n",
+       "                       -6.46613713e-04, -9.01893992e-03, -3.63259926e-03, -6.74518943e-03,\n",
+       "                       -2.59635970e-02, -2.46191379e-02, -1.03657711e-02, -2.07470562e-02,\n",
+       "                       -7.71256257e-03, -2.91075669e-02, -1.47521086e-02, -7.92815816e-03,\n",
+       "                       -6.64313324e-03, -1.91371590e-02, -1.40240137e-02, -5.21422923e-02,\n",
+       "                       -3.74027751e-02, -2.06586719e-03, -3.58425593e-03, -2.08234824e-02,\n",
+       "                       -2.45748758e-02,  9.72781982e-03, -4.43681739e-02, -8.66457354e-03,\n",
+       "                       -4.82482389e-02, -1.56797916e-02, -2.47380249e-02,  1.87400840e-02,\n",
+       "                       -3.79825868e-02, -1.38318846e-02, -2.10447628e-02,  1.08323405e-02,\n",
+       "                       -2.42531281e-02,  1.12944627e-02,  2.59104045e-03, -1.14521887e-02,\n",
+       "                       -1.68768931e-02, -1.68022700e-02, -5.14307059e-03,  3.44281056e-04,\n",
+       "                       -4.87398217e-03, -9.55253374e-03, -1.22880088e-02, -2.63365097e-02,\n",
+       "                       -3.84489149e-02, -2.61132549e-02, -7.96650629e-03, -1.69632696e-02,\n",
+       "                       -1.71560347e-02, -2.25002784e-02, -8.88591073e-03, -2.72413641e-02,\n",
+       "                       -2.03668867e-04, -1.90096684e-02,  8.35950393e-03, -1.64371338e-02,\n",
+       "                        1.47741567e-02, -5.84984869e-02, -1.04708606e-02, -1.68935489e-02,\n",
+       "                       -3.54976244e-02, -2.78694136e-03, -1.73107199e-02,  5.00151608e-03,\n",
+       "                       -3.82142793e-03,  1.13632660e-02, -1.49819618e-02,  1.17110950e-03,\n",
+       "                       -2.05652462e-03, -8.59066565e-03, -2.67075058e-02, -2.47322544e-02,\n",
+       "                       -7.30546482e-04, -2.14617644e-02, -2.84397081e-02, -1.64100621e-02,\n",
+       "                       -1.08914925e-02, -1.72290541e-02, -1.59400273e-02,  8.52343906e-03,\n",
+       "                       -6.42960984e-03, -1.95234921e-02, -2.53217611e-02, -1.46880426e-04,\n",
+       "                       -4.34152931e-02, -2.06201486e-02, -7.12397024e-02, -8.53891764e-03,\n",
+       "                       -9.43581574e-03,  3.32818925e-02, -1.99020449e-02, -8.32063705e-03,\n",
+       "                       -1.83409415e-02, -1.25894314e-02,  1.62209210e-03, -3.50676570e-03,\n",
+       "                       -2.81427167e-02, -1.38427606e-02,  3.03339353e-03, -2.49240994e-02,\n",
+       "                        7.31371716e-03, -1.02051990e-02, -1.33559704e-02, -6.67838380e-04],\n",
+       "                      dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (layer_2): Dense(\n",
+       "                192, activation=linear, use_bias=True\n",
+       "                (kernel): <tf.Variable 'transformer/layer_._2/ff/layer_2/kernel:0' shape=(768, 192) dtype=float32, numpy=\n",
+       "                array([[-0.00277009, -0.00766354,  0.00111258, ...,  0.0023168 ,\n",
+       "                        -0.00371265,  0.03133386],\n",
+       "                       [ 0.01033583,  0.01263355,  0.00214211, ..., -0.03399085,\n",
+       "                         0.01188842, -0.0047044 ],\n",
+       "                       [ 0.03755607,  0.01134737, -0.00071585, ...,  0.00905287,\n",
+       "                         0.0055303 ,  0.00608071],\n",
+       "                       ...,\n",
+       "                       [-0.02624071,  0.00230232, -0.0022273 , ...,  0.02333591,\n",
+       "                        -0.00608842, -0.00880447],\n",
+       "                       [ 0.02174632, -0.01645869,  0.00782272, ..., -0.02966961,\n",
+       "                        -0.0024398 ,  0.01270658],\n",
+       "                       [ 0.00865628, -0.00132068, -0.02910091, ...,  0.00513306,\n",
+       "                         0.0078499 ,  0.0188979 ]], dtype=float32)>\n",
+       "                (bias): <tf.Variable 'transformer/layer_._2/ff/layer_2/bias:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([ 2.13714177e-03,  7.69167487e-03, -5.89249097e-03,  9.38836485e-03,\n",
+       "                        4.06415015e-03,  2.61747669e-02,  2.37808824e-02, -1.49717368e-03,\n",
+       "                       -1.51039485e-03,  3.72942095e-03,  1.19742397e-02,  4.87796776e-03,\n",
+       "                        6.80093654e-04, -7.29197753e-04, -5.09615056e-03, -1.20036164e-02,\n",
+       "                       -1.96033157e-02,  9.48915444e-03, -2.59881979e-03, -1.12662334e-02,\n",
+       "                        7.63040036e-03,  5.20693026e-02, -5.27575146e-03,  3.14396597e-03,\n",
+       "                        1.55584817e-03, -1.92209911e-02, -7.76566193e-03,  1.75420791e-02,\n",
+       "                        4.84731398e-04,  5.83604816e-03, -8.13735416e-04, -4.79252115e-02,\n",
+       "                       -1.84813831e-02, -2.28549889e-03, -6.95835566e-03, -5.86241111e-03,\n",
+       "                       -5.69443172e-03,  1.65568888e-02, -1.38337014e-03,  1.48930652e-02,\n",
+       "                        6.02127891e-03, -1.39874406e-02, -1.65665802e-02,  9.20123979e-03,\n",
+       "                        2.05240049e-03,  1.01555558e-02,  1.16605442e-02,  1.38822282e-02,\n",
+       "                        8.48454516e-03,  8.67671042e-04,  9.06788185e-03,  2.90332711e-03,\n",
+       "                        5.12160128e-03, -7.77168153e-03, -7.38827465e-03, -6.99232193e-03,\n",
+       "                       -1.00234915e-02, -1.26919309e-02, -3.56813939e-03, -8.51563271e-03,\n",
+       "                       -5.44333598e-03, -1.24330847e-02,  7.89948646e-03, -5.10330265e-03,\n",
+       "                        8.52113962e-03, -4.80575487e-03,  5.86674875e-03, -7.98383448e-03,\n",
+       "                       -1.58236409e-03, -3.90194566e-03, -3.19704623e-03, -1.27897607e-02,\n",
+       "                       -1.08337877e-02, -2.88095623e-02,  2.85866234e-04, -8.40043090e-03,\n",
+       "                        1.68466531e-02, -9.48300865e-03,  1.07089747e-02, -6.55804481e-03,\n",
+       "                        1.07785873e-02, -2.03706510e-03, -6.23795530e-03,  1.84131053e-03,\n",
+       "                       -1.19226137e-02, -1.19245518e-02,  1.07499138e-02, -1.60556356e-03,\n",
+       "                        1.48513662e-02,  8.42911075e-04, -7.61739630e-03, -1.00078341e-02,\n",
+       "                       -6.85031665e-03,  6.62403181e-05, -1.47380102e-02,  1.06051601e-02,\n",
+       "                       -1.52580086e-02,  4.62111458e-03, -7.25929858e-03, -9.87567380e-03,\n",
+       "                       -2.11753566e-02, -2.81897746e-03,  7.57926563e-03,  1.56047642e-02,\n",
+       "                       -5.49622765e-03, -1.26458518e-02, -4.95762797e-04, -1.26452465e-02,\n",
+       "                       -5.07163466e-04, -2.44214141e-04, -1.36806136e-02, -6.36481447e-03,\n",
+       "                        9.41760000e-03, -2.01441571e-02,  5.63550880e-03, -9.40112583e-03,\n",
+       "                        8.10766220e-03, -3.01348814e-03, -5.85703761e-04, -6.87783398e-03,\n",
+       "                       -2.04759687e-02,  5.50722983e-03,  1.64064090e-03,  2.13566399e-03,\n",
+       "                       -2.66503030e-03,  1.19713731e-02, -2.46646977e-03,  1.18620200e-02,\n",
+       "                       -9.19723790e-03, -1.83394272e-03,  1.11400019e-02, -7.83916272e-04,\n",
+       "                       -1.84947625e-02, -1.56250689e-02, -4.50070575e-03,  4.96139983e-05,\n",
+       "                        1.15786900e-03, -1.15699519e-03,  8.74574110e-03,  7.34791812e-03,\n",
+       "                       -1.66535741e-04, -4.48113959e-03, -2.73513864e-03,  1.59729156e-03,\n",
+       "                       -4.85743620e-02,  1.04213860e-02,  1.65184797e-03, -8.78975447e-03,\n",
+       "                        2.33145412e-02,  2.71241821e-04, -5.57205081e-03, -6.47265138e-03,\n",
+       "                        7.14300759e-03,  1.50586208e-02, -7.69229233e-03, -6.83056330e-03,\n",
+       "                        1.11706341e-02, -5.33302967e-03,  1.01505285e-02, -1.04286522e-03,\n",
+       "                        5.20325173e-03,  7.18424190e-03, -5.82816964e-03, -1.94616728e-02,\n",
+       "                       -9.02798609e-04, -1.22039793e-02, -1.85265485e-02,  6.41540438e-03,\n",
+       "                        2.65102787e-03,  1.07528424e-04,  8.87938961e-03, -6.68506231e-03,\n",
+       "                        6.87584700e-03, -5.48701826e-03,  8.97261198e-04, -1.17392847e-02,\n",
+       "                       -9.75791924e-03,  1.70990115e-03, -5.55254053e-03,  1.12752430e-02,\n",
+       "                       -6.84495084e-04,  1.56747233e-02,  1.91728352e-03, -1.50278080e-02,\n",
+       "                        5.20985387e-03, -2.47837487e-03,  2.45351926e-03,  6.19899435e-03,\n",
+       "                        1.05873914e-02,  8.07140023e-03, -5.94343990e-04, -3.08463769e-03],\n",
+       "                      dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (dropout): Dropout(\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "            (dropout): Dropout(\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "            (_feature_shapes): Dict()\n",
+       "            (_feature_dtypes): Dict()\n",
+       "          )\n",
+       "        )\n",
+       "        (dropout): Dropout(\n",
+       "          (_feature_shapes): Dict()\n",
+       "          (_feature_dtypes): Dict()\n",
+       "        )\n",
+       "        (_kwargs): Dict(\n",
+       "          (name): 'transformer'\n",
+       "          (trainable): True\n",
+       "          (dtype): 'float32'\n",
+       "        )\n",
+       "        (mask_emb): <tf.Variable 'model/mask_emb:0' shape=(1, 1, 192) dtype=float32, numpy=\n",
+       "        array([[[ 4.04036790e-03,  2.15086387e-03,  1.04019826e-03,\n",
+       "                 -1.42265148e-02,  1.21783582e-04,  8.70395917e-03,\n",
+       "                  6.63713319e-03,  7.36431265e-03, -1.54305118e-04,\n",
+       "                 -9.43066180e-03, -1.04995137e-02,  8.46136641e-03,\n",
+       "                  7.09149288e-04,  7.55310385e-03,  1.56539027e-02,\n",
+       "                 -1.72090076e-03,  4.24924027e-03, -5.31134475e-03,\n",
+       "                 -1.48346564e-02, -2.87283910e-03,  6.70258282e-03,\n",
+       "                 -1.77564528e-02,  7.61946477e-03,  9.40683205e-03,\n",
+       "                 -6.71640271e-03,  8.04069825e-03, -6.12986507e-03,\n",
+       "                  4.19179862e-03, -8.79541412e-03, -1.18354000e-02,\n",
+       "                  1.18796797e-02, -4.27424023e-03,  5.22729533e-04,\n",
+       "                 -2.82752240e-04, -5.58008580e-03,  8.65907688e-03,\n",
+       "                  1.38010653e-02,  1.27496161e-02,  1.39875710e-03,\n",
+       "                  2.82851863e-03,  9.22558014e-04, -9.95281339e-03,\n",
+       "                 -1.83557272e-02,  1.69160645e-02,  1.07988389e-02,\n",
+       "                 -9.23428405e-03, -4.20611026e-03, -1.25393076e-02,\n",
+       "                 -3.94632109e-03, -9.12902178e-04,  5.01031801e-03,\n",
+       "                 -9.91391484e-03,  3.60712525e-04, -4.11095610e-03,\n",
+       "                  7.01457262e-03, -3.89575318e-04, -9.14055016e-03,\n",
+       "                 -1.23113198e-02,  3.95737030e-03, -3.31253605e-03,\n",
+       "                 -1.13035142e-02, -1.94670074e-02,  1.20422023e-03,\n",
+       "                 -1.42025901e-03,  6.52758172e-03,  1.50428945e-02,\n",
+       "                  1.14396252e-02,  9.52708255e-03, -1.09730114e-03,\n",
+       "                 -1.33979488e-02, -1.07515557e-02,  9.95630212e-03,\n",
+       "                 -4.52685449e-03,  5.00414427e-03, -1.98842213e-03,\n",
+       "                  1.37774022e-02,  5.30165201e-03,  1.23802433e-03,\n",
+       "                 -4.73509915e-03,  1.11496374e-02,  1.02096051e-02,\n",
+       "                 -4.51285811e-03, -3.92367877e-03, -7.36222602e-04,\n",
+       "                 -9.84671526e-03, -1.30903888e-02, -1.32385455e-02,\n",
+       "                 -5.05355746e-03,  1.77229438e-02, -1.26720043e-02,\n",
+       "                 -3.81861255e-03,  1.92409288e-03,  4.43383912e-03,\n",
+       "                 -2.90768524e-03, -3.23669449e-03, -6.66979142e-03,\n",
+       "                 -2.06012907e-03, -1.12843849e-02,  4.79723467e-03,\n",
+       "                  4.63116821e-03,  5.16073406e-03,  8.70506628e-05,\n",
+       "                 -5.35136508e-03, -6.81748800e-03,  1.07775088e-02,\n",
+       "                  6.40543317e-03, -5.58225671e-03,  1.11177545e-02,\n",
+       "                 -1.27711734e-02,  5.51164476e-03,  1.43165309e-02,\n",
+       "                 -1.18009234e-02,  1.00297267e-02,  2.94128619e-03,\n",
+       "                  5.09045878e-03,  6.01266325e-03,  3.48583143e-03,\n",
+       "                 -9.97739006e-03,  5.73237287e-03, -1.74200535e-02,\n",
+       "                 -1.05477320e-02, -6.82158954e-03, -1.22792637e-02,\n",
+       "                  1.54061895e-02,  6.61997357e-03, -6.48623565e-03,\n",
+       "                  1.03507945e-02,  4.72886208e-03,  3.41648381e-04,\n",
+       "                  1.56227135e-04, -6.57477323e-03,  1.07179703e-02,\n",
+       "                  1.44143337e-02, -5.46780648e-03,  6.18689740e-03,\n",
+       "                 -9.73255560e-03, -2.16128258e-03, -1.91180315e-03,\n",
+       "                  3.76634533e-03,  2.67042592e-03, -2.67445343e-03,\n",
+       "                  3.32484627e-03,  1.01211574e-02,  2.27720127e-03,\n",
+       "                  7.88620266e-04, -1.48888072e-02,  7.72451982e-03,\n",
+       "                 -1.09812963e-05,  1.72610395e-02, -1.04232905e-02,\n",
+       "                 -5.94944111e-04,  8.15481320e-03, -1.07726390e-02,\n",
+       "                  2.42098351e-03, -7.10068317e-03,  1.06540425e-02,\n",
+       "                  9.72479582e-03,  4.19085007e-03,  5.90282353e-03,\n",
+       "                  1.59875136e-02, -1.69793852e-02,  1.46484468e-04,\n",
+       "                 -9.65306722e-03, -2.21638312e-03, -1.99070992e-03,\n",
+       "                  1.52429137e-02,  7.03723729e-03, -3.10059241e-03,\n",
+       "                  1.18050715e-02,  1.10457819e-02, -8.42266437e-03,\n",
+       "                 -9.11685079e-03, -1.46749020e-02, -5.18356264e-03,\n",
+       "                 -1.54700959e-02,  1.13772415e-02, -5.09043923e-03,\n",
+       "                 -1.58989453e-03, -1.11678680e-02, -1.49724097e-03,\n",
+       "                  2.78852787e-03, -8.65777209e-03,  3.00176186e-03,\n",
+       "                 -1.46945333e-02,  8.13734066e-03,  7.89561775e-03,\n",
+       "                  1.56951277e-03,  7.45176163e-04, -1.99116878e-02,\n",
+       "                  4.55260696e-03, -6.38728775e-03, -4.85596713e-03]]],\n",
+       "              dtype=float32)>\n",
+       "        (_feature_shapes): Dict()\n",
+       "        (_feature_dtypes): Dict()\n",
+       "      )\n",
+       "      (transformer_pre): PrepareTransformerInputs(\n",
+       "        (_feature_shapes): Dict()\n",
+       "        (_feature_dtypes): Dict()\n",
+       "      )\n",
+       "      (transformer_post): LastHiddenState(\n",
+       "        (_feature_shapes): Dict()\n",
+       "        (_feature_dtypes): Dict()\n",
+       "      )\n",
+       "      (_masking_post): SequentialBlock(\n",
+       "        (layers): List(\n",
+       "          (0): TransformerOutputToRagged(\n",
+       "            (_feature_shapes): Dict()\n",
+       "            (_feature_dtypes): Dict()\n",
+       "          )\n",
+       "          (1): TransformerInferenceHiddenState(\n",
+       "            (_feature_shapes): Dict()\n",
+       "            (_feature_dtypes): Dict()\n",
+       "          )\n",
+       "        )\n",
+       "        (_feature_shapes): Dict()\n",
+       "        (_feature_dtypes): Dict()\n",
+       "      )\n",
+       "      (_masking_pre): SequentialBlock(\n",
+       "        (layers): List(\n",
+       "          (0): SequenceCausalLastInference(\n",
+       "            (_feature_shapes): Dict()\n",
+       "            (_feature_dtypes): Dict()\n",
+       "          )\n",
+       "          (1): ExtractMaskFromTargets(\n",
+       "            (_feature_shapes): Dict()\n",
+       "            (_feature_dtypes): Dict()\n",
+       "          )\n",
+       "        )\n",
+       "        (_feature_shapes): Dict()\n",
+       "        (_feature_dtypes): Dict()\n",
+       "      )\n",
+       "      (_feature_shapes): Dict()\n",
+       "      (_feature_dtypes): Dict()\n",
+       "    )\n",
+       "  )\n",
+       "  (test_pre): SequencePredictLast(\n",
+       "    (_pre): SequentialBlock(\n",
+       "      (layers): List(\n",
+       "        (0): PrepareFeatures(\n",
+       "          (prepare_lists): PrepareListFeatures()\n",
+       "        )\n",
+       "        (1): PrepareFeatures(\n",
+       "          (prepare_lists): PrepareListFeatures()\n",
+       "        )\n",
+       "      )\n",
+       "      (prepare_lists): PrepareListFeatures()\n",
+       "    )\n",
+       "    (transformer): XLNetBlock(\n",
+       "      (transformer): TFXLNetMainLayer(\n",
+       "        (word_embedding): TFSharedEmbeddings(\n",
+       "          (_feature_shapes): Dict()\n",
+       "          (_feature_dtypes): Dict()\n",
+       "        )\n",
+       "        (layer): List(\n",
+       "          (0): TFXLNetLayer(\n",
+       "            (rel_attn): TFXLNetRelativeAttention(\n",
+       "              (layer_norm): LayerNormalization(\n",
+       "                (axis): List(\n",
+       "                  (0): 2\n",
+       "                )\n",
+       "                (gamma): <tf.Variable 'transformer/layer_._0/rel_attn/layer_norm/gamma:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([1.0096865 , 1.0156112 , 1.0047966 , 1.0055697 , 1.0296937 ,\n",
+       "                       1.0257732 , 1.0405434 , 1.0163577 , 0.9534506 , 1.0183752 ,\n",
+       "                       1.027002  , 1.0310668 , 1.0172462 , 1.0297366 , 0.9981551 ,\n",
+       "                       0.9956357 , 0.99598515, 0.98782843, 1.0019149 , 1.0021151 ,\n",
+       "                       0.9731392 , 1.0394815 , 1.0419115 , 0.99122995, 0.9815058 ,\n",
+       "                       1.0394274 , 0.95420986, 1.0140872 , 1.0178257 , 1.0153575 ,\n",
+       "                       0.9975193 , 1.0342228 , 0.9783905 , 0.99436754, 1.0437794 ,\n",
+       "                       1.0107313 , 0.9973728 , 1.0330907 , 0.98237264, 1.0205512 ,\n",
+       "                       1.0262665 , 1.057069  , 1.0186831 , 1.0065695 , 1.0573292 ,\n",
+       "                       0.9723765 , 1.0185301 , 0.9783078 , 1.0805802 , 1.0072856 ,\n",
+       "                       1.046347  , 0.9651661 , 1.0125892 , 1.0318221 , 1.0100422 ,\n",
+       "                       0.98210293, 1.0385141 , 1.0028491 , 1.0255537 , 0.9748143 ,\n",
+       "                       1.0136645 , 0.9777978 , 1.0167676 , 0.9867102 , 0.99873364,\n",
+       "                       1.0448893 , 0.9775781 , 1.020897  , 1.0156687 , 1.0070162 ,\n",
+       "                       0.9949982 , 0.9890248 , 1.0294597 , 0.97803134, 0.9471789 ,\n",
+       "                       1.0155677 , 1.0290877 , 1.0084465 , 0.9563062 , 0.98199034,\n",
+       "                       1.0073545 , 0.96270114, 1.0361133 , 1.0037365 , 1.0049076 ,\n",
+       "                       0.9958272 , 1.0042776 , 0.9906111 , 1.0195004 , 0.98845285,\n",
+       "                       1.0099287 , 1.0035214 , 0.9916738 , 0.9639702 , 0.9999653 ,\n",
+       "                       1.0250297 , 1.036368  , 1.0106395 , 0.99796367, 0.9961404 ,\n",
+       "                       0.99974966, 0.98292816, 0.9863248 , 1.0158017 , 0.9997731 ,\n",
+       "                       1.0132103 , 1.0377946 , 1.0157263 , 0.98545736, 1.0048945 ,\n",
+       "                       1.0137354 , 1.0606142 , 0.98290765, 1.0372158 , 0.9920816 ,\n",
+       "                       1.0716795 , 1.0048707 , 1.0199146 , 1.0151896 , 1.0404963 ,\n",
+       "                       1.009017  , 1.0116297 , 1.0267462 , 1.0299959 , 0.9948385 ,\n",
+       "                       1.0162882 , 1.0151713 , 0.9754863 , 1.0113914 , 1.0105838 ,\n",
+       "                       1.018187  , 1.0054674 , 1.0116692 , 1.0358899 , 1.0134988 ,\n",
+       "                       1.0051659 , 0.96874547, 0.99625516, 1.0667871 , 0.97690076,\n",
+       "                       1.0244907 , 0.9951849 , 0.9845813 , 0.9981892 , 1.0345283 ,\n",
+       "                       0.9751158 , 1.0104059 , 1.0049229 , 1.0344111 , 1.0108231 ,\n",
+       "                       1.0074483 , 1.0138446 , 0.97882235, 0.9838856 , 0.9797773 ,\n",
+       "                       1.0448751 , 1.0250106 , 0.9940398 , 1.0415001 , 1.010096  ,\n",
+       "                       0.9959737 , 1.0421578 , 0.99612373, 1.008482  , 1.0168474 ,\n",
+       "                       1.0117303 , 1.0058619 , 1.0206212 , 0.9813257 , 0.97197706,\n",
+       "                       1.0078402 , 1.0188038 , 0.9819965 , 1.0236609 , 0.9870887 ,\n",
+       "                       0.96151966, 1.0474262 , 1.0463325 , 1.0403295 , 1.015123  ,\n",
+       "                       1.0659757 , 0.98529726, 0.96674085, 1.0507897 , 0.9882364 ,\n",
+       "                       1.0611303 , 0.98063576, 1.0268865 , 0.9999817 , 0.95722026,\n",
+       "                       1.0107577 , 1.0596876 ], dtype=float32)>\n",
+       "                (beta): <tf.Variable 'transformer/layer_._0/rel_attn/layer_norm/beta:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([-7.82491732e-03,  1.17448866e-02,  2.86215218e-05,  2.13310122e-02,\n",
+       "                        6.15173485e-03,  4.41838168e-02,  3.52672711e-02,  3.73794995e-02,\n",
+       "                       -2.44397484e-02,  2.63913777e-02, -1.92101207e-02,  1.68179050e-02,\n",
+       "                        1.09884115e-02,  6.81292498e-03, -1.47153009e-02,  1.50813432e-02,\n",
+       "                       -7.20379350e-04,  1.68901030e-02, -4.87045525e-03, -2.82951538e-02,\n",
+       "                       -1.63124632e-02,  2.98008770e-02,  2.43800394e-02, -1.33296829e-02,\n",
+       "                        5.78173622e-03,  8.41072667e-03, -1.16651105e-02,  4.57805302e-03,\n",
+       "                       -1.83029305e-02, -5.12085622e-03,  1.37897804e-02, -2.52885967e-02,\n",
+       "                        1.42254690e-02, -1.35734994e-02,  5.25993854e-02, -1.03573725e-02,\n",
+       "                       -1.14020770e-02,  9.41959268e-04,  3.96627970e-02,  3.15781720e-02,\n",
+       "                       -2.24383790e-02,  1.86920688e-02, -7.97046442e-03, -2.70248894e-02,\n",
+       "                        3.81716304e-02,  1.37069626e-02,  1.00353323e-02, -6.83175074e-03,\n",
+       "                        1.59086268e-02,  4.49690456e-03,  1.20646395e-02, -1.96351800e-02,\n",
+       "                       -1.78791047e-03, -2.16557011e-02,  5.07375300e-02, -2.81546824e-03,\n",
+       "                        5.75071760e-03, -4.75972937e-03,  2.06295010e-02, -7.60992151e-03,\n",
+       "                        1.30418986e-02,  1.54393655e-03,  8.23538285e-03, -9.66409966e-03,\n",
+       "                       -1.59477256e-02, -6.53768145e-03,  2.64450200e-02, -1.21939182e-02,\n",
+       "                       -2.44537480e-02, -1.32514127e-02,  4.72463388e-03, -6.23199455e-02,\n",
+       "                       -9.88284126e-03, -1.01852976e-03,  8.38834606e-03,  5.14619891e-03,\n",
+       "                       -2.43399031e-02, -3.44760045e-02,  3.00469343e-02, -1.12967705e-02,\n",
+       "                       -1.09801833e-02,  2.30398844e-03,  9.92888771e-03, -3.32463742e-03,\n",
+       "                        3.43136154e-02,  3.60682383e-02, -3.67968087e-03,  1.74639337e-02,\n",
+       "                        1.97809841e-02, -2.45451611e-02,  1.67986832e-03,  2.69882358e-03,\n",
+       "                       -2.04691254e-02,  1.29097085e-02, -2.70051602e-02, -4.05806676e-02,\n",
+       "                       -2.31585279e-02,  4.98421630e-03, -4.47037667e-02, -8.27246532e-03,\n",
+       "                       -7.42262113e-04, -3.22355516e-03, -5.14169736e-03,  2.15779357e-02,\n",
+       "                       -1.11045064e-02, -2.59866863e-02,  3.82872522e-02,  1.02850962e-02,\n",
+       "                        3.94708291e-02, -1.60061326e-02,  5.03637968e-03, -2.80841645e-02,\n",
+       "                        7.09669766e-05, -4.67813946e-03, -1.76187896e-05,  1.27147445e-02,\n",
+       "                       -4.22244053e-03,  4.70675938e-02, -1.94290020e-02, -1.37540735e-02,\n",
+       "                        1.72726456e-02, -3.45245190e-02, -1.70333236e-02,  6.64326828e-03,\n",
+       "                       -2.56029330e-02,  3.23950835e-02, -1.42239043e-02, -1.48923928e-02,\n",
+       "                       -1.45010799e-02,  2.70975046e-02,  3.46343732e-03, -1.41528598e-03,\n",
+       "                       -3.36916260e-02,  9.26417951e-03,  1.23228608e-02, -1.04462192e-03,\n",
+       "                       -4.54590917e-02,  6.67568156e-03, -3.63403489e-03, -6.04176559e-02,\n",
+       "                        4.78232652e-03, -3.75009403e-02, -2.47718971e-02, -1.40848383e-03,\n",
+       "                       -5.22233248e-02, -1.13894709e-03, -7.80673418e-03,  5.45118609e-03,\n",
+       "                        1.58662163e-03,  4.10271995e-02,  1.59943216e-02, -3.07554863e-02,\n",
+       "                       -1.69451218e-02, -1.17179407e-02,  2.83574010e-03, -2.54462264e-03,\n",
+       "                       -1.83762833e-02, -1.88289094e-03, -3.40282395e-02,  1.10489558e-02,\n",
+       "                       -1.69651117e-03,  2.39129476e-02,  5.87868970e-03,  9.99899115e-04,\n",
+       "                       -5.21592982e-03,  3.35242087e-03, -1.36361187e-02,  1.72579456e-02,\n",
+       "                        3.15937190e-03,  4.49407697e-02, -1.53307710e-02, -6.07074127e-02,\n",
+       "                        3.54830991e-03, -3.54800522e-02,  9.24525037e-03,  3.27169746e-02,\n",
+       "                       -2.32813358e-02,  3.64200436e-02, -6.11901516e-04, -3.56406788e-03,\n",
+       "                       -1.71201453e-02,  1.83092244e-02,  3.73052014e-03,  4.37969994e-03,\n",
+       "                       -6.32673851e-04,  1.01843160e-02,  2.05308665e-02, -2.17945818e-02,\n",
+       "                        2.46619992e-02, -1.98999303e-03, -6.00536261e-03, -1.18894950e-02],\n",
+       "                      dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (dropout): Dropout(\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (q): <tf.Variable 'transformer/layer_._0/rel_attn/q:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[ 0.13197099, -0.12747517, -0.11641935, ..., -0.10109836,\n",
+       "                       -0.12369698, -0.12235671],\n",
+       "                      [-0.01014621,  0.0235051 , -0.0030254 , ..., -0.00358669,\n",
+       "                        0.02513896,  0.02814367],\n",
+       "                      [-0.09935587,  0.12525903, -0.1472499 , ...,  0.11936913,\n",
+       "                        0.13238919, -0.11256532],\n",
+       "                      ...,\n",
+       "                      [-0.12259299,  0.09363633, -0.11260894, ..., -0.07576296,\n",
+       "                       -0.08214942, -0.12410881],\n",
+       "                      [-0.05617683,  0.07248516,  0.05206291, ..., -0.06845155,\n",
+       "                        0.06023917,  0.07214421],\n",
+       "                      [ 0.0586201 ,  0.05837682,  0.05086967, ..., -0.04357501,\n",
+       "                       -0.06763364,  0.05550697]],\n",
+       "              \n",
+       "                     [[-0.13025644,  0.12209299,  0.12323013, ...,  0.12075363,\n",
+       "                        0.09601118,  0.09255827],\n",
+       "                      [ 0.08915628,  0.07382819,  0.07099618, ..., -0.0768103 ,\n",
+       "                        0.0475458 , -0.07742295],\n",
+       "                      [ 0.02872836, -0.06235151,  0.11553147, ..., -0.05319935,\n",
+       "                       -0.05903677,  0.03677876],\n",
+       "                      ...,\n",
+       "                      [ 0.12209638, -0.10401054,  0.13268085, ...,  0.09688871,\n",
+       "                        0.10452053,  0.12009949],\n",
+       "                      [ 0.10607433, -0.09689898, -0.06376923, ...,  0.08841456,\n",
+       "                       -0.10300028, -0.1044563 ],\n",
+       "                      [-0.0914668 , -0.08097184, -0.06668061, ...,  0.09470978,\n",
+       "                        0.06220397, -0.09111064]],\n",
+       "              \n",
+       "                     [[ 0.00058233,  0.02772736,  0.02006061, ...,  0.00036397,\n",
+       "                       -0.02168103,  0.01568287],\n",
+       "                      [ 0.00347983,  0.05903155,  0.02945688, ..., -0.03992393,\n",
+       "                        0.03995887, -0.01548792],\n",
+       "                      [-0.07598231,  0.09135605, -0.10173324, ...,  0.07594861,\n",
+       "                        0.08776175, -0.08319726],\n",
+       "                      ...,\n",
+       "                      [ 0.02002489, -0.0180598 ,  0.02898292, ...,  0.05892501,\n",
+       "                        0.07759988,  0.03240566],\n",
+       "                      [ 0.0311827 , -0.02396172, -0.06914719, ...,  0.02610791,\n",
+       "                       -0.031378  , -0.02404469],\n",
+       "                      [ 0.03871018,  0.03000399,  0.01775593, ..., -0.02095439,\n",
+       "                       -0.02130386,  0.04530597]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[-0.14868718,  0.15100038,  0.16120967, ...,  0.1410322 ,\n",
+       "                        0.15062724,  0.12837149],\n",
+       "                      [ 0.05342876,  0.03672805,  0.0651921 , ..., -0.05224199,\n",
+       "                        0.04776929, -0.08523804],\n",
+       "                      [ 0.05559164, -0.09261318,  0.107168  , ..., -0.08454619,\n",
+       "                       -0.09076596,  0.08992289],\n",
+       "                      ...,\n",
+       "                      [ 0.12589426, -0.11314777,  0.12426507, ...,  0.08356976,\n",
+       "                        0.10044491,  0.12639156],\n",
+       "                      [ 0.06355417, -0.04420558, -0.01156731, ...,  0.05051657,\n",
+       "                       -0.05817353, -0.03657222],\n",
+       "                      [-0.03658766, -0.02278869, -0.04286689, ...,  0.06056577,\n",
+       "                        0.04052235, -0.05048911]],\n",
+       "              \n",
+       "                     [[ 0.00077285, -0.02091939, -0.02179666, ..., -0.02718211,\n",
+       "                       -0.0087873 ,  0.00054167],\n",
+       "                      [-0.03704397, -0.0547603 , -0.04194904, ...,  0.0333349 ,\n",
+       "                       -0.03617225,  0.04379632],\n",
+       "                      [-0.00530401, -0.01642063,  0.00167275, ...,  0.00762442,\n",
+       "                        0.00649468,  0.00245123],\n",
+       "                      ...,\n",
+       "                      [ 0.00478095, -0.01497871, -0.00115625, ..., -0.00592807,\n",
+       "                       -0.01775305,  0.01014595],\n",
+       "                      [ 0.00987361, -0.01282128,  0.00660534, ...,  0.01324118,\n",
+       "                       -0.01851957,  0.00425063],\n",
+       "                      [ 0.01102448,  0.01941266,  0.00894985, ..., -0.02141596,\n",
+       "                        0.00027551,  0.04116082]],\n",
+       "              \n",
+       "                     [[-0.12173207,  0.12579004,  0.12077694, ...,  0.10138801,\n",
+       "                        0.11864589,  0.10221381],\n",
+       "                      [-0.02032071, -0.04710845, -0.0055217 , ...,  0.02435347,\n",
+       "                       -0.05264059,  0.00311177],\n",
+       "                      [-0.00397544, -0.03643695,  0.10240758, ..., -0.02665599,\n",
+       "                       -0.04377652,  0.03546317],\n",
+       "                      ...,\n",
+       "                      [ 0.0769384 , -0.06460597,  0.06227714, ...,  0.0460739 ,\n",
+       "                        0.02304599,  0.05762106],\n",
+       "                      [ 0.06128034, -0.04426205, -0.03479004, ...,  0.042454  ,\n",
+       "                       -0.05019034, -0.04568675],\n",
+       "                      [-0.05524379, -0.06202021, -0.04874821, ...,  0.04686412,\n",
+       "                        0.04290378, -0.0746149 ]]], dtype=float32)>\n",
+       "              (k): <tf.Variable 'transformer/layer_._0/rel_attn/k:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[-7.68226478e-03, -2.18245108e-02,  9.52953065e-04, ...,\n",
+       "                       -4.93486365e-03, -1.21793533e-02, -1.26160523e-02],\n",
+       "                      [-7.43793417e-03, -1.20707992e-02, -6.53376943e-03, ...,\n",
+       "                        2.92456280e-02, -3.25674308e-03,  1.21511864e-02],\n",
+       "                      [-1.35852136e-02,  1.87938241e-03, -1.01676602e-02, ...,\n",
+       "                        2.05786899e-02,  1.34299798e-02, -1.43495211e-02],\n",
+       "                      ...,\n",
+       "                      [ 3.58363008e-03, -2.66930517e-02,  1.21933036e-03, ...,\n",
+       "                       -1.62357197e-03, -1.62881166e-02,  3.91136855e-03],\n",
+       "                      [ 2.21821051e-02, -2.58309972e-02, -3.92753910e-03, ...,\n",
+       "                        3.09738088e-02, -2.88884938e-02, -1.72762908e-02],\n",
+       "                      [ 3.42399031e-02,  4.14119326e-02,  3.64699885e-02, ...,\n",
+       "                       -1.62819158e-02, -4.43666801e-02,  4.56376821e-02]],\n",
+       "              \n",
+       "                     [[ 5.56782149e-02, -3.10854726e-02, -4.81049083e-02, ...,\n",
+       "                       -3.98653857e-02, -4.33852226e-02, -3.19941342e-02],\n",
+       "                      [ 4.35383096e-02,  6.49795458e-02,  2.57861316e-02, ...,\n",
+       "                       -5.24633527e-02,  4.20018435e-02, -2.63198018e-02],\n",
+       "                      [-2.54611839e-02,  3.08996532e-02,  1.94905959e-02, ...,\n",
+       "                        3.56150158e-02,  2.95397937e-02, -5.12102805e-02],\n",
+       "                      ...,\n",
+       "                      [-1.21757882e-02,  2.53642909e-02,  7.72101339e-05, ...,\n",
+       "                        1.69840753e-02,  8.38600751e-03, -3.96163156e-03],\n",
+       "                      [-3.53838429e-02,  3.53519283e-02, -3.68676893e-02, ...,\n",
+       "                       -2.53158119e-02,  2.94843595e-02,  1.01852333e-02],\n",
+       "                      [-1.47796969e-03,  6.62320666e-03,  1.49483886e-02, ...,\n",
+       "                       -2.28901999e-03, -6.19671959e-03,  2.28765719e-02]],\n",
+       "              \n",
+       "                     [[ 1.17053827e-02, -2.50329729e-02, -2.19117496e-02, ...,\n",
+       "                       -3.80133167e-02, -2.65514757e-02, -7.27514597e-03],\n",
+       "                      [-1.78928077e-02, -1.69182811e-02,  3.16141150e-03, ...,\n",
+       "                        1.59324165e-02, -1.54765015e-02,  7.96239730e-03],\n",
+       "                      [-1.16813637e-01,  1.03553854e-01, -3.13211568e-02, ...,\n",
+       "                        1.13394342e-01,  1.06305420e-01, -1.10351004e-01],\n",
+       "                      ...,\n",
+       "                      [-2.18171608e-02,  1.39812902e-02, -1.50209228e-02, ...,\n",
+       "                       -3.89618762e-02, -4.92681414e-02, -4.68410878e-03],\n",
+       "                      [ 3.05185374e-02, -3.40098143e-02,  1.13884155e-02, ...,\n",
+       "                        2.97950469e-02, -3.64380144e-02, -1.04942517e-02],\n",
+       "                      [ 3.37445624e-02,  3.35685574e-02,  3.04103903e-02, ...,\n",
+       "                       -2.40385197e-02, -1.90875176e-02,  4.48835082e-02]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[ 4.42194827e-02, -5.08627035e-02, -3.86995897e-02, ...,\n",
+       "                       -5.09292372e-02, -4.82375398e-02, -4.56841141e-02],\n",
+       "                      [-5.57947196e-02, -4.15932760e-02, -4.83722910e-02, ...,\n",
+       "                        4.65600304e-02, -4.73332889e-02,  3.59597690e-02],\n",
+       "                      [-4.08401750e-02,  2.42609885e-02,  3.46741155e-02, ...,\n",
+       "                        3.86420041e-02,  9.45237931e-03, -3.15879993e-02],\n",
+       "                      ...,\n",
+       "                      [ 4.90185805e-03,  4.53932863e-03,  1.13866816e-03, ...,\n",
+       "                        1.40106957e-02,  1.91211719e-02, -8.73244926e-03],\n",
+       "                      [-6.61803456e-03,  1.66730173e-02, -4.06372882e-02, ...,\n",
+       "                       -2.04761196e-02,  3.11128376e-03,  1.49987591e-02],\n",
+       "                      [ 5.47084492e-03,  6.85863616e-03,  2.34094419e-04, ...,\n",
+       "                        2.92215571e-02,  5.72894141e-03, -1.19066413e-03]],\n",
+       "              \n",
+       "                     [[-4.31554615e-02,  6.39417619e-02,  5.02575226e-02, ...,\n",
+       "                        6.53538033e-02,  5.54384664e-02,  4.20371369e-02],\n",
+       "                      [ 7.17930421e-02,  7.29683116e-02,  6.09961711e-02, ...,\n",
+       "                       -9.18020830e-02,  8.56361762e-02, -6.71873838e-02],\n",
+       "                      [ 5.04934788e-02, -4.51203883e-02,  1.68532617e-02, ...,\n",
+       "                       -3.29082832e-02, -2.49036923e-02,  4.25316319e-02],\n",
+       "                      ...,\n",
+       "                      [ 1.46742398e-02, -3.43895471e-03,  5.69227152e-03, ...,\n",
+       "                       -2.83451960e-03,  1.22414744e-02,  1.62646342e-02],\n",
+       "                      [-6.54027564e-03,  1.52935763e-03, -9.13942046e-03, ...,\n",
+       "                        5.21203212e-04, -2.77781975e-03, -6.00035116e-03],\n",
+       "                      [-5.78916371e-02, -5.93501814e-02, -8.45207125e-02, ...,\n",
+       "                        4.54125442e-02,  6.86786473e-02, -5.92041649e-02]],\n",
+       "              \n",
+       "                     [[ 4.55016270e-02, -1.08455513e-02, -2.07238458e-02, ...,\n",
+       "                       -2.82163695e-02, -2.77336575e-02, -3.14533934e-02],\n",
+       "                      [-2.32847258e-02, -1.02253594e-02, -4.68420517e-03, ...,\n",
+       "                       -5.64631820e-03, -2.67742760e-03,  2.13843174e-02],\n",
+       "                      [-2.86033489e-02,  2.24300697e-02,  4.91300672e-02, ...,\n",
+       "                        1.67693906e-02,  1.43385716e-02, -1.24855936e-02],\n",
+       "                      ...,\n",
+       "                      [-1.71137322e-02,  2.70220917e-02, -2.11604238e-02, ...,\n",
+       "                        1.46003044e-03, -1.17526902e-02, -1.94206256e-02],\n",
+       "                      [-8.81280228e-02,  8.72216299e-02,  4.61283103e-02, ...,\n",
+       "                       -8.43449533e-02,  8.62690136e-02,  8.77720714e-02],\n",
+       "                      [ 6.30031154e-03, -7.33704399e-03, -6.12117175e-04, ...,\n",
+       "                       -7.54373753e-03,  4.23501385e-03, -1.15064979e-02]]],\n",
+       "                    dtype=float32)>\n",
+       "              (v): <tf.Variable 'transformer/layer_._0/rel_attn/v:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[ 2.1935981e-02, -6.5499027e-03, -1.1758077e-02, ...,\n",
+       "                        1.0016707e-02, -7.5214269e-04, -8.2895309e-03],\n",
+       "                      [-1.8930623e-03,  5.3072263e-02,  1.5991306e-03, ...,\n",
+       "                       -1.8671863e-02,  2.4590937e-02,  2.4358975e-02],\n",
+       "                      [-3.1385969e-02, -2.4187125e-02, -2.3068676e-02, ...,\n",
+       "                       -2.9522167e-03,  2.9918220e-02, -1.3696299e-02],\n",
+       "                      ...,\n",
+       "                      [ 4.5431224e-03, -2.1852402e-03, -3.7807938e-02, ...,\n",
+       "                       -6.8151602e-03, -6.5027446e-02, -2.5086295e-02],\n",
+       "                      [ 1.6041191e-02,  2.7763426e-02,  3.7474424e-02, ...,\n",
+       "                       -2.7330104e-02,  1.4487169e-02, -3.0760732e-02],\n",
+       "                      [ 2.8109785e-02, -2.4505377e-02,  1.8567089e-02, ...,\n",
+       "                        1.4045787e-02, -1.9658763e-02, -1.4424617e-02]],\n",
+       "              \n",
+       "                     [[ 1.8175874e-03, -3.2669792e-04,  1.3658139e-02, ...,\n",
+       "                       -2.3051307e-02, -4.8103187e-02,  1.1212352e-02],\n",
+       "                      [ 8.3899694e-03,  2.7757354e-02,  2.1220583e-03, ...,\n",
+       "                        1.4684557e-02, -9.0189716e-03, -1.3189890e-02],\n",
+       "                      [-4.5665298e-03,  6.0181617e-04, -1.9221806e-03, ...,\n",
+       "                       -2.3014978e-02, -1.6371313e-02, -1.3619252e-02],\n",
+       "                      ...,\n",
+       "                      [-4.4560842e-02,  3.2866932e-02, -1.5270534e-02, ...,\n",
+       "                        4.7959336e-03, -5.0913695e-02, -4.4832855e-02],\n",
+       "                      [-2.6422122e-02,  3.0812582e-05, -1.1526907e-02, ...,\n",
+       "                       -2.9947080e-02,  9.2024086e-03,  4.0475205e-03],\n",
+       "                      [-4.6224903e-02,  4.9632844e-03,  7.3847193e-03, ...,\n",
+       "                       -3.4064833e-02,  1.4927809e-02,  4.0222075e-02]],\n",
+       "              \n",
+       "                     [[-2.4709852e-02,  4.0778179e-02,  2.4162993e-02, ...,\n",
+       "                       -7.7223894e-04,  3.3004548e-02, -2.0557796e-03],\n",
+       "                      [-1.7915012e-02, -4.2037833e-02,  1.7063325e-02, ...,\n",
+       "                        3.9280627e-02, -8.4403567e-03,  1.0665564e-03],\n",
+       "                      [-3.1648852e-02,  1.9462965e-02, -5.1749021e-02, ...,\n",
+       "                        1.2728607e-02, -3.1452335e-02, -1.2489329e-02],\n",
+       "                      ...,\n",
+       "                      [-3.3701200e-02,  1.7426152e-02,  9.4926590e-03, ...,\n",
+       "                        8.8201044e-03, -2.5306158e-02,  5.8208715e-02],\n",
+       "                      [ 1.6601574e-02, -1.4275823e-02, -1.6822370e-02, ...,\n",
+       "                        2.4828877e-02, -8.6892888e-02,  6.4262375e-03],\n",
+       "                      [ 9.1747073e-03, -1.1685979e-02, -3.6286458e-02, ...,\n",
+       "                        1.3910839e-02,  8.0748266e-03,  5.0397436e-03]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[-8.4186476e-03, -1.0676413e-02, -1.0499355e-02, ...,\n",
+       "                        1.4340507e-03, -1.5456588e-02,  8.2055647e-03],\n",
+       "                      [ 2.0050982e-02,  3.9912029e-03, -4.9512643e-02, ...,\n",
+       "                       -8.0223344e-03,  8.9866975e-03, -1.7193217e-02],\n",
+       "                      [-6.1425157e-03, -2.3025960e-02, -2.0697471e-02, ...,\n",
+       "                       -1.3261255e-03, -4.4959106e-02,  1.4391148e-02],\n",
+       "                      ...,\n",
+       "                      [-3.9630566e-02,  3.4915447e-02, -2.5021229e-02, ...,\n",
+       "                        1.9735634e-02,  2.4283731e-02,  8.8040769e-02],\n",
+       "                      [ 7.1960546e-02, -3.2245752e-03, -3.1058513e-02, ...,\n",
+       "                        9.1858171e-03,  2.0113736e-02,  3.4582719e-02],\n",
+       "                      [ 3.5613827e-02,  5.2555401e-02,  2.0199718e-02, ...,\n",
+       "                        2.9557332e-02, -2.4335729e-03, -4.0849347e-02]],\n",
+       "              \n",
+       "                     [[ 2.5519842e-02,  3.4481441e-03,  7.5593151e-02, ...,\n",
+       "                       -1.0861231e-02,  1.3288087e-02, -2.1570064e-03],\n",
+       "                      [ 2.5518127e-02,  1.7416688e-02,  3.1182369e-02, ...,\n",
+       "                       -2.4906599e-03,  1.5789142e-02,  8.4962416e-03],\n",
+       "                      [ 1.0470330e-02, -9.0953298e-03,  2.6568150e-02, ...,\n",
+       "                       -7.2716870e-03,  3.2788489e-02,  1.6375307e-02],\n",
+       "                      ...,\n",
+       "                      [ 5.4019187e-03, -1.6473958e-02, -2.0612899e-02, ...,\n",
+       "                       -9.2589520e-03,  1.1356876e-02,  2.7651006e-02],\n",
+       "                      [ 1.5268090e-02,  8.3070369e-03,  8.7036788e-03, ...,\n",
+       "                        7.7237003e-03,  7.3369341e-03,  2.1213299e-02],\n",
+       "                      [-4.1702986e-02, -1.6719857e-02, -4.1055001e-02, ...,\n",
+       "                        2.3881821e-03, -1.4375679e-02, -5.3924224e-03]],\n",
+       "              \n",
+       "                     [[-3.8459700e-02,  2.7399434e-02, -2.4477823e-02, ...,\n",
+       "                       -2.8467288e-02,  4.2125326e-02, -2.4380080e-02],\n",
+       "                      [-8.2248095e-03,  9.4872410e-04,  3.1300731e-02, ...,\n",
+       "                        1.2363208e-02,  1.0819474e-02, -1.3270676e-03],\n",
+       "                      [-1.3462825e-02,  1.1999467e-02, -5.2867807e-03, ...,\n",
+       "                        5.4947892e-03,  8.4173940e-03, -1.5731178e-02],\n",
+       "                      ...,\n",
+       "                      [ 6.6192739e-02, -2.1830844e-03, -2.2746423e-02, ...,\n",
+       "                        9.5197987e-03, -3.5458893e-02,  4.4134855e-02],\n",
+       "                      [ 2.5184005e-02,  5.4138672e-02,  1.3472022e-02, ...,\n",
+       "                       -4.9555153e-02, -3.8271304e-02, -1.1530346e-03],\n",
+       "                      [-1.5618957e-02, -2.3071036e-02,  6.0527720e-02, ...,\n",
+       "                        3.5982949e-03,  7.5665531e-03,  1.2278390e-03]]], dtype=float32)>\n",
+       "              (o): <tf.Variable 'transformer/layer_._0/rel_attn/o:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[ 3.4558035e-02, -8.1972502e-02, -5.6760699e-02, ...,\n",
+       "                        1.3388766e-02, -3.4494880e-03, -3.5049133e-02],\n",
+       "                      [ 1.4903742e-02,  5.1185200e-03,  2.7732885e-02, ...,\n",
+       "                        1.5752869e-02, -1.6719513e-04, -3.2367846e-03],\n",
+       "                      [-3.1436101e-02, -3.6930665e-02, -8.4744478e-03, ...,\n",
+       "                        1.1747203e-02, -2.9896988e-02, -2.3278227e-02],\n",
+       "                      ...,\n",
+       "                      [-4.4766188e-02, -2.9565591e-02,  2.2492344e-02, ...,\n",
+       "                        2.3775781e-03, -2.3477389e-03, -6.3977003e-02],\n",
+       "                      [-7.9599731e-03,  2.3603067e-02,  4.2270361e-03, ...,\n",
+       "                       -7.9671228e-03, -8.4035415e-03,  3.3881772e-02],\n",
+       "                      [ 2.3896206e-02,  5.2790940e-02, -1.9825008e-02, ...,\n",
+       "                        3.4890927e-02, -1.6427118e-02, -1.3012372e-02]],\n",
+       "              \n",
+       "                     [[ 5.6012128e-02,  3.9354857e-02, -3.7056282e-02, ...,\n",
+       "                       -9.5437188e-04, -1.5669381e-02,  3.6575941e-03],\n",
+       "                      [ 1.0521270e-02,  2.4832424e-02,  1.0564318e-02, ...,\n",
+       "                        4.5253210e-02, -3.8564852e-03, -5.6845369e-03],\n",
+       "                      [ 1.9469766e-02, -2.4921447e-03,  1.7152067e-02, ...,\n",
+       "                       -2.1238407e-02, -3.6743453e-03, -1.8075069e-02],\n",
+       "                      ...,\n",
+       "                      [-9.2346454e-04,  3.8158480e-02,  1.6374113e-02, ...,\n",
+       "                        1.5201136e-02,  1.3134910e-02,  6.9975376e-02],\n",
+       "                      [-2.4690642e-03,  7.7905254e-03, -2.1554135e-02, ...,\n",
+       "                       -3.9290216e-02, -4.0334272e-03, -1.0793213e-03],\n",
+       "                      [-1.6754212e-02,  4.7255494e-02, -3.2703991e-03, ...,\n",
+       "                       -3.3369564e-02, -6.0496605e-03,  2.2343850e-02]],\n",
+       "              \n",
+       "                     [[ 3.5791956e-02,  3.4770794e-02,  3.7401337e-02, ...,\n",
+       "                       -4.1593242e-02, -6.7334563e-02,  7.5647626e-03],\n",
+       "                      [-5.5595064e-03, -8.0210743e-03,  3.9957631e-02, ...,\n",
+       "                        1.7897096e-02,  2.1864127e-02,  4.6957351e-02],\n",
+       "                      [-3.2328866e-02,  1.4444360e-02, -6.8443440e-02, ...,\n",
+       "                        8.4532611e-03, -8.8195698e-03,  4.0060803e-03],\n",
+       "                      ...,\n",
+       "                      [-4.3917345e-03,  2.9294435e-02, -3.1086415e-02, ...,\n",
+       "                        3.7843004e-02,  2.0224897e-02, -9.4552422e-03],\n",
+       "                      [ 2.0256270e-02,  1.3612260e-02, -1.5514650e-02, ...,\n",
+       "                        1.6113631e-02, -7.7781297e-02,  4.5416508e-02],\n",
+       "                      [-1.7456708e-02, -3.6125474e-02, -4.8056237e-02, ...,\n",
+       "                        5.6817383e-03,  3.8123481e-02,  5.2873984e-02]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[-6.6254879e-03, -7.6921834e-03,  1.3759888e-02, ...,\n",
+       "                       -9.2632528e-03,  1.1549971e-02, -3.9358933e-02],\n",
+       "                      [ 1.4470451e-02, -4.2162634e-02,  1.2218486e-02, ...,\n",
+       "                        3.8135707e-02, -3.5125174e-02, -5.4729473e-02],\n",
+       "                      [ 8.0266371e-03,  8.7115606e-03,  5.6484030e-03, ...,\n",
+       "                        5.8089835e-03, -3.3503424e-02, -1.6844057e-02],\n",
+       "                      ...,\n",
+       "                      [-1.0784569e-02,  4.7266845e-02,  5.7555144e-03, ...,\n",
+       "                       -3.6044452e-02,  3.6605848e-03, -1.0359948e-02],\n",
+       "                      [ 1.3826589e-02, -2.8647454e-03,  2.5868905e-03, ...,\n",
+       "                        1.7714184e-02, -3.6266308e-02, -7.1984404e-03],\n",
+       "                      [-2.3084020e-02,  2.2052677e-02, -2.8226499e-02, ...,\n",
+       "                        5.0086722e-02,  1.3204823e-02,  2.3870086e-03]],\n",
+       "              \n",
+       "                     [[-2.8730264e-02, -5.2821822e-03, -9.1553042e-03, ...,\n",
+       "                        2.0447128e-02, -4.7689546e-02,  7.5007915e-03],\n",
+       "                      [-2.3960054e-02, -1.7942205e-02, -1.8274842e-02, ...,\n",
+       "                       -8.0897193e-03, -2.3875024e-02, -1.4553037e-02],\n",
+       "                      [ 1.7344387e-02, -2.0958342e-02,  1.4681545e-02, ...,\n",
+       "                       -2.2302102e-02,  2.8698748e-02, -9.1849379e-03],\n",
+       "                      ...,\n",
+       "                      [-1.8616887e-02,  4.7773879e-02,  2.2023235e-02, ...,\n",
+       "                       -3.4950111e-02, -3.9754819e-02,  3.8231418e-03],\n",
+       "                      [-2.6944082e-03, -2.2312153e-02,  6.6401674e-03, ...,\n",
+       "                        1.6840655e-02,  8.5035199e-04, -5.4619432e-04],\n",
+       "                      [ 7.5075715e-03,  2.7986795e-02, -2.1366706e-02, ...,\n",
+       "                        2.1776481e-02, -3.2732459e-03,  1.7775759e-02]],\n",
+       "              \n",
+       "                     [[ 1.7125104e-02,  1.5672354e-02, -1.9874105e-02, ...,\n",
+       "                       -8.8345492e-03, -6.3765082e-03,  3.8814072e-02],\n",
+       "                      [-1.5929114e-02,  4.0955096e-02,  1.8637704e-02, ...,\n",
+       "                       -4.3095972e-02,  5.2418392e-03, -8.3040539e-03],\n",
+       "                      [-2.5189148e-02,  1.6959475e-02,  2.0080386e-03, ...,\n",
+       "                        1.7491961e-06, -9.4349124e-03, -8.7165339e-03],\n",
+       "                      ...,\n",
+       "                      [-1.5020861e-02,  9.1123721e-03, -1.2940341e-02, ...,\n",
+       "                        2.1540092e-02, -4.8262607e-02,  9.3815767e-04],\n",
+       "                      [-2.0072028e-02, -3.4046255e-03, -5.2106597e-02, ...,\n",
+       "                       -1.6067177e-02,  4.7017686e-02,  5.2954555e-03],\n",
+       "                      [ 2.7247950e-02, -4.7271936e-03,  3.7552916e-02, ...,\n",
+       "                       -2.3428671e-02,  2.5338635e-02, -7.1937349e-03]]], dtype=float32)>\n",
+       "              (r): <tf.Variable 'transformer/layer_._0/rel_attn/r:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[ 3.38747710e-01, -3.52252215e-01, -3.31913650e-01, ...,\n",
+       "                       -3.32406253e-01, -3.55435610e-01, -3.70355815e-01],\n",
+       "                      [-2.57155180e-01, -2.27717996e-01, -2.49137834e-01, ...,\n",
+       "                        2.52328873e-01, -2.27478221e-01,  2.74260193e-01],\n",
+       "                      [-8.42767283e-02,  1.40244111e-01, -1.90620884e-01, ...,\n",
+       "                        1.35595366e-01,  1.51921853e-01, -1.44851297e-01],\n",
+       "                      ...,\n",
+       "                      [-3.61111403e-01,  3.26171756e-01, -3.69894445e-01, ...,\n",
+       "                       -3.20066005e-01, -3.35039854e-01, -3.68529588e-01],\n",
+       "                      [-3.09335232e-01,  3.14753771e-01,  3.20735216e-01, ...,\n",
+       "                       -3.20914894e-01,  2.96445906e-01,  3.30758154e-01],\n",
+       "                      [ 2.12763369e-01,  2.13694334e-01,  2.23139688e-01, ...,\n",
+       "                       -2.15393752e-01, -2.09336951e-01,  2.45465353e-01]],\n",
+       "              \n",
+       "                     [[ 3.20928752e-01, -2.94858247e-01, -3.14106166e-01, ...,\n",
+       "                       -3.04256856e-01, -3.10841501e-01, -3.13560814e-01],\n",
+       "                      [-1.59511223e-01, -1.70894131e-01, -1.87740177e-01, ...,\n",
+       "                        1.77135527e-01, -1.74924582e-01,  1.93289027e-01],\n",
+       "                      [-1.41561776e-02,  7.51935318e-02, -1.13328710e-01, ...,\n",
+       "                        7.05530196e-02,  7.44837448e-02, -9.26639065e-02],\n",
+       "                      ...,\n",
+       "                      [-3.11126292e-01,  3.01795095e-01, -2.95113325e-01, ...,\n",
+       "                       -2.81502992e-01, -2.79552013e-01, -2.94877738e-01],\n",
+       "                      [-2.69808233e-01,  2.46761337e-01,  2.37797692e-01, ...,\n",
+       "                       -2.70426184e-01,  2.29666948e-01,  2.68684894e-01],\n",
+       "                      [ 1.52459487e-01,  1.56723812e-01,  1.87588021e-01, ...,\n",
+       "                       -1.80774227e-01, -1.40872061e-01,  1.92230970e-01]],\n",
+       "              \n",
+       "                     [[ 2.41833925e-01, -2.19398052e-01, -2.29633719e-01, ...,\n",
+       "                       -2.45204329e-01, -2.58349568e-01, -2.36624196e-01],\n",
+       "                      [-1.61572859e-01, -1.48212776e-01, -1.40561178e-01, ...,\n",
+       "                        1.41516134e-01, -1.32165566e-01,  1.68426186e-01],\n",
+       "                      [ 8.09539296e-03,  3.59569304e-02, -1.04876310e-01, ...,\n",
+       "                        1.58704743e-02,  3.60485800e-02, -2.96752173e-02],\n",
+       "                      ...,\n",
+       "                      [-2.84408092e-01,  2.66984671e-01, -2.70496905e-01, ...,\n",
+       "                       -2.57439345e-01, -2.39332542e-01, -2.48226896e-01],\n",
+       "                      [-2.43775159e-01,  2.12252900e-01,  2.33381778e-01, ...,\n",
+       "                       -2.36481652e-01,  2.05704838e-01,  2.55553931e-01],\n",
+       "                      [ 1.28472507e-01,  1.25496238e-01,  1.41340226e-01, ...,\n",
+       "                       -1.42667651e-01, -1.06452040e-01,  1.74517885e-01]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[ 1.18206572e-02, -1.62823759e-02, -1.13886865e-02, ...,\n",
+       "                       -2.72346847e-02, -1.76205616e-02, -2.58876495e-02],\n",
+       "                      [-2.48313230e-02, -2.81952247e-02, -2.03840993e-02, ...,\n",
+       "                        1.74464211e-02, -2.47928239e-02,  7.45158223e-03],\n",
+       "                      [-9.72194225e-03,  1.15375388e-02, -2.56897379e-02, ...,\n",
+       "                        3.06775165e-03,  1.03304058e-03,  2.59421836e-03],\n",
+       "                      ...,\n",
+       "                      [-1.75657198e-02,  2.45507937e-02, -2.12120879e-02, ...,\n",
+       "                       -2.06703022e-02, -1.25367660e-02, -1.66469775e-02],\n",
+       "                      [ 1.25846509e-02, -3.71760194e-04,  4.49259765e-03, ...,\n",
+       "                       -6.64241752e-03, -9.64385923e-03,  1.40363369e-02],\n",
+       "                      [ 1.40556889e-02,  1.82496123e-02, -2.07160265e-04, ...,\n",
+       "                        2.71461118e-04, -8.42160638e-03,  1.78159462e-04]],\n",
+       "              \n",
+       "                     [[-2.22503580e-02,  3.15407328e-02,  2.72795390e-02, ...,\n",
+       "                        2.50934549e-02,  3.40305455e-02,  3.39202397e-02],\n",
+       "                      [ 1.35067226e-02,  2.46651508e-02,  1.00027593e-02, ...,\n",
+       "                       -2.89492551e-02,  1.59373134e-02, -1.51004000e-02],\n",
+       "                      [ 2.25287229e-02, -2.75186412e-02,  1.70388352e-02, ...,\n",
+       "                       -1.08766872e-02, -1.86810736e-03,  1.76009033e-02],\n",
+       "                      ...,\n",
+       "                      [ 1.43293003e-02, -1.70654003e-02,  1.25767132e-02, ...,\n",
+       "                        8.09190446e-04,  1.77804064e-02,  3.09025124e-02],\n",
+       "                      [ 2.47963774e-03, -2.90571898e-03, -1.11264074e-02, ...,\n",
+       "                        5.73507929e-03, -9.31484811e-03,  3.93942930e-03],\n",
+       "                      [-8.68460070e-03,  2.89098313e-03, -2.11955067e-02, ...,\n",
+       "                        1.13159856e-02,  2.39106696e-02,  7.65375979e-03]],\n",
+       "              \n",
+       "                     [[ 5.94059192e-02, -3.16232182e-02, -4.25012745e-02, ...,\n",
+       "                       -4.64180671e-02, -4.29909676e-02, -5.43733463e-02],\n",
+       "                      [ 1.00171287e-02,  2.10887119e-02,  3.75756249e-02, ...,\n",
+       "                       -3.65561582e-02,  1.15714017e-02, -2.47725472e-02],\n",
+       "                      [-2.42286529e-02,  6.19218312e-03,  2.24700011e-02, ...,\n",
+       "                       -6.83102896e-03, -3.37700290e-03,  4.71456256e-03],\n",
+       "                      ...,\n",
+       "                      [ 1.35079189e-03,  1.35904429e-02, -1.20370295e-02, ...,\n",
+       "                       -6.28219778e-03, -2.10926589e-02, -1.22290216e-02],\n",
+       "                      [-3.48052718e-02,  4.21429165e-02, -4.43692598e-03, ...,\n",
+       "                       -3.98377255e-02,  2.64684688e-02,  3.64753604e-02],\n",
+       "                      [-1.27071552e-02, -1.95082203e-02, -4.74442961e-03, ...,\n",
+       "                       -5.14267990e-03,  1.45630771e-02, -1.93668939e-02]]],\n",
+       "                    dtype=float32)>\n",
+       "              (r_r_bias): <tf.Variable 'transformer/layer_._0/rel_attn/r_r_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "              array([[-0.37346047,  0.37250054,  0.3907651 ,  0.38277408,  0.35741195,\n",
+       "                       0.38824454, -0.36372992,  0.37197435,  0.37989146,  0.37147713,\n",
+       "                       0.37070706,  0.35559788],\n",
+       "                     [ 0.06975611,  0.07689185,  0.07228172, -0.0722764 ,  0.08365536,\n",
+       "                       0.06633326,  0.07988963, -0.06860004, -0.0622002 , -0.06374823,\n",
+       "                       0.0776644 , -0.07216003],\n",
+       "                     [ 0.22928728, -0.17429328,  0.09725206, -0.10263564,  0.06898433,\n",
+       "                       0.13690604,  0.12810868,  0.06246556, -0.14255992, -0.169385  ,\n",
+       "                      -0.16261199,  0.16058037],\n",
+       "                     [-0.19601476, -0.19472797,  0.20428008,  0.20267177,  0.18398753,\n",
+       "                      -0.20113394, -0.20566987, -0.21166983,  0.2035028 ,  0.20144981,\n",
+       "                      -0.20082442, -0.21696469],\n",
+       "                     [-0.27361003,  0.26644444, -0.25823227,  0.27925947,  0.27160206,\n",
+       "                      -0.26067862,  0.270715  ,  0.2698397 ,  0.25726572,  0.25751913,\n",
+       "                       0.24445428,  0.27668142],\n",
+       "                     [-0.30897072,  0.29939672,  0.29147333, -0.29759452,  0.31223142,\n",
+       "                      -0.270364  , -0.3067601 , -0.30111563,  0.31529158,  0.31188235,\n",
+       "                      -0.29824102, -0.31075856],\n",
+       "                     [-0.39532706,  0.38874832, -0.39142627, -0.3886234 , -0.38499188,\n",
+       "                      -0.39429832,  0.3917147 , -0.37333068, -0.38008067,  0.38615617,\n",
+       "                      -0.38081092, -0.39247522],\n",
+       "                     [ 0.2290351 , -0.23079675,  0.23544736,  0.21889143,  0.21990548,\n",
+       "                       0.2233682 ,  0.20575589,  0.23166424,  0.21836095, -0.22710325,\n",
+       "                      -0.23054157, -0.22402786],\n",
+       "                     [ 0.31462234, -0.33824605,  0.34888077,  0.35271886, -0.35531324,\n",
+       "                       0.34544548,  0.3376679 ,  0.3411377 , -0.335851  , -0.3580673 ,\n",
+       "                       0.33728704, -0.35013184],\n",
+       "                     [ 0.28967628, -0.28802818,  0.29017174,  0.29956898,  0.29380292,\n",
+       "                      -0.28895316, -0.28544793, -0.292428  , -0.2882111 , -0.28964576,\n",
+       "                       0.29340708,  0.2927634 ],\n",
+       "                     [-0.3411081 ,  0.35220957,  0.33591127,  0.3540816 ,  0.3503263 ,\n",
+       "                       0.33048216, -0.34637055,  0.32407367, -0.32438353,  0.3529602 ,\n",
+       "                      -0.35776407, -0.33932883],\n",
+       "                     [-0.37032467, -0.36812896, -0.39068243, -0.37287602, -0.3721401 ,\n",
+       "                      -0.38354024, -0.3734055 ,  0.4030942 ,  0.37940052,  0.34137526,\n",
+       "                       0.3707558 , -0.3911879 ],\n",
+       "                     [-0.13885868, -0.07073349, -0.1152356 ,  0.11311065,  0.05461643,\n",
+       "                      -0.10694173, -0.11797076, -0.11336335, -0.10334926,  0.07756246,\n",
+       "                       0.12306441,  0.10861646],\n",
+       "                     [ 0.37422347, -0.37067974,  0.382464  ,  0.37082633, -0.37619328,\n",
+       "                       0.3700374 , -0.3775079 ,  0.369756  , -0.37618253,  0.3672613 ,\n",
+       "                       0.39667937,  0.38020003],\n",
+       "                     [ 0.30904633, -0.29189512, -0.31334987, -0.29167944, -0.31405964,\n",
+       "                      -0.28898612,  0.2923434 ,  0.30766192, -0.28573954,  0.2949249 ,\n",
+       "                      -0.29706052, -0.31455588],\n",
+       "                     [-0.1166977 , -0.09267767, -0.05344103,  0.20561723,  0.10361944,\n",
+       "                      -0.09597252, -0.11368804,  0.07374494,  0.0895981 ,  0.07990894,\n",
+       "                       0.10973554, -0.05313613]], dtype=float32)>\n",
+       "              (r_s_bias): <tf.Variable 'transformer/layer_._0/rel_attn/r_s_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "              array([[0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.]], dtype=float32)>\n",
+       "              (r_w_bias): <tf.Variable 'transformer/layer_._0/rel_attn/r_w_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "              array([[ 0.02704959,  0.02960145,  0.00974695,  0.04531549, -0.0031658 ,\n",
+       "                       0.00470249,  0.01819921,  0.01747902, -0.01848036,  0.01552903,\n",
+       "                      -0.01393487, -0.01188555],\n",
+       "                     [ 0.01097695,  0.05780909,  0.03655621, -0.02134515,  0.02434413,\n",
+       "                       0.01866677,  0.01949622, -0.01921584, -0.02902889, -0.03096105,\n",
+       "                      -0.00388369, -0.01727411],\n",
+       "                     [-0.13681485,  0.12220031,  0.07949183,  0.09230855,  0.1203526 ,\n",
+       "                       0.13126956,  0.00737103,  0.04044032,  0.13264242,  0.16051207,\n",
+       "                       0.12056144, -0.15448172],\n",
+       "                     [-0.0837023 , -0.07897114,  0.10445868,  0.09328368,  0.09781563,\n",
+       "                      -0.07505805, -0.07814854, -0.10116591,  0.11434007,  0.1039658 ,\n",
+       "                      -0.11767636, -0.10332035],\n",
+       "                     [-0.10378645,  0.07673589, -0.09991188,  0.09477323,  0.06950181,\n",
+       "                      -0.09498238,  0.11595728,  0.0818167 ,  0.09139769,  0.0908348 ,\n",
+       "                       0.09375099,  0.09006778],\n",
+       "                     [-0.07200488,  0.11039345,  0.08926661, -0.10429743,  0.10531338,\n",
+       "                      -0.13036886, -0.09732608, -0.09588756,  0.10691873,  0.069135  ,\n",
+       "                      -0.07627007, -0.09407212],\n",
+       "                     [-0.06730818,  0.0776398 , -0.07527994, -0.08677673, -0.07946926,\n",
+       "                      -0.09474014,  0.08316637, -0.10570373, -0.10657622,  0.06857269,\n",
+       "                      -0.09510182, -0.07508499],\n",
+       "                     [ 0.1272688 , -0.11871098,  0.11859486,  0.12073346,  0.15111545,\n",
+       "                       0.12950963,  0.14462966,  0.13155784,  0.14078899, -0.11819407,\n",
+       "                      -0.11242524, -0.12828752],\n",
+       "                     [ 0.10244546, -0.08281285,  0.12599547,  0.12352646, -0.08232223,\n",
+       "                       0.06362368,  0.11628054,  0.08121345, -0.09381401, -0.1017275 ,\n",
+       "                       0.1122688 , -0.0936246 ],\n",
+       "                     [ 0.06956902, -0.07016854,  0.07207846,  0.08185235,  0.07348476,\n",
+       "                      -0.07044141, -0.10483667, -0.06724312, -0.07413901, -0.08150072,\n",
+       "                       0.08842966,  0.07842822],\n",
+       "                     [-0.04902898,  0.08947049,  0.08037989,  0.06807387,  0.06831039,\n",
+       "                       0.05044439, -0.10449897,  0.05752584, -0.07764029,  0.09782408,\n",
+       "                      -0.11914786, -0.05327021],\n",
+       "                     [-0.12178728, -0.11973495, -0.08931118, -0.11802942, -0.12639539,\n",
+       "                      -0.11765701, -0.12301757,  0.09002702,  0.1099894 ,  0.10601277,\n",
+       "                       0.12055498, -0.11824764],\n",
+       "                     [-0.13013272, -0.11347592, -0.09590119, -0.04600147,  0.12135155,\n",
+       "                       0.15605357,  0.14212345,  0.12413304, -0.11489878,  0.10646964,\n",
+       "                       0.11570179,  0.13300925],\n",
+       "                     [ 0.07953635, -0.05358617,  0.06076136,  0.03857687, -0.08740384,\n",
+       "                       0.09580573, -0.11589228,  0.0530813 , -0.1262951 ,  0.12957394,\n",
+       "                       0.14165434,  0.07234689],\n",
+       "                     [ 0.00606865, -0.02865283, -0.11514653, -0.03855786, -0.03915163,\n",
+       "                      -0.04437567,  0.05897851,  0.07263748, -0.07599041,  0.02014523,\n",
+       "                      -0.0326612 , -0.05191225],\n",
+       "                     [-0.02615956,  0.00082458,  0.02219692, -0.05171375,  0.05447492,\n",
+       "                       0.06622541, -0.02247809,  0.05879986,  0.01587608,  0.09542776,\n",
+       "                       0.03455094,  0.00630618]], dtype=float32)>\n",
+       "              (seg_embed): <tf.Variable 'transformer/layer_._0/rel_attn/seg_embed:0' shape=(2, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[ 6.92830980e-03, -1.91756096e-02,  2.75568711e-03,\n",
+       "                       -3.27806338e-03,  1.43940898e-03,  8.38105334e-04,\n",
+       "                       -3.17075802e-03,  4.66949260e-03,  1.29533000e-02,\n",
+       "                        6.37105154e-03, -1.42557546e-02, -1.56039307e-02],\n",
+       "                      [-5.24008507e-03,  5.83554897e-03,  5.28278288e-05,\n",
+       "                        4.41452535e-03, -5.96833415e-03,  1.97377801e-02,\n",
+       "                        6.63386192e-03, -2.70113046e-03, -1.09323701e-02,\n",
+       "                        9.40765906e-03,  8.52212869e-03,  1.27732707e-02],\n",
+       "                      [-5.47951926e-03, -6.30398374e-03, -1.88931415e-03,\n",
+       "                       -3.82627477e-03, -1.03170695e-02, -1.62921418e-02,\n",
+       "                        4.42750810e-04,  1.83049624e-03, -4.93631791e-03,\n",
+       "                        7.21302396e-03,  7.58891134e-03, -1.35076218e-04],\n",
+       "                      [-5.04115736e-03,  1.51219219e-03, -6.07239781e-04,\n",
+       "                        2.68661021e-03, -5.32567082e-03, -3.63681372e-03,\n",
+       "                       -1.47937634e-03,  1.41145978e-02,  2.44664983e-03,\n",
+       "                       -5.30580198e-03, -3.58004036e-04,  2.21235352e-03],\n",
+       "                      [ 6.63177948e-03,  7.20981602e-03, -3.34927929e-03,\n",
+       "                        1.57867242e-02, -1.06790895e-02,  4.76629054e-03,\n",
+       "                        7.01094558e-03,  2.55558966e-03,  7.01530662e-04,\n",
+       "                        1.96129885e-02, -3.47580039e-03, -4.14459547e-03],\n",
+       "                      [ 6.63608173e-03,  8.13847221e-03,  1.26328748e-02,\n",
+       "                        2.93742679e-03, -1.11131268e-02, -7.77325965e-03,\n",
+       "                       -4.69116308e-03,  5.06164553e-03,  3.31703736e-03,\n",
+       "                       -1.49551462e-02,  9.83483810e-03, -1.38381887e-02],\n",
+       "                      [-3.13207647e-03, -1.20346656e-03, -7.14240829e-04,\n",
+       "                        3.38257337e-03, -1.21155549e-02,  1.77355520e-02,\n",
+       "                       -3.78817786e-03,  4.60852869e-03,  1.38352753e-03,\n",
+       "                       -1.96225918e-03, -1.54525228e-03,  7.27207214e-03],\n",
+       "                      [-3.52438586e-03, -6.73636142e-03,  5.56267146e-03,\n",
+       "                        2.76904181e-03,  6.09423034e-03,  1.14140250e-02,\n",
+       "                        4.51555708e-03, -4.84374259e-03, -1.83317550e-02,\n",
+       "                        4.07868624e-03, -3.52122728e-03, -9.72320139e-03],\n",
+       "                      [-2.92871613e-03, -1.36275403e-03, -1.12001523e-02,\n",
+       "                        4.15648054e-03,  7.76014291e-04, -1.56104667e-04,\n",
+       "                        1.66957453e-02, -1.34978080e-02,  2.59425724e-03,\n",
+       "                        1.50437718e-02, -8.85847863e-03, -2.27058597e-04],\n",
+       "                      [-8.55377130e-03, -9.33228992e-04,  1.05962288e-02,\n",
+       "                        3.73685732e-03, -1.46479104e-02, -2.58295774e-03,\n",
+       "                       -3.21662426e-03,  8.22018459e-03, -6.62432238e-03,\n",
+       "                        5.34095289e-03, -1.60596147e-02,  1.89380813e-02],\n",
+       "                      [-3.03876121e-03, -9.45069920e-03, -1.05521297e-02,\n",
+       "                        7.64022162e-03,  1.24902911e-02,  1.32637294e-02,\n",
+       "                        1.30019896e-02,  4.11059591e-04,  1.14952738e-03,\n",
+       "                       -9.66892054e-04,  3.42015829e-03,  1.51099060e-02],\n",
+       "                      [ 9.67782363e-03,  1.13166841e-02,  1.24215791e-02,\n",
+       "                       -8.93799961e-03, -7.70286610e-03, -2.62288231e-04,\n",
+       "                       -1.25799067e-02, -2.34622974e-03, -1.37031516e-02,\n",
+       "                        7.25830998e-03,  3.48036946e-03,  8.82094260e-03],\n",
+       "                      [ 1.93330422e-02,  1.02664595e-02, -1.38892382e-02,\n",
+       "                       -4.28191572e-03, -1.71063491e-03,  2.99980305e-03,\n",
+       "                       -5.98835619e-03,  1.08044026e-02, -7.76272779e-03,\n",
+       "                       -8.02671071e-04,  6.56242890e-04,  5.36549371e-03],\n",
+       "                      [-1.00181112e-02, -1.59210637e-02, -8.38838704e-03,\n",
+       "                        4.86764265e-03, -1.79222059e-02,  3.47048254e-03,\n",
+       "                       -1.83304548e-02, -4.92845010e-03,  3.65043571e-03,\n",
+       "                        2.54237023e-03, -1.38753336e-02, -1.58153474e-02],\n",
+       "                      [-8.56178463e-04,  9.56560671e-03,  1.43071841e-02,\n",
+       "                        1.44142760e-02, -2.97402544e-03, -1.18832442e-03,\n",
+       "                        1.54865775e-02,  1.16390940e-02,  1.89097952e-02,\n",
+       "                       -1.21177221e-03, -1.57084243e-04,  1.07376613e-02],\n",
+       "                      [-1.82367454e-03,  2.21159682e-03, -3.59512377e-03,\n",
+       "                       -8.40761815e-04,  1.32178674e-02,  1.82569642e-02,\n",
+       "                       -6.03301101e-04, -5.30507276e-03,  1.09237980e-03,\n",
+       "                        1.43965418e-02, -8.32139887e-03,  4.34310501e-03]],\n",
+       "              \n",
+       "                     [[ 6.01352192e-03,  1.62515126e-03, -8.11410509e-03,\n",
+       "                       -6.86854636e-03, -6.21954072e-03, -1.00534027e-02,\n",
+       "                       -9.41478554e-03,  1.14045916e-02, -8.45357031e-03,\n",
+       "                       -2.07757368e-03, -1.37391184e-02, -4.38201270e-04],\n",
+       "                      [ 1.43431686e-02,  9.54034738e-03, -5.74651361e-03,\n",
+       "                        1.66568439e-04, -9.06508230e-03,  1.37667237e-02,\n",
+       "                        5.70776733e-03,  7.25450320e-03,  2.16021363e-05,\n",
+       "                       -5.47146471e-03, -6.25970587e-03, -3.44276486e-05],\n",
+       "                      [ 1.48183517e-02, -6.20869081e-03,  8.95625539e-03,\n",
+       "                       -9.27595049e-03, -1.83574425e-03,  2.49610422e-03,\n",
+       "                       -1.22964820e-02, -1.36222802e-02,  9.96832177e-03,\n",
+       "                       -1.19066276e-02, -7.85201322e-03, -7.36650918e-03],\n",
+       "                      [ 1.08605931e-02,  8.69748648e-03,  3.17076640e-03,\n",
+       "                       -8.42709839e-03, -1.57119669e-02, -1.40998634e-02,\n",
+       "                       -1.92577229e-03, -1.10639585e-02,  2.97422521e-03,\n",
+       "                       -1.15742059e-02,  1.63778535e-03,  9.25154146e-03],\n",
+       "                      [-4.83186170e-03, -1.48528756e-03, -6.04805397e-03,\n",
+       "                       -3.92264035e-03, -1.23623861e-02, -1.09437210e-02,\n",
+       "                       -1.96897378e-03, -6.39349746e-04,  4.56422335e-03,\n",
+       "                        1.13997767e-02,  4.75200778e-03,  7.35366624e-03],\n",
+       "                      [ 1.12166035e-03,  5.45477308e-03, -4.32490138e-03,\n",
+       "                        7.68110855e-03,  5.26575372e-04, -1.25714159e-02,\n",
+       "                       -3.77588673e-03, -1.14904623e-02,  5.39455842e-03,\n",
+       "                       -4.17162431e-03, -9.63759050e-03,  6.98206900e-03],\n",
+       "                      [ 1.96407139e-02,  1.29522821e-02, -4.13262704e-03,\n",
+       "                       -1.44496374e-02, -1.74691656e-03,  4.20865184e-03,\n",
+       "                       -1.11074317e-02,  2.64025060e-03,  1.47657096e-02,\n",
+       "                        1.23877609e-02, -2.37396988e-03, -2.93945603e-04],\n",
+       "                      [ 9.71211493e-03,  7.94302672e-03, -1.58977136e-02,\n",
+       "                       -2.76799593e-03, -5.05202217e-03, -9.76024102e-03,\n",
+       "                        1.49224671e-02, -2.76487437e-03, -7.95385893e-03,\n",
+       "                        2.28416151e-03,  8.62033758e-03, -8.03585071e-03],\n",
+       "                      [ 3.58456396e-03, -7.30898371e-03,  9.81163792e-03,\n",
+       "                        4.00693668e-03, -4.60821064e-03,  1.25033129e-02,\n",
+       "                       -7.10477680e-03, -1.87209854e-03, -1.86083149e-02,\n",
+       "                        1.13955196e-02,  3.02036270e-03,  1.86788588e-04],\n",
+       "                      [-7.39630545e-03, -3.24555533e-03, -6.80431770e-03,\n",
+       "                       -8.48817732e-03,  5.44536347e-03, -6.96611451e-03,\n",
+       "                        9.67375468e-03, -1.37550682e-02,  1.24195861e-02,\n",
+       "                       -5.80661930e-03, -8.72546516e-04, -7.87189323e-03],\n",
+       "                      [ 8.17328412e-03,  7.39035569e-03, -1.30875167e-02,\n",
+       "                        2.98461039e-03,  6.12607226e-03, -3.95844551e-03,\n",
+       "                       -4.27940721e-03, -5.09019941e-03,  9.36426129e-03,\n",
+       "                        2.17008332e-04,  9.72903217e-05,  1.09658763e-03],\n",
+       "                      [-2.05476675e-03, -6.83139719e-04, -1.89697009e-03,\n",
+       "                        1.14962943e-02,  7.20423460e-03,  1.39946323e-02,\n",
+       "                        1.07048582e-02, -6.42856723e-03, -5.79423131e-03,\n",
+       "                        1.23832189e-02, -7.18865078e-03,  1.38154672e-02],\n",
+       "                      [-1.16244173e-02,  2.05547106e-03,  9.67404339e-03,\n",
+       "                       -2.89262226e-03,  4.12624609e-03, -5.93587151e-03,\n",
+       "                       -2.06840690e-03, -3.01017077e-03, -2.76456797e-03,\n",
+       "                        1.60607956e-02,  6.62347884e-04,  8.47559713e-04],\n",
+       "                      [-1.70180527e-03,  1.20092779e-02,  1.39846858e-02,\n",
+       "                        1.87645629e-02,  3.60628217e-03, -1.03077693e-02,\n",
+       "                       -3.90187866e-04,  7.14913337e-03, -1.36780804e-02,\n",
+       "                        5.78043377e-03, -6.81782607e-03,  1.98236643e-03],\n",
+       "                      [-1.06942744e-05,  8.62054899e-03,  1.27580739e-03,\n",
+       "                        1.30051170e-02,  9.38100927e-03,  1.04769599e-02,\n",
+       "                       -1.51592251e-02,  4.45883907e-03, -2.48641265e-03,\n",
+       "                       -9.80575942e-03, -1.38305919e-03,  7.01086072e-04],\n",
+       "                      [-1.26606720e-02, -3.34550929e-03,  7.17817014e-03,\n",
+       "                       -5.29674813e-03, -5.15649887e-03,  1.82109885e-02,\n",
+       "                       -1.07203387e-02, -1.93532417e-03,  1.92708708e-02,\n",
+       "                       -2.18898524e-03, -1.15341763e-03,  5.27428696e-03]]],\n",
+       "                    dtype=float32)>\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "            (ff): TFXLNetFeedForward(\n",
+       "              (layer_norm): LayerNormalization(\n",
+       "                (axis): List(\n",
+       "                  (0): 2\n",
+       "                )\n",
+       "                (gamma): <tf.Variable 'transformer/layer_._0/ff/layer_norm/gamma:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([1.0379136 , 1.0441794 , 1.0282985 , 1.0300299 , 1.0497706 ,\n",
+       "                       1.0531958 , 1.0634363 , 1.0370939 , 0.97006977, 1.0404468 ,\n",
+       "                       1.0234414 , 1.0444169 , 1.016389  , 1.0636438 , 1.0183308 ,\n",
+       "                       1.0163523 , 1.0237935 , 1.0102572 , 1.017104  , 1.0147494 ,\n",
+       "                       0.99349844, 1.0893013 , 1.0604361 , 1.0118674 , 0.9946299 ,\n",
+       "                       1.0589231 , 0.96908444, 1.0519881 , 1.0418249 , 1.0343268 ,\n",
+       "                       1.0077153 , 1.0598058 , 1.0031377 , 1.0132179 , 1.0564682 ,\n",
+       "                       1.041158  , 1.0136855 , 1.0441773 , 1.0054435 , 1.0305686 ,\n",
+       "                       1.0372981 , 1.0551254 , 1.0419368 , 1.0237669 , 1.0648608 ,\n",
+       "                       0.9859887 , 1.0432713 , 0.992015  , 1.1081674 , 1.025258  ,\n",
+       "                       1.0640073 , 0.9919767 , 1.037432  , 1.045794  , 1.0330951 ,\n",
+       "                       1.0092527 , 1.0409127 , 1.0085353 , 1.0442319 , 0.99454325,\n",
+       "                       1.0313554 , 0.9998184 , 1.0338147 , 1.0133076 , 1.0005473 ,\n",
+       "                       1.0445073 , 0.9953769 , 1.0483619 , 1.0318505 , 1.0313379 ,\n",
+       "                       1.0211383 , 1.0175071 , 1.0427523 , 1.0183996 , 0.9728469 ,\n",
+       "                       1.0114137 , 1.0472678 , 1.0251293 , 0.9770746 , 0.9970426 ,\n",
+       "                       1.0212427 , 0.98568845, 1.0427203 , 1.0072767 , 1.0269111 ,\n",
+       "                       1.0186119 , 1.0205765 , 1.0080137 , 1.0402783 , 1.0055327 ,\n",
+       "                       1.0263197 , 1.011762  , 0.9943807 , 0.97362155, 1.0212238 ,\n",
+       "                       1.0551015 , 1.0413436 , 1.0225371 , 1.023914  , 1.0239075 ,\n",
+       "                       1.0248226 , 1.003032  , 1.0068135 , 1.0337843 , 1.0179108 ,\n",
+       "                       1.0402795 , 1.0472751 , 1.0388597 , 1.0047336 , 1.0077493 ,\n",
+       "                       1.0392822 , 1.0628049 , 1.0116792 , 1.0418272 , 1.0172741 ,\n",
+       "                       1.0869482 , 1.0238012 , 1.0404757 , 1.020196  , 1.0563034 ,\n",
+       "                       1.0301741 , 1.0372742 , 1.0494779 , 1.0387503 , 1.0062817 ,\n",
+       "                       1.036887  , 1.0277052 , 1.0019801 , 1.0326486 , 1.0132165 ,\n",
+       "                       1.0250734 , 1.0243207 , 1.0353926 , 1.0375448 , 1.0284371 ,\n",
+       "                       1.0279876 , 0.99319714, 1.0211086 , 1.0743738 , 1.0147293 ,\n",
+       "                       1.0403458 , 1.0320364 , 1.0163448 , 1.0086402 , 1.0668328 ,\n",
+       "                       0.9998712 , 1.0195384 , 1.0262363 , 1.0496252 , 1.0281852 ,\n",
+       "                       1.0143824 , 1.0131371 , 1.0147458 , 1.0153939 , 1.002428  ,\n",
+       "                       1.056508  , 1.0375637 , 1.0288135 , 1.0562717 , 1.0206257 ,\n",
+       "                       1.0170466 , 1.0470344 , 1.002945  , 1.0293034 , 1.0338373 ,\n",
+       "                       1.0267545 , 1.0173984 , 1.0321118 , 1.0058153 , 0.9890631 ,\n",
+       "                       1.0418366 , 1.0471084 , 1.000789  , 1.0489752 , 1.011835  ,\n",
+       "                       0.9849616 , 1.0682111 , 1.067782  , 1.0667943 , 1.0295328 ,\n",
+       "                       1.0648719 , 1.0072024 , 0.9829486 , 1.0619706 , 1.0037473 ,\n",
+       "                       1.082172  , 1.010111  , 1.0480627 , 1.0180742 , 0.9671146 ,\n",
+       "                       1.0334889 , 1.0734522 ], dtype=float32)>\n",
+       "                (beta): <tf.Variable 'transformer/layer_._0/ff/layer_norm/beta:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([-0.03437203,  0.05411717, -0.00093422,  0.07425429,  0.00736092,\n",
+       "                        0.11286709,  0.08217093,  0.10122769, -0.00846282,  0.07157344,\n",
+       "                       -0.05813284,  0.0454649 ,  0.02636049,  0.01231122, -0.01111093,\n",
+       "                        0.02166114, -0.00972567,  0.04515434, -0.02430212, -0.06187151,\n",
+       "                       -0.0381984 ,  0.12061298,  0.03548988,  0.04389787,  0.01137476,\n",
+       "                       -0.01380202, -0.01825755,  0.05156202, -0.07114236, -0.06216979,\n",
+       "                        0.05545609, -0.10842778, -0.02432374, -0.0060093 ,  0.03022136,\n",
+       "                       -0.00703949, -0.05032122,  0.03701846,  0.09063955,  0.0639187 ,\n",
+       "                       -0.06332532,  0.01021036, -0.01898221, -0.04602299,  0.0845482 ,\n",
+       "                        0.05272847,  0.04152165,  0.01572024,  0.0124438 ,  0.05633397,\n",
+       "                        0.04072688, -0.03248957,  0.01956263, -0.0594047 ,  0.10126687,\n",
+       "                        0.00997925, -0.03006562, -0.04982569, -0.01702003, -0.02220715,\n",
+       "                        0.0006759 , -0.00147267,  0.04309494, -0.02025459,  0.00237669,\n",
+       "                       -0.06119434,  0.06299283, -0.06787321, -0.04963538, -0.0285508 ,\n",
+       "                       -0.02115064, -0.10439228, -0.06280854, -0.02150689, -0.0087407 ,\n",
+       "                       -0.01133496, -0.05820064, -0.08399351, -0.00220406, -0.05374147,\n",
+       "                       -0.0084166 ,  0.02683506,  0.04995831, -0.04991116,  0.07378334,\n",
+       "                        0.08771855,  0.03559894,  0.04174837,  0.04986992, -0.07031458,\n",
+       "                       -0.04099566, -0.04586393, -0.04894676,  0.0452544 , -0.02901545,\n",
+       "                       -0.10887094, -0.06665391,  0.03176153, -0.07640473, -0.03704071,\n",
+       "                       -0.04572297,  0.04151303,  0.01618064,  0.05201699, -0.00598239,\n",
+       "                        0.00666859,  0.08898568,  0.04584971,  0.0312804 , -0.03132866,\n",
+       "                       -0.0066317 , -0.08492738, -0.01431052, -0.00116769,  0.02063407,\n",
+       "                        0.01227299,  0.0105425 ,  0.08164899, -0.07966555, -0.04573595,\n",
+       "                       -0.01493629, -0.06341923, -0.04441991,  0.0393707 , -0.07018486,\n",
+       "                        0.07571896,  0.01216909, -0.00044978, -0.03057809,  0.0612355 ,\n",
+       "                        0.00077983, -0.05563807, -0.10079593, -0.02951942,  0.08499622,\n",
+       "                        0.05386762, -0.06173644,  0.02608804,  0.03443969, -0.09064186,\n",
+       "                        0.0389196 , -0.07017983, -0.07173447, -0.03408198, -0.14056338,\n",
+       "                        0.01628569,  0.0268622 , -0.02475309, -0.01677444,  0.09604827,\n",
+       "                        0.02439231, -0.07903947, -0.01104342,  0.03859695,  0.00089456,\n",
+       "                       -0.00089233, -0.01680246,  0.04352787, -0.06731002, -0.02855014,\n",
+       "                        0.01585025,  0.08303126, -0.00780854,  0.01587816,  0.03930783,\n",
+       "                       -0.00718552, -0.04818885,  0.06294682,  0.02472097,  0.05720899,\n",
+       "                       -0.05400939, -0.12929952,  0.0696051 , -0.07063247,  0.02118118,\n",
+       "                        0.01647286, -0.05759468,  0.02665047, -0.00792585,  0.02348289,\n",
+       "                       -0.06724691,  0.04548252, -0.00882383,  0.02862583, -0.01595174,\n",
+       "                        0.01586641,  0.05275662, -0.05550243,  0.0463598 ,  0.02981136,\n",
+       "                       -0.02164674,  0.01641086], dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (layer_1): Dense(\n",
+       "                768, activation=linear, use_bias=True\n",
+       "                (kernel): <tf.Variable 'transformer/layer_._0/ff/layer_1/kernel:0' shape=(192, 768) dtype=float32, numpy=\n",
+       "                array([[-8.7349433e-03,  1.4380505e-02, -1.8403217e-02, ...,\n",
+       "                        -1.0560994e-02, -9.8247221e-03,  3.8896156e-03],\n",
+       "                       [ 1.9794539e-02,  1.9119913e-02,  1.4701257e-03, ...,\n",
+       "                        -4.6915929e-03, -3.0279700e-03, -1.0369797e-02],\n",
+       "                       [ 2.2685794e-02, -1.1076587e-02,  2.1512689e-02, ...,\n",
+       "                        -9.3838237e-03, -1.5814094e-02,  1.2654760e-02],\n",
+       "                       ...,\n",
+       "                       [ 3.3880837e-02,  3.2771707e-02, -1.5241621e-02, ...,\n",
+       "                        -1.8954782e-02,  9.0328557e-03, -3.8368767e-03],\n",
+       "                       [ 3.4973539e-02,  7.7871266e-03, -1.2202458e-03, ...,\n",
+       "                        -1.1511138e-03, -6.7377505e-03,  1.4305637e-02],\n",
+       "                       [-5.9016286e-03,  3.0963784e-05,  4.6348446e-03, ...,\n",
+       "                        -9.7331330e-03, -9.1186212e-03, -4.0696082e-03]], dtype=float32)>\n",
+       "                (bias): <tf.Variable 'transformer/layer_._0/ff/layer_1/bias:0' shape=(768,) dtype=float32, numpy=\n",
+       "                array([-2.48988252e-03,  6.58203196e-03,  2.64750496e-02, -9.87772923e-03,\n",
+       "                        2.49165483e-02, -1.96873536e-03,  1.37765594e-02,  7.72468513e-03,\n",
+       "                       -1.52863916e-02, -3.80107411e-03, -1.07600829e-02,  3.38745862e-03,\n",
+       "                        1.53273325e-02, -1.19882887e-02,  5.40436618e-03,  2.19404721e-03,\n",
+       "                        2.60363892e-03,  4.26220242e-03,  2.08184868e-02,  1.22082443e-03,\n",
+       "                        1.71658359e-02,  1.61883030e-02, -1.14635089e-02,  5.40121691e-03,\n",
+       "                        5.44373458e-03,  1.77889038e-02, -5.69844851e-03,  3.11289355e-03,\n",
+       "                        1.31086144e-03, -2.80178571e-03, -3.88765195e-03, -7.58470781e-03,\n",
+       "                        1.36907427e-02,  6.45675417e-03,  2.65116412e-02,  1.58387870e-02,\n",
+       "                        1.02622213e-03,  8.93147197e-03,  2.47938349e-03, -1.99125968e-02,\n",
+       "                        2.70253327e-03, -8.58191773e-03,  1.80017427e-02,  7.24463165e-03,\n",
+       "                        9.56831127e-03,  2.74193045e-02,  1.74996982e-04, -7.05160759e-03,\n",
+       "                        2.38953568e-02,  6.30728249e-03,  2.40837168e-02,  2.80947471e-03,\n",
+       "                       -3.53719312e-04,  9.57346521e-03,  8.25208705e-03, -7.29673402e-03,\n",
+       "                       -1.38636009e-04,  4.73524723e-03,  1.45125119e-02, -1.18843932e-02,\n",
+       "                        2.11451408e-02,  2.68677399e-02,  6.18341239e-03, -6.16480596e-03,\n",
+       "                        8.34112335e-03,  4.47013066e-04, -3.05860024e-03, -9.32345074e-03,\n",
+       "                       -2.02798527e-02,  4.69490094e-03, -1.61361136e-02,  4.10681684e-03,\n",
+       "                        1.28482804e-02,  4.03247820e-03,  9.11187287e-03,  1.24189295e-02,\n",
+       "                        1.27137732e-02,  1.99195351e-02,  1.41281942e-02,  1.55547783e-02,\n",
+       "                       -1.07247783e-02,  7.05646677e-03, -1.81599881e-03,  9.94427502e-03,\n",
+       "                       -1.99749079e-02,  1.62800290e-02, -2.43168436e-02, -5.13213966e-03,\n",
+       "                        2.00566128e-02,  2.97278585e-03, -7.79949501e-03,  5.56347473e-03,\n",
+       "                        7.97226559e-03,  1.98900197e-02,  1.38633540e-02, -6.45546895e-03,\n",
+       "                        1.38269775e-02, -4.40548221e-03,  8.96899216e-03, -9.38130263e-03,\n",
+       "                       -5.15380700e-04, -2.41116602e-02,  1.52957542e-02,  1.24769453e-02,\n",
+       "                        6.28790632e-03,  5.41381445e-03,  8.18936341e-03,  1.51892807e-02,\n",
+       "                        1.11203482e-02, -4.50899825e-03, -1.44061493e-02, -2.26674285e-02,\n",
+       "                        3.10106426e-02,  2.14485563e-02,  1.03145291e-03,  1.03755528e-03,\n",
+       "                       -6.20614132e-03, -1.09666409e-02,  8.96500424e-03,  4.80830902e-03,\n",
+       "                       -7.33030727e-03,  6.25240244e-03, -9.21320729e-03,  6.77359942e-03,\n",
+       "                       -5.92142157e-03,  7.07151927e-03, -1.22634443e-02,  7.56111601e-03,\n",
+       "                        1.75033621e-02,  3.66673758e-03, -1.09480824e-02, -2.01308820e-03,\n",
+       "                       -5.92470681e-03,  2.63545513e-02,  1.99394524e-02, -4.43834206e-03,\n",
+       "                       -1.58517994e-02,  8.09705444e-03,  2.51221992e-02,  4.07058606e-03,\n",
+       "                        6.50535512e-04,  1.90216992e-02,  3.51213152e-03,  2.78372392e-02,\n",
+       "                        7.65756797e-03, -1.04906233e-02,  3.58949192e-02,  3.21657956e-02,\n",
+       "                        2.03288458e-02,  1.17718976e-03, -9.83388349e-03,  1.01774065e-02,\n",
+       "                        2.34259386e-02,  4.87414235e-03,  6.19397615e-04, -4.87850979e-03,\n",
+       "                        6.10528141e-03,  1.96777973e-02, -4.79804678e-03,  3.20185535e-03,\n",
+       "                        1.08724358e-02,  2.48679845e-03,  1.04768435e-02,  1.50508005e-02,\n",
+       "                       -2.04404313e-02,  8.93356372e-03,  3.47434171e-03,  5.11971477e-04,\n",
+       "                        1.05784240e-03,  1.37281520e-02, -1.45734590e-03,  2.07192767e-02,\n",
+       "                        4.55050357e-03,  1.93968341e-02, -6.62009744e-03, -1.97455566e-02,\n",
+       "                       -9.91699193e-03,  9.87284351e-03, -1.31387112e-03,  7.16593955e-03,\n",
+       "                        5.01987198e-03, -3.20331450e-03,  7.43561145e-03, -4.62228339e-03,\n",
+       "                        2.19815858e-02, -7.85590988e-03, -7.33769266e-03,  3.23284529e-02,\n",
+       "                        1.56302769e-02, -6.01055566e-03, -1.79425776e-02,  4.41427436e-03,\n",
+       "                       -2.07814388e-02, -6.37243548e-03, -2.83799577e-03,  5.25688939e-03,\n",
+       "                       -8.77550617e-03,  2.46067587e-02,  1.07153840e-02, -1.32179158e-02,\n",
+       "                        2.18793386e-04,  4.08930471e-03,  8.53821915e-03, -1.09368330e-02,\n",
+       "                        3.37619870e-03, -1.35646742e-02,  7.72237452e-03,  1.29408129e-02,\n",
+       "                       -1.53529420e-02, -9.28624719e-03, -1.21006239e-02,  1.54590970e-02,\n",
+       "                        2.16401205e-03,  1.04791895e-02,  5.56073198e-03,  1.37728415e-02,\n",
+       "                        1.07720145e-04,  5.28109539e-03,  1.08795706e-02, -2.47379648e-04,\n",
+       "                        3.11144930e-03, -5.73526463e-03, -5.40194986e-03,  3.43680102e-03,\n",
+       "                        6.36896258e-03,  7.28031015e-03, -7.98167568e-03,  1.46586786e-03,\n",
+       "                       -4.85271215e-03, -4.15298855e-03, -6.27090875e-03,  1.09038770e-03,\n",
+       "                        8.43349565e-03,  2.42243428e-02,  9.21734143e-03,  5.99709572e-03,\n",
+       "                        2.16714274e-02,  4.89401957e-03,  6.89816754e-03,  2.22890708e-03,\n",
+       "                        1.38756193e-04, -7.83765409e-03, -2.66516721e-03,  1.58686489e-02,\n",
+       "                        2.09250636e-02,  3.43082286e-03,  1.25900293e-02,  1.66601446e-02,\n",
+       "                        9.77085717e-03, -1.23784819e-03,  1.31846191e-02, -3.35601717e-03,\n",
+       "                        4.42687795e-03,  2.11218297e-02, -5.38641028e-03,  8.89543328e-04,\n",
+       "                        2.86574606e-02,  1.23174144e-02, -1.08364336e-02,  3.73017695e-03,\n",
+       "                       -2.47203764e-02, -4.73329565e-03,  1.31655764e-02, -6.27630530e-03,\n",
+       "                       -7.01956218e-03, -8.57002940e-03, -8.32860358e-03,  1.99239105e-02,\n",
+       "                       -4.52243630e-03,  2.18442213e-02,  2.81916582e-03,  1.94954555e-02,\n",
+       "                        1.47216879e-02,  1.14483749e-02,  9.50219017e-03,  1.93981547e-02,\n",
+       "                        1.98315759e-03,  1.17658265e-03,  8.65733624e-03, -3.82895139e-03,\n",
+       "                       -1.39406975e-02, -2.18565037e-04, -1.54521847e-02,  2.31004003e-02,\n",
+       "                       -1.43806655e-02,  1.07183242e-02, -4.23687370e-03, -8.43816437e-03,\n",
+       "                        9.99713037e-03,  1.01488354e-02,  4.36592521e-03,  4.06254223e-03,\n",
+       "                       -2.29024841e-03,  7.33671652e-04, -3.99773149e-03, -5.26233064e-03,\n",
+       "                       -5.51322009e-04,  1.99180748e-03,  2.11210479e-03, -1.47964270e-03,\n",
+       "                        1.85694620e-02, -7.09511619e-03,  1.37091307e-02,  1.77404413e-03,\n",
+       "                        3.04236803e-02,  1.63651221e-02,  1.01921558e-02,  2.87520438e-02,\n",
+       "                       -1.26408609e-02,  2.02455334e-02, -2.59257131e-03,  1.92524418e-02,\n",
+       "                       -1.05007098e-03,  8.00876645e-04, -1.07963514e-02, -1.00983009e-02,\n",
+       "                        3.39633483e-03, -5.70922857e-03,  2.50644069e-02,  1.06100654e-02,\n",
+       "                        7.89651275e-03,  9.92713869e-03, -4.23942460e-03,  8.36806651e-03,\n",
+       "                        1.46544278e-02,  9.03321337e-03, -1.24921696e-02, -4.23613749e-03,\n",
+       "                        8.12342390e-03,  2.61031408e-02,  8.26149434e-03,  1.93422493e-02,\n",
+       "                        1.59315765e-02,  4.34346450e-03, -1.92503165e-02,  7.93095399e-03,\n",
+       "                       -1.98308267e-02,  2.23907847e-02,  6.30652346e-03, -1.34924352e-02,\n",
+       "                       -7.86772370e-03,  2.03298517e-02,  1.62668228e-02,  8.84508621e-03,\n",
+       "                        1.78096499e-02,  1.08726043e-02,  9.57162119e-03,  1.47212772e-02,\n",
+       "                        2.21935660e-02, -1.45868107e-03, -8.12897284e-04, -7.34515116e-03,\n",
+       "                        8.64875689e-03,  7.40144961e-03,  6.41043903e-03,  4.63293120e-03,\n",
+       "                        4.28604428e-03,  2.04059836e-02, -8.72917753e-03,  9.75611620e-03,\n",
+       "                        1.00321267e-02,  1.31200878e-02,  2.10976950e-03,  5.71965007e-04,\n",
+       "                        1.03311744e-02, -1.68516766e-03, -1.79438982e-02, -1.74083021e-02,\n",
+       "                       -4.92391782e-03, -1.39317811e-02,  1.48546761e-02, -1.66444052e-02,\n",
+       "                       -3.73365986e-03, -1.36026256e-02,  8.19035619e-03,  4.33718460e-03,\n",
+       "                        4.58232686e-03,  7.53803365e-03,  7.45450845e-03,  7.19609112e-03,\n",
+       "                        1.62290093e-02,  1.26000466e-02, -1.52490484e-02, -2.25856341e-03,\n",
+       "                        2.89014243e-02,  9.44819208e-03,  2.67197583e-02,  6.94153551e-03,\n",
+       "                        1.24824699e-02,  1.95698701e-02, -1.01897297e-02, -1.00039514e-02,\n",
+       "                       -1.04320236e-02, -5.10433037e-03, -8.07258673e-03,  2.40934156e-02,\n",
+       "                       -1.08093852e-02,  3.51674552e-03,  1.24634281e-02,  1.61194839e-02,\n",
+       "                       -4.07268107e-03, -1.28737884e-03, -9.59544443e-04, -1.11112036e-02,\n",
+       "                        1.40558928e-03,  4.56377538e-03,  1.02128573e-02, -6.15438679e-03,\n",
+       "                       -1.33012095e-03,  1.53693510e-02,  1.19307695e-03, -3.19028762e-03,\n",
+       "                        9.25229862e-03,  9.54286443e-05,  3.19778686e-03,  3.43006453e-03,\n",
+       "                        6.68310421e-03, -2.00596638e-03,  2.85807136e-03,  1.19629130e-02,\n",
+       "                       -1.41574815e-02,  1.94316776e-03,  1.87879975e-03,  7.44125294e-03,\n",
+       "                        1.26068098e-02, -1.95779037e-02, -6.75179390e-03,  1.15828542e-02,\n",
+       "                        6.07337616e-03,  4.42268746e-03,  4.94396780e-03,  1.21988477e-02,\n",
+       "                        1.14446990e-02,  1.16123529e-02, -1.07849846e-02,  2.87843146e-03,\n",
+       "                       -1.42739005e-02, -4.04459005e-03, -9.62248445e-03, -5.20158932e-03,\n",
+       "                        6.75694225e-03, -4.65211784e-03,  8.97594448e-03,  1.08250836e-02,\n",
+       "                       -9.49004479e-03,  8.20130017e-03,  8.76851380e-03,  7.95888528e-03,\n",
+       "                        1.37145184e-02,  1.75602008e-02, -8.12873431e-03,  4.97413147e-03,\n",
+       "                       -9.14748292e-03,  1.12449210e-02,  1.59501564e-02,  2.49886438e-02,\n",
+       "                        4.06043883e-03, -6.10539550e-03,  7.11079978e-04,  3.61572509e-03,\n",
+       "                       -7.32730026e-04,  3.84381087e-03,  1.06619615e-02,  2.37780120e-02,\n",
+       "                        1.45025449e-02,  4.25680401e-03, -4.45264997e-03,  1.09784387e-03,\n",
+       "                        2.25181933e-02,  2.84491549e-03,  6.20998326e-04,  2.56988090e-02,\n",
+       "                        1.40275266e-02,  7.56263779e-03, -7.95345195e-03,  2.59988755e-02,\n",
+       "                        1.14943031e-02, -3.48383840e-03,  1.20270695e-03, -6.31895149e-03,\n",
+       "                        6.45010313e-03, -6.69839000e-03,  2.74554864e-02,  1.23840626e-02,\n",
+       "                       -7.85988197e-03,  7.35028647e-03,  1.56578515e-02,  2.94154929e-03,\n",
+       "                        3.62430466e-03, -5.50300488e-03, -4.76662040e-04,  1.59057863e-02,\n",
+       "                       -4.85554570e-03, -1.82895325e-02, -2.30622664e-03, -9.59027000e-03,\n",
+       "                        2.40675379e-02,  5.72432298e-03,  8.61885119e-03,  1.81669146e-02,\n",
+       "                       -7.79482257e-03,  8.06681905e-03,  7.92973395e-03,  8.86156689e-03,\n",
+       "                        1.07650831e-02,  1.68679189e-02,  1.77217312e-02,  1.61346719e-02,\n",
+       "                        2.15555485e-02, -4.34635347e-03, -1.01557719e-02, -7.55260175e-04,\n",
+       "                       -1.61906844e-03, -6.42401120e-03, -5.87663008e-03,  8.43080506e-03,\n",
+       "                        1.68590657e-02,  2.30838265e-02, -9.95164085e-03, -3.70766473e-04,\n",
+       "                        4.54875827e-03,  1.40316486e-02,  6.50463440e-03, -9.05440375e-03,\n",
+       "                        1.86522224e-03,  3.77172534e-03, -1.21039599e-02,  6.24031387e-03,\n",
+       "                        6.86559547e-03,  3.87154031e-03,  7.53928721e-03, -3.78697389e-03,\n",
+       "                        8.47220607e-03,  5.19724749e-03, -1.68645848e-02, -6.83352305e-03,\n",
+       "                        6.16311003e-03,  2.06075478e-02, -3.36128706e-03, -4.54347255e-03,\n",
+       "                       -4.43226658e-03,  9.47801396e-03,  1.34469452e-03, -2.78269453e-03,\n",
+       "                        1.07496325e-03,  5.72886225e-03, -4.58427705e-03,  4.34674323e-03,\n",
+       "                        1.00894533e-02,  6.01954013e-03,  1.18409786e-02,  1.02127623e-02,\n",
+       "                       -3.16850585e-03, -1.01286909e-02,  2.17334591e-02,  1.12441396e-02,\n",
+       "                       -4.21741139e-03,  5.98146534e-03,  1.92161649e-02, -9.98497382e-03,\n",
+       "                        1.02236588e-02,  3.91611643e-03,  1.38576785e-02, -4.98477183e-03,\n",
+       "                        2.07855050e-02,  1.55463815e-02,  1.42694395e-02,  1.70583408e-02,\n",
+       "                       -2.10462380e-02,  7.90667254e-03,  1.00777100e-03,  2.03150448e-05,\n",
+       "                       -9.65817273e-03,  1.48673952e-02, -4.30348329e-03,  1.13944628e-03,\n",
+       "                        2.93337228e-03, -8.70792102e-03, -1.75675575e-03,  8.86655040e-03,\n",
+       "                        1.60456393e-02,  1.19324429e-02,  9.20977350e-03,  1.57949142e-02,\n",
+       "                        3.98718752e-03,  5.14104264e-03, -2.80088722e-03,  2.14166343e-02,\n",
+       "                       -1.71560235e-02, -8.84766877e-03, -9.08766873e-03,  4.13088640e-03,\n",
+       "                        7.41530722e-03, -7.14520458e-03,  1.43901035e-02,  1.57008432e-02,\n",
+       "                        3.48176365e-03,  1.34258689e-02, -7.77519168e-03,  2.52181496e-02,\n",
+       "                        1.94994695e-02, -1.00142611e-02,  4.24301857e-03,  4.00523946e-04,\n",
+       "                        1.96565893e-02,  1.52775235e-02,  1.19475620e-02,  3.16524319e-03,\n",
+       "                        1.98126957e-02,  1.54079534e-02,  2.37543555e-03,  9.40866210e-03,\n",
+       "                        4.05140314e-03,  7.91203696e-04,  1.09335911e-02,  1.97298676e-02,\n",
+       "                       -1.93075929e-02,  1.94303587e-03,  3.35570797e-02, -2.26485580e-02,\n",
+       "                        1.55655332e-02,  7.09330058e-03,  4.23489313e-04,  9.61118191e-03,\n",
+       "                        1.63517352e-02,  1.42600127e-02, -5.09561691e-03, -3.46544152e-03,\n",
+       "                       -7.05293380e-03,  5.47119463e-03, -1.19369272e-02,  3.55220283e-03,\n",
+       "                       -6.47027092e-03, -4.66864277e-03, -1.12860324e-03,  1.57437511e-02,\n",
+       "                        8.27108324e-03,  2.43137102e-03, -1.15485163e-02, -1.33490609e-02,\n",
+       "                        1.06290532e-02,  1.28479563e-02, -1.36187626e-03,  1.18819866e-02,\n",
+       "                        1.30752167e-02, -8.14791210e-03,  1.79868210e-02, -1.14236902e-02,\n",
+       "                       -1.29655702e-02,  2.08648783e-03, -7.74235511e-03,  1.28833978e-02,\n",
+       "                        6.50411658e-03,  7.50467088e-03, -1.07559422e-02,  1.75879411e-02,\n",
+       "                       -8.50211736e-03, -1.01776710e-02,  2.42663119e-02,  1.62711286e-03,\n",
+       "                        6.88572740e-03,  5.71457949e-03,  6.17601851e-04, -1.78704094e-02,\n",
+       "                       -1.71567197e-04, -8.67385324e-03,  1.68735757e-02,  3.69164161e-03,\n",
+       "                       -1.05630793e-02,  6.74468745e-03,  1.98948095e-04,  7.28386408e-03,\n",
+       "                       -2.24167085e-03,  7.09309569e-03,  2.85558943e-02,  1.32500548e-02,\n",
+       "                        1.69137903e-02, -2.37387780e-04, -2.18597203e-02, -4.46859561e-03,\n",
+       "                        1.04082571e-02,  4.03283583e-03,  9.06235911e-03,  2.31208205e-02,\n",
+       "                        1.02282958e-02,  7.54507864e-03, -2.02157628e-03,  1.72267552e-03,\n",
+       "                        7.76690198e-04, -2.34109838e-03,  2.48324894e-03, -1.77459500e-03,\n",
+       "                        1.74034499e-02,  1.18780583e-02,  2.42147446e-02,  4.53634560e-03,\n",
+       "                       -7.13373011e-04,  6.53022528e-03,  1.31792929e-02,  3.03253159e-03,\n",
+       "                       -1.16036963e-02,  1.38841802e-02, -9.61985672e-04,  1.56072509e-02,\n",
+       "                        1.83839221e-02, -1.26425391e-02, -8.58081039e-03,  1.77578256e-02,\n",
+       "                       -1.57705601e-02,  6.07309677e-03,  1.58127826e-02, -4.43605706e-03,\n",
+       "                        3.01327799e-02,  1.62303597e-02,  1.62664112e-02,  9.25481878e-03,\n",
+       "                       -2.17470736e-03, -2.18344177e-03,  1.02113271e-02,  2.36091372e-02,\n",
+       "                        1.14256535e-02, -1.63149880e-03, -1.76011212e-02,  7.09930295e-03,\n",
+       "                        7.96853937e-03,  1.75659396e-02, -3.90994363e-03, -1.06832599e-02,\n",
+       "                       -8.94176587e-03, -1.21121760e-02,  5.23515511e-03, -1.00380024e-02,\n",
+       "                       -9.87766962e-03,  2.45441310e-02,  3.19681270e-03,  1.41334981e-02,\n",
+       "                        2.02579927e-02,  2.55680783e-03,  8.56060628e-03, -2.40424345e-03,\n",
+       "                       -1.69302542e-02, -4.54237964e-03, -1.20616211e-02,  1.82611158e-03,\n",
+       "                        2.76846206e-03,  1.38199525e-02, -1.33961961e-02,  7.89576955e-03,\n",
+       "                        1.97190102e-02,  7.84316193e-03,  1.24047138e-02, -1.47519272e-03,\n",
+       "                       -9.65619646e-03,  8.34757928e-03, -2.17827642e-03, -3.88957502e-04,\n",
+       "                        1.64355468e-02,  2.64623687e-02, -9.89953335e-03,  1.12777716e-02,\n",
+       "                       -2.95404904e-03,  8.74106493e-03,  1.55162811e-03, -3.00494349e-03,\n",
+       "                        2.69142073e-03,  2.39436403e-02, -9.84442607e-03,  1.80167556e-02],\n",
+       "                      dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (layer_2): Dense(\n",
+       "                192, activation=linear, use_bias=True\n",
+       "                (kernel): <tf.Variable 'transformer/layer_._0/ff/layer_2/kernel:0' shape=(768, 192) dtype=float32, numpy=\n",
+       "                array([[ 0.03105873,  0.02197045,  0.01535711, ..., -0.02207142,\n",
+       "                        -0.00204962,  0.01233771],\n",
+       "                       [-0.00683493, -0.01493787,  0.00323838, ..., -0.00578931,\n",
+       "                         0.01483128,  0.02967459],\n",
+       "                       [-0.02099711,  0.00616769, -0.00663288, ...,  0.02499438,\n",
+       "                         0.01299867, -0.00927783],\n",
+       "                       ...,\n",
+       "                       [-0.01390732,  0.01844309, -0.01650524, ...,  0.00378714,\n",
+       "                         0.00615161,  0.00803701],\n",
+       "                       [ 0.00750632, -0.00458682, -0.01339437, ..., -0.00503869,\n",
+       "                        -0.00725265, -0.00729213],\n",
+       "                       [-0.00832169,  0.01612099, -0.02206275, ..., -0.03785598,\n",
+       "                        -0.01250057, -0.02561413]], dtype=float32)>\n",
+       "                (bias): <tf.Variable 'transformer/layer_._0/ff/layer_2/bias:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([-1.18231699e-02,  1.03601832e-02, -8.29804223e-03,  1.99701991e-02,\n",
+       "                        1.76643080e-04,  4.44231071e-02,  2.99130473e-02,  3.19546983e-02,\n",
+       "                       -1.12999994e-02,  3.43591869e-02, -1.61521472e-02,  1.36177503e-02,\n",
+       "                        1.15128085e-02, -1.09507621e-03, -3.37390555e-03,  6.89360220e-03,\n",
+       "                       -4.13123937e-03,  1.62499081e-02, -8.00683629e-04, -2.11246312e-02,\n",
+       "                       -1.37601141e-02,  3.46819125e-02,  9.78396088e-03, -4.11889283e-03,\n",
+       "                        5.74809080e-03,  1.44397409e-03,  3.15773301e-03,  7.75392726e-03,\n",
+       "                       -1.11424308e-02, -1.06719630e-02,  1.12653803e-02, -1.79730225e-02,\n",
+       "                        8.06322228e-03, -2.28440948e-03,  2.09859367e-02, -1.07666533e-02,\n",
+       "                       -1.69093590e-02,  1.28620099e-02,  3.85885276e-02,  2.59677637e-02,\n",
+       "                       -2.09366418e-02,  1.07704918e-03, -4.80084028e-03, -1.99089963e-02,\n",
+       "                        2.55218279e-02,  1.77786537e-02,  7.77578400e-03,  1.14584505e-03,\n",
+       "                       -1.43661699e-03,  1.05165811e-02,  4.13904246e-03, -1.51320302e-03,\n",
+       "                        7.36002252e-03, -2.05752421e-02,  5.02680764e-02,  5.19761303e-03,\n",
+       "                       -3.12606804e-04, -1.33357486e-02,  1.02019459e-02, -2.60877237e-03,\n",
+       "                        7.74074951e-03, -5.22067491e-03,  1.11552700e-02, -5.16852923e-03,\n",
+       "                        8.53748340e-03, -6.34515099e-03,  2.92164087e-02, -1.34276906e-02,\n",
+       "                       -2.07019337e-02, -6.97588595e-03, -9.50461428e-04, -5.22856563e-02,\n",
+       "                       -4.60096495e-03, -1.05865430e-02, -7.99557834e-04,  1.64804514e-03,\n",
+       "                       -1.11557161e-02, -2.90366467e-02,  1.41196838e-02, -9.79548972e-03,\n",
+       "                       -4.00953926e-03,  1.12849819e-02,  2.55571981e-03, -1.16084691e-03,\n",
+       "                        2.75370330e-02,  3.10603790e-02,  5.13396645e-03,  9.99009516e-03,\n",
+       "                        1.81308165e-02, -1.73914377e-02, -6.52272627e-03, -4.53224359e-03,\n",
+       "                       -1.50986025e-02,  1.44944564e-02, -1.71106905e-02, -3.57185379e-02,\n",
+       "                       -1.84081197e-02,  6.25483785e-03, -3.86861190e-02, -1.24735022e-02,\n",
+       "                       -3.20191239e-03, -5.15542505e-03, -2.35393108e-03,  1.86459981e-02,\n",
+       "                       -7.51753850e-03, -4.82365210e-03,  3.32103260e-02,  7.17555871e-03,\n",
+       "                        7.25519285e-03, -9.94957238e-03,  1.35318565e-04, -2.35690605e-02,\n",
+       "                       -3.16280313e-03, -1.14406820e-03,  2.74472986e-03,  6.59645908e-03,\n",
+       "                       -1.41589751e-03,  4.13854569e-02, -1.44355716e-02, -6.92052348e-03,\n",
+       "                        5.55959530e-03, -3.30252536e-02, -1.38800498e-02,  8.02037679e-03,\n",
+       "                       -2.93474011e-02,  3.47584710e-02,  9.14734043e-03, -9.73121449e-03,\n",
+       "                       -1.23930294e-02,  2.06993651e-02, -3.12827341e-03, -2.32891343e-03,\n",
+       "                       -3.46817225e-02,  6.07703906e-03,  2.06695050e-02,  1.19140390e-02,\n",
+       "                       -3.75964679e-02,  7.35174678e-03, -4.06955648e-03, -4.85159121e-02,\n",
+       "                        6.43890491e-03, -2.10845768e-02, -2.46330500e-02, -1.20099075e-03,\n",
+       "                       -4.61101271e-02,  5.49700065e-03,  4.75712121e-03, -3.62440175e-03,\n",
+       "                        1.52475038e-03,  4.00585197e-02,  1.48058282e-02, -2.08347831e-02,\n",
+       "                       -7.71040935e-03,  3.24013340e-03, -4.08119755e-04,  1.07808020e-02,\n",
+       "                       -8.54405575e-03,  1.08643081e-02, -2.49987431e-02, -9.56417341e-03,\n",
+       "                        7.06814753e-05,  1.61526855e-02,  8.29778844e-04,  5.27869863e-03,\n",
+       "                        1.83209090e-03,  5.17274626e-03, -9.73243825e-03,  1.77772976e-02,\n",
+       "                        9.07951314e-03,  2.06841063e-02, -1.68221779e-02, -3.72066498e-02,\n",
+       "                        2.13726964e-02, -2.43793298e-02,  7.82521069e-03,  1.40628982e-02,\n",
+       "                       -1.62246283e-02,  1.40211182e-02, -2.62036663e-03,  6.93138875e-03,\n",
+       "                       -1.47657488e-02,  2.04760805e-02,  2.87828641e-03,  1.40901785e-02,\n",
+       "                        5.04952762e-03,  1.17212813e-02,  2.30959542e-02, -1.17893247e-02,\n",
+       "                        1.45166460e-02,  3.32305534e-03, -7.83565454e-03, -7.87868979e-04],\n",
+       "                      dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (dropout): Dropout(\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "            (dropout): Dropout(\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "            (_feature_shapes): Dict()\n",
+       "            (_feature_dtypes): Dict()\n",
+       "          )\n",
+       "          (1): TFXLNetLayer(\n",
+       "            (rel_attn): TFXLNetRelativeAttention(\n",
+       "              (layer_norm): LayerNormalization(\n",
+       "                (axis): List(\n",
+       "                  (0): 2\n",
+       "                )\n",
+       "                (gamma): <tf.Variable 'transformer/layer_._1/rel_attn/layer_norm/gamma:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([1.0261322 , 1.0269046 , 0.9773781 , 1.0247962 , 1.0097598 ,\n",
+       "                       1.0459249 , 1.0389155 , 1.0094162 , 0.9840094 , 1.0255837 ,\n",
+       "                       1.0145838 , 1.029601  , 0.9919759 , 1.0503366 , 1.000113  ,\n",
+       "                       0.98745275, 0.9951172 , 0.98850536, 1.0047354 , 1.0157787 ,\n",
+       "                       1.0056013 , 1.0997953 , 1.0325745 , 1.0181527 , 0.9886395 ,\n",
+       "                       1.0032426 , 0.9645967 , 1.0369183 , 1.0305737 , 1.022639  ,\n",
+       "                       0.98697466, 1.0407704 , 1.0208054 , 1.0117294 , 1.0012168 ,\n",
+       "                       1.0317819 , 1.0090001 , 1.0274644 , 1.0130668 , 0.99157923,\n",
+       "                       1.032259  , 1.0095482 , 1.0317316 , 1.0250219 , 1.0415062 ,\n",
+       "                       0.99819475, 1.0200968 , 1.0049968 , 1.0128824 , 1.0352737 ,\n",
+       "                       1.0368786 , 0.96232355, 1.0403799 , 1.0008532 , 1.0264657 ,\n",
+       "                       0.9998839 , 0.97538733, 0.991134  , 1.0391068 , 0.9888234 ,\n",
+       "                       1.0180827 , 0.9775322 , 1.0192289 , 1.0150893 , 1.000222  ,\n",
+       "                       1.0049831 , 0.9870896 , 1.0674498 , 1.0196699 , 1.0082041 ,\n",
+       "                       1.0324329 , 0.99676013, 1.0091047 , 1.0248021 , 1.0044961 ,\n",
+       "                       1.0053085 , 1.0009363 , 0.9970736 , 0.94617426, 1.0338936 ,\n",
+       "                       1.0148971 , 0.96663743, 1.0128137 , 1.0034641 , 1.0319886 ,\n",
+       "                       1.0064343 , 1.0028603 , 1.002649  , 1.0243838 , 1.0064948 ,\n",
+       "                       1.0377748 , 0.9891696 , 0.9866293 , 0.99707025, 0.99078393,\n",
+       "                       1.0176572 , 1.0241402 , 1.0049547 , 1.000801  , 1.034779  ,\n",
+       "                       1.0198549 , 0.9966189 , 0.9957258 , 1.0326344 , 0.99225044,\n",
+       "                       1.0071577 , 1.0114198 , 1.0367244 , 1.0063225 , 0.9908461 ,\n",
+       "                       1.0214857 , 1.0045844 , 0.97997284, 0.98385096, 1.0132415 ,\n",
+       "                       1.0294743 , 1.0063779 , 1.0424733 , 1.0020639 , 1.0190448 ,\n",
+       "                       0.9811757 , 1.0200567 , 1.0410883 , 1.0080585 , 1.0111438 ,\n",
+       "                       1.0438564 , 1.0073017 , 1.0119686 , 1.0274266 , 1.0132748 ,\n",
+       "                       0.9857355 , 0.98808295, 1.0102935 , 1.0228415 , 0.99962467,\n",
+       "                       1.0004269 , 0.99588555, 1.0006347 , 1.0041206 , 0.990004  ,\n",
+       "                       0.9891518 , 1.0437917 , 1.0374291 , 0.99602705, 1.0428259 ,\n",
+       "                       0.97428006, 1.0055739 , 1.0196538 , 1.0008999 , 1.0310303 ,\n",
+       "                       1.002109  , 0.9910634 , 0.9972151 , 1.0127355 , 0.98564386,\n",
+       "                       1.0203615 , 1.0232209 , 1.0296504 , 0.9873712 , 1.0131739 ,\n",
+       "                       0.9984371 , 1.0343952 , 0.9563564 , 1.0268995 , 1.0328572 ,\n",
+       "                       1.002335  , 0.98883   , 1.0180264 , 0.9681929 , 0.9756003 ,\n",
+       "                       1.070814  , 1.0193576 , 0.98169804, 1.0006468 , 1.0085332 ,\n",
+       "                       0.9559967 , 1.0291041 , 1.0083201 , 1.0401794 , 0.99601644,\n",
+       "                       1.0606512 , 1.0057952 , 0.98249924, 1.0013803 , 0.9975868 ,\n",
+       "                       1.0436803 , 0.9974033 , 1.0232234 , 1.0014886 , 0.95568186,\n",
+       "                       1.0128983 , 1.0420789 ], dtype=float32)>\n",
+       "                (beta): <tf.Variable 'transformer/layer_._1/rel_attn/layer_norm/beta:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([ 2.52928934e-03,  2.75707990e-02, -7.46368477e-03,  2.60973740e-02,\n",
+       "                       -2.99260370e-03,  2.73417979e-02,  4.90686111e-02,  1.38162207e-02,\n",
+       "                        8.11486784e-03,  1.70336086e-02,  3.51925148e-03, -7.69003760e-03,\n",
+       "                        2.59532798e-02, -1.75180901e-02, -1.08880019e-02,  1.38446065e-02,\n",
+       "                       -2.13629357e-03,  8.55799112e-03,  8.28036014e-03,  2.36780709e-03,\n",
+       "                       -1.72654982e-05,  9.31350291e-02,  2.88223773e-02,  3.16347592e-02,\n",
+       "                       -1.64339896e-02,  2.52713393e-02, -8.71144608e-03,  4.91184108e-02,\n",
+       "                       -2.37441119e-02, -1.38560440e-02,  6.72000367e-03, -8.39894861e-02,\n",
+       "                       -1.03174821e-02, -1.49761168e-02, -1.07429633e-02,  6.57213945e-03,\n",
+       "                        2.32967455e-03,  6.64166058e-04,  1.59889422e-02, -3.34091089e-03,\n",
+       "                        3.97001253e-03,  3.76692340e-02, -3.19892950e-02,  1.11396972e-03,\n",
+       "                        3.83891873e-02,  1.59136765e-02,  1.96111146e-02, -1.42334513e-02,\n",
+       "                        3.52888145e-02,  1.33105358e-02,  5.51172113e-03,  2.60192398e-02,\n",
+       "                       -8.31306912e-03,  5.08351345e-03,  1.16162142e-02,  9.07008070e-03,\n",
+       "                       -1.77313585e-03, -1.13073476e-02, -2.63853911e-02, -7.58569455e-03,\n",
+       "                        1.23039568e-02, -9.51751322e-03,  3.47649269e-02, -8.37521441e-03,\n",
+       "                       -3.41385603e-03, -1.35939382e-02, -2.31663603e-02, -3.02777179e-02,\n",
+       "                       -1.23716239e-02, -2.14149896e-02, -2.31477581e-02, -1.99445989e-02,\n",
+       "                       -1.63127650e-02, -1.80728100e-02, -8.70492589e-03, -1.29072918e-02,\n",
+       "                       -2.68601850e-02, -6.94075646e-03, -4.48201085e-03, -3.69689763e-02,\n",
+       "                       -2.38052551e-02,  9.86985397e-03,  1.81750860e-02, -2.17389762e-02,\n",
+       "                        1.58198401e-02,  1.82335339e-02,  1.69853829e-02,  8.53019953e-03,\n",
+       "                        1.26137808e-02,  4.35138913e-03, -1.42680006e-02, -7.37039372e-03,\n",
+       "                       -9.13672987e-03,  8.27492448e-04,  2.01249495e-02, -3.34417671e-02,\n",
+       "                       -8.82770121e-03,  7.83569762e-04,  1.45847378e-02, -2.61937417e-02,\n",
+       "                       -5.73098920e-02,  2.56210603e-02,  1.96438842e-02,  1.58894695e-02,\n",
+       "                        2.79775411e-02,  4.48896922e-02,  7.81496707e-03,  3.24482359e-02,\n",
+       "                       -2.23230664e-03, -9.27990023e-03, -3.37327085e-02, -2.58272141e-02,\n",
+       "                       -2.16552466e-02,  1.95785761e-02,  1.95409935e-02,  1.11613050e-02,\n",
+       "                       -1.71062257e-02,  1.76059026e-02, -1.35756070e-02, -1.33802658e-02,\n",
+       "                        1.22849524e-04, -3.00864950e-02, -3.07294056e-02,  8.43367260e-03,\n",
+       "                        1.71686104e-03,  1.77911706e-02,  2.96829501e-03,  6.71349885e-03,\n",
+       "                       -1.27283167e-02,  1.89087614e-02,  2.34963223e-02, -8.70413706e-03,\n",
+       "                       -2.57595368e-02,  3.97355249e-03,  2.23790798e-02,  1.55618126e-02,\n",
+       "                       -1.90211681e-03,  9.54312459e-03,  1.30000506e-02, -1.60749331e-02,\n",
+       "                        1.90574955e-02, -2.48913411e-02, -1.22065293e-02, -1.17140273e-02,\n",
+       "                       -7.87160620e-02,  7.49537256e-03,  1.81484632e-02,  4.25873324e-03,\n",
+       "                       -2.96639949e-02,  9.80244949e-03, -2.01651305e-02, -2.05957796e-02,\n",
+       "                       -1.32818706e-02,  2.80134995e-02,  1.27927978e-02,  1.28203519e-02,\n",
+       "                        7.55941402e-03,  1.86280571e-02, -2.17847694e-02,  3.51456041e-03,\n",
+       "                       -9.69546381e-05,  2.68017650e-02, -1.62972324e-02,  4.14601108e-03,\n",
+       "                        1.23571977e-02,  1.97119489e-02, -7.15771178e-03,  5.23134600e-03,\n",
+       "                        3.03786639e-02, -1.63936466e-02, -3.25149409e-02, -5.39167337e-02,\n",
+       "                        3.43849994e-02, -1.77244600e-02, -8.30308069e-03, -2.26102229e-02,\n",
+       "                       -3.20713557e-02, -4.66967747e-02, -4.05329056e-02, -1.22320019e-02,\n",
+       "                       -3.25014628e-02,  5.88958384e-03, -1.72737613e-02,  3.55301984e-02,\n",
+       "                       -1.11767389e-02,  4.04588655e-02,  3.43203195e-04, -3.55312340e-02,\n",
+       "                        8.39638431e-03, -2.83913617e-03, -4.11246624e-03, -1.91871380e-03],\n",
+       "                      dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (dropout): Dropout(\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (q): <tf.Variable 'transformer/layer_._1/rel_attn/q:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[-9.14077908e-02,  1.13878334e-02, -8.51188079e-02, ...,\n",
+       "                        7.58047625e-02,  4.81901653e-02, -1.57964990e-01],\n",
+       "                      [-3.61972786e-02, -6.05871342e-03,  4.62203361e-02, ...,\n",
+       "                        1.02220975e-01,  3.31187397e-02, -2.00551637e-02],\n",
+       "                      [-1.78344436e-02,  1.10841259e-01, -8.28037853e-04, ...,\n",
+       "                       -2.72256564e-02, -3.21121849e-02,  2.49014031e-02],\n",
+       "                      ...,\n",
+       "                      [-1.44089619e-02,  3.92392725e-02,  2.32233517e-02, ...,\n",
+       "                        3.18129919e-03, -9.68393534e-02,  7.63502344e-02],\n",
+       "                      [ 4.15719226e-02,  5.68181686e-02,  1.57067806e-01, ...,\n",
+       "                        1.03105821e-01,  7.46680945e-02, -1.58567447e-02],\n",
+       "                      [-4.14981209e-02,  1.08322926e-01,  6.22609854e-02, ...,\n",
+       "                        9.51158553e-02, -4.82069701e-03,  3.56614999e-02]],\n",
+       "              \n",
+       "                     [[ 2.21992377e-02, -5.97883500e-02,  5.15988655e-02, ...,\n",
+       "                       -1.11302346e-01,  4.72044796e-02,  5.94906546e-02],\n",
+       "                      [ 8.15225467e-02, -1.04043297e-02,  1.18145466e-01, ...,\n",
+       "                       -1.53390374e-02, -5.59366755e-02, -1.01808645e-02],\n",
+       "                      [ 5.30351363e-02, -7.88138062e-02,  5.97658455e-02, ...,\n",
+       "                        3.89603190e-02, -2.52384972e-02, -4.04863395e-02],\n",
+       "                      ...,\n",
+       "                      [ 5.18525168e-02, -1.18374228e-01,  1.22500304e-02, ...,\n",
+       "                        7.76050566e-03, -2.46625934e-02, -1.08838245e-01],\n",
+       "                      [-2.82060308e-03, -3.73417921e-02, -7.43817911e-02, ...,\n",
+       "                       -6.81613460e-02, -9.98374727e-03,  3.63878049e-02],\n",
+       "                      [-2.33192071e-02, -7.30483979e-02, -1.47890881e-01, ...,\n",
+       "                       -2.56333891e-02, -1.82271786e-02, -1.11294717e-01]],\n",
+       "              \n",
+       "                     [[ 7.07995743e-02,  1.02071442e-01, -4.62083258e-02, ...,\n",
+       "                       -3.06372382e-02, -8.96562729e-03, -1.60935847e-03],\n",
+       "                      [ 4.93399464e-02,  5.80327064e-02, -4.21695262e-02, ...,\n",
+       "                       -4.44087908e-02,  6.36480451e-02,  9.20375884e-02],\n",
+       "                      [ 2.61474848e-02,  1.04868315e-01,  8.21986571e-02, ...,\n",
+       "                        6.94721192e-02, -4.26909029e-02,  3.19289789e-02],\n",
+       "                      ...,\n",
+       "                      [ 5.12780324e-02,  2.22272910e-02,  7.36066028e-02, ...,\n",
+       "                       -1.02062506e-04, -2.78015006e-02, -2.21668612e-02],\n",
+       "                      [ 3.76984179e-02, -5.69667593e-02,  9.02416408e-02, ...,\n",
+       "                       -1.17468983e-02, -3.04301623e-02,  7.01869503e-02],\n",
+       "                      [ 1.47923687e-02,  7.80922920e-02, -8.18262398e-02, ...,\n",
+       "                       -7.04243034e-02,  1.69871803e-02, -1.93864703e-02]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[-7.37240771e-03, -1.19801663e-01,  6.94409460e-02, ...,\n",
+       "                       -5.98479286e-02,  1.27701059e-01,  1.34302229e-01],\n",
+       "                      [ 1.42167673e-01, -3.61821651e-02,  8.10781941e-02, ...,\n",
+       "                       -5.00151552e-02, -1.02305926e-01, -2.29969881e-02],\n",
+       "                      [ 7.70621598e-02, -3.88466418e-02,  1.30510852e-01, ...,\n",
+       "                       -2.38810554e-02,  1.85351875e-02, -7.33468086e-02],\n",
+       "                      ...,\n",
+       "                      [ 8.39333534e-02, -1.29041314e-01, -1.34542719e-01, ...,\n",
+       "                        9.67865635e-04,  8.93794596e-02, -5.52671216e-02],\n",
+       "                      [ 6.98279887e-02, -7.33840745e-04,  1.12927826e-02, ...,\n",
+       "                       -8.48613232e-02,  1.15450528e-02,  8.48317146e-02],\n",
+       "                      [-1.45672085e-02, -4.56641093e-02,  3.52248806e-03, ...,\n",
+       "                       -9.79588628e-02,  1.43803144e-02, -1.96329392e-02]],\n",
+       "              \n",
+       "                     [[-2.24300846e-02, -9.70121622e-02, -5.53180464e-02, ...,\n",
+       "                        1.14226513e-01, -1.15935691e-01, -8.40203557e-03],\n",
+       "                      [ 2.19793785e-02,  2.20347419e-02,  3.52332145e-02, ...,\n",
+       "                       -4.72014174e-02, -4.09451835e-02, -1.41605914e-01],\n",
+       "                      [-7.50652626e-02, -4.78943847e-02, -2.94669345e-02, ...,\n",
+       "                       -2.04580035e-02,  2.83687301e-02,  7.36517832e-02],\n",
+       "                      ...,\n",
+       "                      [ 6.45165937e-03, -5.17790206e-02,  6.01154417e-02, ...,\n",
+       "                       -6.84089139e-02,  2.98251119e-02,  1.11601777e-01],\n",
+       "                      [ 1.68807507e-02,  4.85507809e-02, -5.92818707e-02, ...,\n",
+       "                       -3.60055789e-02, -1.57371853e-02,  3.19426693e-02],\n",
+       "                      [-2.77272481e-02, -3.94149087e-02,  1.89277288e-02, ...,\n",
+       "                        7.10227247e-03, -1.24480035e-02,  1.21919438e-01]],\n",
+       "              \n",
+       "                     [[-1.07383234e-02,  2.83993669e-02, -7.25662708e-02, ...,\n",
+       "                       -1.08398020e-01,  5.89501522e-02, -2.39164885e-02],\n",
+       "                      [-5.66680133e-02, -1.15045384e-01,  1.19717479e-01, ...,\n",
+       "                       -7.25880936e-02, -8.00165460e-02,  2.48625781e-02],\n",
+       "                      [-5.32022268e-02, -6.84107393e-02, -4.79449611e-03, ...,\n",
+       "                        1.19777806e-02, -6.41888380e-02, -1.23907752e-01],\n",
+       "                      ...,\n",
+       "                      [ 1.39709413e-01, -1.15669481e-02,  1.02200054e-01, ...,\n",
+       "                        3.99158709e-02, -3.26740108e-02, -4.94181402e-02],\n",
+       "                      [-1.52411321e-02,  6.57810271e-02, -1.58718899e-01, ...,\n",
+       "                        5.38997818e-03, -2.09698156e-01,  6.31303014e-03],\n",
+       "                      [-6.14385307e-03, -3.01341526e-04, -3.58580053e-02, ...,\n",
+       "                        2.14667432e-02,  2.57892162e-02, -1.59396425e-01]]],\n",
+       "                    dtype=float32)>\n",
+       "              (k): <tf.Variable 'transformer/layer_._1/rel_attn/k:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[-0.02706272, -0.01475603,  0.01799243, ..., -0.01109189,\n",
+       "                       -0.10876201,  0.0518376 ],\n",
+       "                      [-0.0031296 , -0.02590217, -0.02579277, ..., -0.05076121,\n",
+       "                        0.01024422, -0.0047144 ],\n",
+       "                      [ 0.01895484, -0.03475295, -0.03113441, ..., -0.00184126,\n",
+       "                        0.01880827,  0.00846547],\n",
+       "                      ...,\n",
+       "                      [-0.0230201 , -0.00894863,  0.00495793, ..., -0.00316434,\n",
+       "                        0.04121248,  0.00622395],\n",
+       "                      [-0.05963105,  0.01012768, -0.03366488, ...,  0.00041262,\n",
+       "                        0.00683424, -0.01068041],\n",
+       "                      [ 0.02895327, -0.02416312,  0.01993154, ..., -0.01618524,\n",
+       "                       -0.01545478,  0.00205119]],\n",
+       "              \n",
+       "                     [[-0.04576638,  0.04656557, -0.01677025, ...,  0.02344459,\n",
+       "                       -0.12276172, -0.00676864],\n",
+       "                      [-0.00978681,  0.04487051, -0.08663532, ..., -0.03004673,\n",
+       "                        0.01007075,  0.03550502],\n",
+       "                      [ 0.02785692,  0.02792483,  0.00051675, ...,  0.00370448,\n",
+       "                        0.00668171,  0.04424441],\n",
+       "                      ...,\n",
+       "                      [-0.02920452,  0.02893456, -0.02343769, ..., -0.04401347,\n",
+       "                       -0.02856454,  0.03050387],\n",
+       "                      [ 0.04369762, -0.03524409,  0.04656316, ...,  0.00108793,\n",
+       "                       -0.02215741,  0.01845626],\n",
+       "                      [-0.01543178,  0.01866272,  0.01845369, ..., -0.02931005,\n",
+       "                        0.03298638,  0.01737015]],\n",
+       "              \n",
+       "                     [[-0.135364  , -0.0664507 ,  0.01112893, ..., -0.00859859,\n",
+       "                        0.00755295,  0.01676364],\n",
+       "                      [-0.02737699, -0.04769333,  0.05760125, ...,  0.02541748,\n",
+       "                       -0.03828989, -0.06387301],\n",
+       "                      [-0.01690764, -0.0606076 , -0.01655304, ..., -0.02443056,\n",
+       "                        0.04120573, -0.04320288],\n",
+       "                      ...,\n",
+       "                      [-0.00565883,  0.04010722,  0.00216758, ...,  0.02029311,\n",
+       "                        0.039828  ,  0.01575541],\n",
+       "                      [ 0.00487086,  0.0582353 , -0.0297171 , ..., -0.01682885,\n",
+       "                       -0.00391845, -0.0216135 ],\n",
+       "                      [ 0.00531683, -0.01306163,  0.04055905, ...,  0.02679659,\n",
+       "                       -0.05756253,  0.01769848]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[ 0.00473029,  0.0232644 , -0.0174927 , ...,  0.01263051,\n",
+       "                       -0.10177041, -0.03314629],\n",
+       "                      [-0.05181501,  0.01826319, -0.00387804, ...,  0.00019099,\n",
+       "                        0.0264037 ,  0.00855082],\n",
+       "                      [-0.02973071,  0.01030848, -0.01891961, ...,  0.05118888,\n",
+       "                       -0.08611775,  0.08852727],\n",
+       "                      ...,\n",
+       "                      [-0.02925289,  0.04309483,  0.04216203, ...,  0.00242066,\n",
+       "                       -0.05256388,  0.00049124],\n",
+       "                      [-0.01112139,  0.01980946, -0.03196227, ...,  0.03356062,\n",
+       "                       -0.010408  , -0.02198589],\n",
+       "                      [-0.03535127, -0.00773543, -0.00885877, ...,  0.02874871,\n",
+       "                        0.00311856,  0.02825575]],\n",
+       "              \n",
+       "                     [[ 0.04659694,  0.07548056,  0.01092906, ..., -0.0534005 ,\n",
+       "                        0.09931507,  0.01606977],\n",
+       "                      [-0.01193147,  0.00658854, -0.01162503, ...,  0.05445072,\n",
+       "                       -0.00323939,  0.06076182],\n",
+       "                      [ 0.01014838,  0.02871931,  0.01193392, ...,  0.03308337,\n",
+       "                       -0.01210698, -0.05587041],\n",
+       "                      ...,\n",
+       "                      [-0.00237026, -0.00477155, -0.02654402, ...,  0.05717536,\n",
+       "                       -0.00253815, -0.04528459],\n",
+       "                      [-0.00140787, -0.03180642,  0.03757759, ...,  0.00683571,\n",
+       "                        0.01135639, -0.00226221],\n",
+       "                      [ 0.0223318 ,  0.02836771, -0.00715415, ...,  0.00253245,\n",
+       "                       -0.000718  , -0.0467924 ]],\n",
+       "              \n",
+       "                     [[ 0.00486831, -0.03448185,  0.03256648, ...,  0.01382556,\n",
+       "                       -0.07196326,  0.02667288],\n",
+       "                      [ 0.02565878,  0.04478304, -0.08682576, ...,  0.01990675,\n",
+       "                        0.03794343, -0.01332447],\n",
+       "                      [ 0.03825634,  0.01602439, -0.01602452, ..., -0.00877481,\n",
+       "                        0.0457263 ,  0.05769112],\n",
+       "                      ...,\n",
+       "                      [-0.05350161,  0.00859326, -0.06572261, ..., -0.04210747,\n",
+       "                        0.00275381,  0.01149508],\n",
+       "                      [ 0.01882138, -0.10080525,  0.04411182, ...,  0.00712686,\n",
+       "                        0.05586889, -0.01648431],\n",
+       "                      [ 0.03689698,  0.0139469 ,  0.01361012, ..., -0.00313812,\n",
+       "                       -0.06611379,  0.05732429]]], dtype=float32)>\n",
+       "              (v): <tf.Variable 'transformer/layer_._1/rel_attn/v:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[ 5.67087531e-02, -1.12824850e-01, -1.23196626e-02, ...,\n",
+       "                        1.13645149e-02,  3.56883346e-03,  8.45598057e-02],\n",
+       "                      [-5.77752071e-04, -3.07194218e-02, -3.13357264e-02, ...,\n",
+       "                        1.41118700e-03,  6.12614527e-02,  2.55001243e-02],\n",
+       "                      [-1.70748532e-02,  2.77932920e-02,  5.13067888e-03, ...,\n",
+       "                       -3.03416830e-02, -1.18992000e-03, -9.29238871e-02],\n",
+       "                      ...,\n",
+       "                      [ 6.08567186e-02, -3.09913028e-02,  6.24712817e-02, ...,\n",
+       "                        2.55415663e-02,  5.63996136e-02,  5.12658581e-02],\n",
+       "                      [-3.21428478e-03,  3.66793349e-02, -1.32496789e-01, ...,\n",
+       "                        4.32726927e-02,  3.97490151e-02, -9.73474830e-02],\n",
+       "                      [-1.93562526e-02, -8.61222204e-03, -3.43473293e-02, ...,\n",
+       "                       -7.81473890e-02,  2.80602742e-02, -2.07295921e-02]],\n",
+       "              \n",
+       "                     [[ 8.56459141e-02,  7.02582160e-03, -3.84326689e-02, ...,\n",
+       "                       -3.87096703e-02,  5.14100343e-02, -1.08823977e-01],\n",
+       "                      [ 3.11664082e-02,  5.39870076e-02, -3.77238803e-02, ...,\n",
+       "                       -7.26625845e-02, -8.51336494e-03,  2.42818613e-03],\n",
+       "                      [-9.49790236e-03, -2.87521519e-02,  7.47229755e-02, ...,\n",
+       "                       -3.13882641e-02,  3.28157991e-02, -8.38298276e-02],\n",
+       "                      ...,\n",
+       "                      [-5.39512420e-03,  2.12775674e-02, -8.39983523e-02, ...,\n",
+       "                        6.08833181e-03,  1.98775176e-02,  5.47741689e-02],\n",
+       "                      [ 1.73927955e-02, -1.89691111e-02, -7.81969577e-02, ...,\n",
+       "                       -1.51080592e-02, -1.12658530e-01,  3.66142765e-03],\n",
+       "                      [ 2.85869651e-02, -7.98759833e-02, -2.40408368e-02, ...,\n",
+       "                       -4.39561494e-02, -1.08551057e-02,  6.84287250e-02]],\n",
+       "              \n",
+       "                     [[-8.98210257e-02, -8.23260564e-03, -7.24420995e-02, ...,\n",
+       "                       -8.25054646e-02,  8.48042034e-03, -3.15508172e-02],\n",
+       "                      [-2.38543581e-02, -5.01328148e-02,  8.82579293e-03, ...,\n",
+       "                        1.87256172e-01,  3.01636308e-02,  1.17524453e-01],\n",
+       "                      [ 3.30534093e-02,  5.23727853e-03, -7.37811029e-02, ...,\n",
+       "                       -7.10760653e-02, -2.29823533e-02, -2.13149209e-02],\n",
+       "                      ...,\n",
+       "                      [-2.47698408e-02,  9.20365751e-02, -3.46506089e-02, ...,\n",
+       "                        5.87393865e-02, -1.65056158e-02, -5.69600463e-02],\n",
+       "                      [ 2.32015271e-02, -5.16756326e-02,  1.28099397e-01, ...,\n",
+       "                        1.12314336e-01,  2.16532238e-02, -6.47730455e-02],\n",
+       "                      [ 2.03323364e-02, -7.36131817e-02,  1.41372532e-02, ...,\n",
+       "                        1.25761315e-01,  4.53136163e-03,  3.45687717e-02]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[-9.56907310e-03, -9.95358732e-03,  3.63281965e-02, ...,\n",
+       "                        2.58678198e-02,  4.62427326e-02, -6.91857040e-02],\n",
+       "                      [-9.87947453e-03,  8.94671008e-02, -8.27581808e-03, ...,\n",
+       "                        3.94476205e-02,  5.41206822e-02, -1.00297781e-04],\n",
+       "                      [ 1.17582083e-02,  7.56660998e-02, -1.23020314e-01, ...,\n",
+       "                        4.89301793e-02, -9.47242454e-02,  3.28166457e-03],\n",
+       "                      ...,\n",
+       "                      [ 1.15716793e-01,  3.90926264e-02, -4.99027520e-02, ...,\n",
+       "                        8.36827308e-02,  2.90968139e-02, -1.35319196e-02],\n",
+       "                      [ 9.96496007e-02,  4.21701605e-03, -9.55350790e-03, ...,\n",
+       "                        2.05535050e-02, -5.73687628e-02, -4.45158668e-02],\n",
+       "                      [ 1.23274401e-02,  4.88903075e-02, -2.19891965e-02, ...,\n",
+       "                        2.60861218e-02,  5.44191115e-02,  5.99674210e-02]],\n",
+       "              \n",
+       "                     [[-1.65354963e-02,  6.05088361e-02, -1.34862944e-01, ...,\n",
+       "                       -5.98663576e-02,  3.65664996e-02, -1.03359101e-02],\n",
+       "                      [-9.25186276e-03, -2.66341027e-02,  1.94170848e-02, ...,\n",
+       "                        2.30957083e-02, -4.58738953e-02, -4.78612706e-02],\n",
+       "                      [ 2.87209991e-02,  1.50819980e-02,  2.55784392e-02, ...,\n",
+       "                        3.31534520e-02, -3.39708515e-02,  6.50511608e-02],\n",
+       "                      ...,\n",
+       "                      [-2.69539766e-02,  4.67734933e-02, -2.07383726e-02, ...,\n",
+       "                        2.51334589e-02,  7.85554647e-02, -4.04318161e-02],\n",
+       "                      [-5.97617403e-02, -5.09780608e-02, -4.87654544e-02, ...,\n",
+       "                        7.31536280e-03, -2.58004926e-02, -1.06805447e-03],\n",
+       "                      [ 6.96763117e-03, -2.40809843e-03,  5.32752043e-03, ...,\n",
+       "                        1.89656429e-02, -2.77937427e-02, -4.43040021e-03]],\n",
+       "              \n",
+       "                     [[ 1.08559877e-01,  5.06516881e-02,  4.46610991e-03, ...,\n",
+       "                        2.41088998e-02, -5.01579493e-02, -1.30853996e-01],\n",
+       "                      [ 2.72694021e-03,  4.16806415e-02,  2.18579862e-02, ...,\n",
+       "                        8.55507031e-02,  2.64558773e-02, -2.36834567e-02],\n",
+       "                      [ 9.53411013e-02, -2.69163363e-02,  4.98878472e-02, ...,\n",
+       "                        1.33439843e-02,  6.63656220e-02,  1.11669907e-02],\n",
+       "                      ...,\n",
+       "                      [ 1.26299094e-02, -9.85859185e-02, -1.44153526e-02, ...,\n",
+       "                       -1.92226265e-02,  7.13283569e-02, -1.10161053e-02],\n",
+       "                      [ 6.45558536e-02, -7.60441087e-03,  1.30066760e-02, ...,\n",
+       "                       -3.82443629e-02,  1.06134437e-01, -1.21100806e-01],\n",
+       "                      [-4.24301848e-02, -1.86020695e-02,  1.10428683e-01, ...,\n",
+       "                        2.61989217e-02, -1.09599389e-01,  8.63663629e-02]]],\n",
+       "                    dtype=float32)>\n",
+       "              (o): <tf.Variable 'transformer/layer_._1/rel_attn/o:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[ 8.66029318e-03, -1.14577517e-01,  2.51828320e-03, ...,\n",
+       "                       -9.27881300e-02, -1.15491651e-01,  1.76676996e-02],\n",
+       "                      [-7.61712566e-02, -4.53079939e-02, -3.83440144e-02, ...,\n",
+       "                       -6.27577379e-02,  2.21626088e-03, -5.94992712e-02],\n",
+       "                      [-2.56332336e-03,  5.90471923e-02, -4.72475886e-02, ...,\n",
+       "                        3.67398188e-02, -7.33544538e-03,  3.78904641e-02],\n",
+       "                      ...,\n",
+       "                      [-2.13392675e-02,  2.53363270e-02,  6.85974360e-02, ...,\n",
+       "                        3.40457745e-02,  8.49376842e-02,  5.36587182e-03],\n",
+       "                      [ 1.60655994e-02, -7.56803527e-02,  4.73908894e-02, ...,\n",
+       "                        3.05386297e-02,  5.41357175e-02,  7.49823898e-02],\n",
+       "                      [ 4.58855778e-02,  3.71842496e-02,  7.53282160e-02, ...,\n",
+       "                        3.70172504e-03, -3.53820138e-02, -5.28645553e-02]],\n",
+       "              \n",
+       "                     [[-3.55167175e-03, -2.94522091e-04, -3.51395980e-02, ...,\n",
+       "                        3.41055691e-02,  3.03370338e-02, -5.06093465e-02],\n",
+       "                      [ 2.40699574e-02,  5.95200136e-02, -6.21140413e-02, ...,\n",
+       "                        1.14351902e-02,  1.85474288e-02,  9.06990189e-03],\n",
+       "                      [-1.19964657e-02,  8.26470368e-03,  7.37269372e-02, ...,\n",
+       "                       -1.01896927e-01, -1.25561088e-01,  5.12074912e-03],\n",
+       "                      ...,\n",
+       "                      [-1.59163550e-02,  4.47448492e-02, -5.62733822e-02, ...,\n",
+       "                       -1.58314186e-03,  3.07480115e-02,  2.12907395e-03],\n",
+       "                      [ 5.29436469e-02,  8.85004643e-03, -5.96460328e-03, ...,\n",
+       "                        3.14378440e-02, -4.15493660e-02, -2.16497947e-02],\n",
+       "                      [ 2.48335098e-04, -2.38254899e-03, -8.83876067e-03, ...,\n",
+       "                        1.26072252e-02, -3.53750363e-02,  3.07404995e-03]],\n",
+       "              \n",
+       "                     [[-8.30164403e-02, -2.34115589e-02, -4.61669937e-02, ...,\n",
+       "                       -6.64920658e-02,  6.33270964e-02, -1.78227499e-02],\n",
+       "                      [-7.69058391e-02, -7.60177821e-02,  3.90506051e-02, ...,\n",
+       "                        1.22973844e-02,  8.64065159e-03,  1.01280168e-01],\n",
+       "                      [-6.82748621e-04, -2.65821535e-02, -3.84966880e-02, ...,\n",
+       "                       -1.80162862e-02,  9.76960920e-03,  3.76105122e-02],\n",
+       "                      ...,\n",
+       "                      [-5.84762208e-02,  5.76327890e-02, -1.74372140e-02, ...,\n",
+       "                       -7.67533854e-02, -1.02110216e-02, -3.60212587e-02],\n",
+       "                      [-3.30317393e-02,  1.38184456e-02,  6.58438280e-02, ...,\n",
+       "                        1.21754026e-02,  1.70937050e-02, -1.40107097e-02],\n",
+       "                      [-5.16036898e-02, -6.22054636e-02,  1.16310194e-02, ...,\n",
+       "                        6.95217699e-02,  8.53841566e-03,  4.68714796e-02]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[ 1.17255980e-02,  7.38588301e-03,  2.76839491e-02, ...,\n",
+       "                        1.90327652e-02,  5.16140573e-02, -1.37946710e-01],\n",
+       "                      [ 2.57208347e-02,  1.09104672e-02,  3.15251462e-02, ...,\n",
+       "                        4.07493114e-02,  5.25305085e-02,  3.15010697e-02],\n",
+       "                      [ 1.89815201e-02,  6.16960227e-02,  3.34828347e-02, ...,\n",
+       "                       -1.66332368e-02, -9.41335633e-02, -3.90448980e-02],\n",
+       "                      ...,\n",
+       "                      [ 8.98937732e-02, -3.22609837e-03, -6.63657114e-02, ...,\n",
+       "                        3.03167403e-02, -6.76293130e-05,  5.02400473e-03],\n",
+       "                      [ 5.70965782e-02,  7.24036619e-03,  3.85382585e-03, ...,\n",
+       "                        9.01868120e-02, -5.91169717e-03, -6.02913462e-02],\n",
+       "                      [-5.98075092e-02, -3.06096841e-02, -1.54292081e-02, ...,\n",
+       "                        6.55795634e-02,  3.12577635e-02,  9.34221670e-02]],\n",
+       "              \n",
+       "                     [[-3.18901590e-03,  1.63269453e-02, -3.31503851e-03, ...,\n",
+       "                       -8.52069855e-02,  5.58818225e-03,  4.01768200e-02],\n",
+       "                      [ 1.10879391e-02,  3.53012718e-02,  6.00853097e-03, ...,\n",
+       "                        8.96103773e-03, -2.04980783e-02, -1.00578843e-02],\n",
+       "                      [ 6.01615310e-02,  7.26685487e-03, -1.52228177e-02, ...,\n",
+       "                        1.37231862e-02, -2.04465948e-02, -1.61056891e-02],\n",
+       "                      ...,\n",
+       "                      [-5.08951209e-02,  1.84552092e-02, -5.32345055e-03, ...,\n",
+       "                       -2.72054737e-03,  6.48149550e-02,  7.55127743e-02],\n",
+       "                      [ 1.13570224e-02, -1.89477820e-02,  2.59459894e-02, ...,\n",
+       "                       -3.25487554e-02, -5.39538898e-02, -4.34179567e-02],\n",
+       "                      [-1.20608704e-02, -5.62019320e-03, -1.85313057e-02, ...,\n",
+       "                        2.01634150e-02,  1.00505576e-02, -1.57885384e-02]],\n",
+       "              \n",
+       "                     [[-4.44078520e-02,  6.07606210e-03, -2.59394348e-02, ...,\n",
+       "                       -7.71517456e-02, -8.42755064e-02, -1.66165549e-02],\n",
+       "                      [ 1.88575257e-02,  3.10134366e-02,  3.20087746e-02, ...,\n",
+       "                        4.75202836e-02,  2.75874902e-02,  5.98586611e-02],\n",
+       "                      [ 1.48858996e-02, -2.13626288e-02, -1.11806169e-01, ...,\n",
+       "                       -3.95744778e-02, -1.11924306e-01, -4.32251021e-02],\n",
+       "                      ...,\n",
+       "                      [-3.16806063e-02,  6.08082600e-02,  5.26219085e-02, ...,\n",
+       "                       -2.04716958e-02,  3.42884101e-02,  1.69068556e-02],\n",
+       "                      [ 9.24186129e-03,  2.30468120e-02,  1.84935275e-02, ...,\n",
+       "                        3.59074026e-02,  5.17238043e-02,  1.21195316e-02],\n",
+       "                      [-2.55695079e-02,  2.09787451e-02, -8.66606180e-03, ...,\n",
+       "                        5.14007397e-02, -2.81591658e-02,  8.15731846e-03]]],\n",
+       "                    dtype=float32)>\n",
+       "              (r): <tf.Variable 'transformer/layer_._1/rel_attn/r:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[-1.46897674e-01,  1.74011409e-01, -2.07041457e-01, ...,\n",
+       "                        2.09365278e-01,  7.04047009e-02, -1.94730520e-01],\n",
+       "                      [-1.91919565e-01, -1.88010305e-01, -1.38464078e-01, ...,\n",
+       "                        1.75045997e-01,  1.83993801e-01, -1.66332796e-01],\n",
+       "                      [-1.87968820e-01,  1.81354731e-01, -1.86937690e-01, ...,\n",
+       "                       -1.73305765e-01,  1.42847419e-01,  1.37066424e-01],\n",
+       "                      ...,\n",
+       "                      [-1.81287214e-01,  1.93034187e-01,  2.10268214e-01, ...,\n",
+       "                        2.11266726e-01,  2.23274544e-01,  2.13569388e-01],\n",
+       "                      [-1.77906901e-01,  1.88187703e-01,  2.09059939e-01, ...,\n",
+       "                        2.07140788e-01,  2.14991555e-01, -2.00226620e-01],\n",
+       "                      [ 1.72938675e-01,  1.84366092e-01,  2.02027947e-01, ...,\n",
+       "                        1.92545146e-01, -1.70009255e-01,  1.74475133e-01]],\n",
+       "              \n",
+       "                     [[-9.72831920e-02,  1.58304572e-01, -1.73237279e-01, ...,\n",
+       "                        1.58044904e-01,  5.10960259e-02, -1.99876621e-01],\n",
+       "                      [-1.29664943e-01, -1.37299687e-01, -1.13309212e-01, ...,\n",
+       "                        1.44313514e-01,  1.40009508e-01, -1.26466140e-01],\n",
+       "                      [-1.62108094e-01,  1.70799494e-01, -1.40059158e-01, ...,\n",
+       "                       -1.51002154e-01,  8.46845284e-02,  1.36088893e-01],\n",
+       "                      ...,\n",
+       "                      [-1.32899761e-01,  1.71471238e-01,  1.51986942e-01, ...,\n",
+       "                        1.66069463e-01,  1.65516198e-01,  1.63684517e-01],\n",
+       "                      [-1.30655318e-01,  1.75758496e-01,  1.73514783e-01, ...,\n",
+       "                        1.73679933e-01,  1.55112520e-01, -1.70741528e-01],\n",
+       "                      [ 1.23091467e-01,  1.46520704e-01,  1.53373584e-01, ...,\n",
+       "                        1.40420586e-01, -1.25283971e-01,  1.81063727e-01]],\n",
+       "              \n",
+       "                     [[-8.82046670e-02,  1.20563805e-01, -1.54819176e-01, ...,\n",
+       "                        1.37534931e-01,  7.11622387e-02, -1.69938922e-01],\n",
+       "                      [-1.27852052e-01, -1.35840997e-01, -8.00763592e-02, ...,\n",
+       "                        1.18804909e-01,  1.17752388e-01, -6.82469532e-02],\n",
+       "                      [-1.27978489e-01,  1.30864084e-01, -1.21015176e-01, ...,\n",
+       "                       -1.36511073e-01,  9.61252674e-02,  8.98678079e-02],\n",
+       "                      ...,\n",
+       "                      [-1.27951488e-01,  1.54330939e-01,  1.37083441e-01, ...,\n",
+       "                        1.36708304e-01,  1.42049015e-01,  1.24714136e-01],\n",
+       "                      [-8.22131708e-02,  8.92748907e-02,  1.30160138e-01, ...,\n",
+       "                        1.36945337e-01,  1.26669794e-01, -1.22825712e-01],\n",
+       "                      [ 1.11137711e-01,  1.09357782e-01,  1.39476791e-01, ...,\n",
+       "                        1.16972752e-01, -1.02480344e-01,  1.31967843e-01]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[ 9.53109644e-04,  2.36279629e-02,  2.00178288e-03, ...,\n",
+       "                        5.88640803e-03,  3.05523304e-03, -7.16660544e-03],\n",
+       "                      [-1.66137051e-02,  2.43202504e-02,  1.39665473e-02, ...,\n",
+       "                        1.29140597e-02,  3.85063398e-03,  8.05215444e-03],\n",
+       "                      [-1.17559778e-03,  1.35235796e-02,  1.29539445e-02, ...,\n",
+       "                        1.29707437e-02,  5.79934474e-03, -1.83496403e-03],\n",
+       "                      ...,\n",
+       "                      [-4.06753412e-03,  5.26591064e-03, -8.99039581e-03, ...,\n",
+       "                        4.24702466e-02,  2.50355471e-02, -1.18161682e-02],\n",
+       "                      [ 1.86481122e-02,  4.72524873e-04, -2.97491509e-03, ...,\n",
+       "                       -7.89663754e-04,  1.45817995e-02,  1.99292991e-02],\n",
+       "                      [ 6.24428876e-03,  4.76739649e-03, -2.52191699e-03, ...,\n",
+       "                        1.14012184e-03,  1.34989284e-02,  2.64687147e-02]],\n",
+       "              \n",
+       "                     [[ 1.98490229e-02,  1.32721895e-02,  2.04636739e-03, ...,\n",
+       "                       -1.59615539e-02,  3.51932757e-02,  1.42656248e-02],\n",
+       "                      [-4.00670309e-04, -3.32874944e-04,  2.40566581e-02, ...,\n",
+       "                        1.08023062e-02, -1.90807581e-02, -5.00886608e-03],\n",
+       "                      [-1.52654015e-02,  1.49440160e-02, -2.63901725e-02, ...,\n",
+       "                       -1.51216965e-02,  6.56380411e-03, -1.47011476e-02],\n",
+       "                      ...,\n",
+       "                      [-2.04982725e-03, -1.84093118e-02, -8.56019929e-03, ...,\n",
+       "                       -5.50516229e-03, -1.67570729e-02,  1.74919405e-04],\n",
+       "                      [-9.94952582e-03, -4.25786190e-02, -1.12591460e-02, ...,\n",
+       "                       -1.10278605e-02, -1.64491571e-02,  8.36265925e-03],\n",
+       "                      [ 2.35332940e-02, -4.40680422e-03, -1.85185752e-03, ...,\n",
+       "                        1.28285857e-02, -3.74334864e-02, -6.49360567e-03]],\n",
+       "              \n",
+       "                     [[-4.03778590e-02,  3.10220500e-03, -3.23167108e-02, ...,\n",
+       "                        1.71264191e-03,  5.96588850e-03, -2.12317165e-02],\n",
+       "                      [-2.02080980e-02, -7.53459148e-03, -4.10040235e-03, ...,\n",
+       "                        3.79406707e-03,  2.68777627e-02, -1.61216389e-02],\n",
+       "                      [-4.50483896e-03,  7.15539558e-03, -9.55935009e-03, ...,\n",
+       "                       -4.80790297e-03,  2.41799094e-03, -3.76463821e-03],\n",
+       "                      ...,\n",
+       "                      [-1.57353263e-02,  8.99432600e-03,  5.29706152e-03, ...,\n",
+       "                        1.19281923e-02,  9.35687870e-03, -2.13156436e-02],\n",
+       "                      [ 8.13638791e-03,  9.65433847e-03, -9.12594423e-03, ...,\n",
+       "                        2.02135020e-03, -4.37395182e-03, -6.05759968e-04],\n",
+       "                      [-2.53979210e-02,  8.30472796e-04,  1.21758673e-02, ...,\n",
+       "                        8.98340251e-03,  2.04570275e-02,  8.64630472e-03]]],\n",
+       "                    dtype=float32)>\n",
+       "              (r_r_bias): <tf.Variable 'transformer/layer_._1/rel_attn/r_r_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "              array([[ 0.14899914, -0.34153602,  0.3803297 ,  0.36917952, -0.38786203,\n",
+       "                      -0.13080384,  0.344216  , -0.35379156, -0.3844165 , -0.36286288,\n",
+       "                      -0.08941454,  0.37458393],\n",
+       "                     [ 0.33911064,  0.32911122,  0.31310028,  0.29833585, -0.30792385,\n",
+       "                       0.33739606, -0.32293308,  0.3369534 , -0.31201705, -0.3280124 ,\n",
+       "                      -0.32297572,  0.3089489 ],\n",
+       "                     [ 0.36541435, -0.36004987,  0.35938582, -0.36907914,  0.3486618 ,\n",
+       "                      -0.0593513 , -0.34139338,  0.35678086, -0.36190793,  0.34279796,\n",
+       "                      -0.31591862, -0.29939887],\n",
+       "                     [-0.28541145, -0.28479883,  0.2857083 ,  0.29083747, -0.28382772,\n",
+       "                      -0.27742648,  0.27382922, -0.262767  , -0.28953055,  0.22580072,\n",
+       "                       0.2792229 ,  0.26833603],\n",
+       "                     [-0.31788912,  0.32046515,  0.30290008,  0.31088528, -0.31547454,\n",
+       "                       0.30249548, -0.26167852,  0.30141065, -0.32778227,  0.30795413,\n",
+       "                      -0.31171426, -0.25726327],\n",
+       "                     [ 0.314079  , -0.30792624, -0.3221542 , -0.30551824,  0.24594624,\n",
+       "                       0.31892028, -0.3053024 , -0.00082669,  0.29853317, -0.29422322,\n",
+       "                       0.30099693,  0.2978344 ],\n",
+       "                     [-0.37505603,  0.3527668 , -0.35440302,  0.30887768,  0.35537973,\n",
+       "                       0.34240764, -0.36563224, -0.32328182,  0.3066197 ,  0.3783165 ,\n",
+       "                       0.36704957, -0.07152183],\n",
+       "                     [-0.24481814, -0.25152895, -0.26902637, -0.25899634,  0.26075813,\n",
+       "                       0.25052536, -0.18769039,  0.24073453, -0.23911558, -0.264942  ,\n",
+       "                      -0.24604012, -0.25978062],\n",
+       "                     [ 0.3448066 ,  0.35508814,  0.3277917 , -0.36480623, -0.36373508,\n",
+       "                       0.34252417, -0.26490748, -0.3698438 , -0.37082767, -0.38157573,\n",
+       "                      -0.35605282, -0.34466416],\n",
+       "                     [ 0.30798635,  0.36460385, -0.3754039 ,  0.3400862 , -0.35259473,\n",
+       "                       0.34701774,  0.18916364, -0.3498748 , -0.356646  , -0.36569807,\n",
+       "                      -0.36399728, -0.30652383],\n",
+       "                     [ 0.25416747, -0.27864173,  0.24143916,  0.2589485 ,  0.26826364,\n",
+       "                      -0.276374  ,  0.28044358, -0.26923546, -0.23912592, -0.272487  ,\n",
+       "                      -0.26509777,  0.27066582],\n",
+       "                     [-0.2960118 , -0.29988503, -0.29283497,  0.2847119 ,  0.30326426,\n",
+       "                      -0.29098433,  0.29103255, -0.29597896,  0.27998862,  0.29750696,\n",
+       "                       0.3016155 , -0.2862795 ],\n",
+       "                     [-0.33974963, -0.3114596 , -0.3245498 , -0.33191413, -0.26564565,\n",
+       "                      -0.31937695,  0.32511777, -0.3418174 ,  0.3280482 , -0.32252905,\n",
+       "                       0.31764168, -0.3219256 ],\n",
+       "                     [ 0.36129203, -0.3835813 , -0.34948146, -0.38187614, -0.10551658,\n",
+       "                      -0.35736713,  0.36742166, -0.10739829,  0.3812859 , -0.38279817,\n",
+       "                      -0.38232875, -0.37825328],\n",
+       "                     [ 0.3321833 , -0.33618993, -0.35035315, -0.11618523, -0.31958073,\n",
+       "                      -0.34353533, -0.3631967 , -0.32926843, -0.3406108 , -0.40713176,\n",
+       "                      -0.35072395,  0.3597266 ],\n",
+       "                     [-0.35400867, -0.35107192, -0.37232462, -0.37361598,  0.36000717,\n",
+       "                      -0.33463717,  0.38095737, -0.34364143, -0.33852988, -0.35104772,\n",
+       "                       0.2981984 , -0.3554742 ]], dtype=float32)>\n",
+       "              (r_s_bias): <tf.Variable 'transformer/layer_._1/rel_attn/r_s_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "              array([[0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.]], dtype=float32)>\n",
+       "              (r_w_bias): <tf.Variable 'transformer/layer_._1/rel_attn/r_w_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "              array([[-4.62216102e-02,  1.16589062e-01, -1.36763275e-01,\n",
+       "                      -1.22126430e-01,  1.48961708e-01,  1.45974793e-02,\n",
+       "                      -1.61591738e-01,  1.87203407e-01,  2.07243934e-01,\n",
+       "                       1.52396217e-01,  2.49146335e-02, -2.02902481e-01],\n",
+       "                     [-1.07586920e-01, -1.06996477e-01, -7.84136206e-02,\n",
+       "                      -5.37643544e-02,  8.04927945e-02, -1.09561071e-01,\n",
+       "                       1.08106196e-01, -1.32538766e-01,  9.16128457e-02,\n",
+       "                       6.15168475e-02,  6.16029464e-02, -6.31495491e-02],\n",
+       "                     [-1.13178924e-01,  1.40476599e-01, -1.35648683e-01,\n",
+       "                       1.80651262e-01, -9.42587331e-02,  4.49052267e-02,\n",
+       "                       1.27758279e-01, -3.65762338e-02,  1.44819573e-01,\n",
+       "                      -1.08886130e-01,  7.25614876e-02,  5.72540285e-03],\n",
+       "                     [ 1.28033966e-01,  4.27292474e-02, -5.35008721e-02,\n",
+       "                      -1.09917521e-01,  4.55539674e-02,  9.57781374e-02,\n",
+       "                      -1.04749307e-01,  5.18838726e-02,  8.35832134e-02,\n",
+       "                      -1.41942231e-02, -7.90465996e-02, -1.42346501e-01],\n",
+       "                     [ 7.61313289e-02, -4.59336676e-02, -1.19175784e-01,\n",
+       "                      -8.25000405e-02,  1.09469183e-01, -1.36095643e-01,\n",
+       "                       2.47284826e-02, -2.28797179e-02,  1.37981102e-01,\n",
+       "                      -1.14949889e-01,  4.44846004e-02,  3.99738923e-02],\n",
+       "                     [-1.65838182e-01,  9.48740020e-02,  1.44404322e-01,\n",
+       "                       8.53616223e-02, -2.70830076e-02, -6.19642437e-02,\n",
+       "                       8.94338936e-02,  7.70374341e-03, -8.17450806e-02,\n",
+       "                       1.17244996e-01, -7.69629925e-02, -1.09416604e-01],\n",
+       "                     [ 1.57854617e-01, -1.56897545e-01,  1.29691288e-01,\n",
+       "                      -8.42681080e-02, -8.85965973e-02, -1.28146768e-01,\n",
+       "                       8.91689807e-02,  1.08561374e-01, -9.64733809e-02,\n",
+       "                      -1.55561730e-01, -8.79286975e-02, -1.13232369e-02],\n",
+       "                     [ 7.38919228e-02,  1.09030314e-01,  6.82480931e-02,\n",
+       "                       5.55296168e-02, -6.17072172e-02, -1.04720660e-01,\n",
+       "                      -6.92145200e-03, -3.91406119e-02,  4.73909490e-02,\n",
+       "                       7.34069794e-02,  5.68175763e-02,  4.85593155e-02],\n",
+       "                     [-1.74990490e-01, -1.20659910e-01, -1.35730013e-01,\n",
+       "                       1.51203781e-01,  1.48414791e-01, -7.34399632e-02,\n",
+       "                       7.54770786e-02,  2.29218081e-01,  9.63332728e-02,\n",
+       "                       1.05563387e-01,  1.79456845e-01,  1.29063517e-01],\n",
+       "                     [-4.34173606e-02, -1.30563438e-01,  1.60625249e-01,\n",
+       "                      -1.41897142e-01,  1.51958242e-01, -6.46752417e-02,\n",
+       "                       1.28286381e-04,  5.29836081e-02,  1.19528137e-01,\n",
+       "                       2.21275479e-01,  1.76483870e-01,  5.65731786e-02],\n",
+       "                     [ 7.86350667e-03,  1.22386105e-01, -3.76115479e-02,\n",
+       "                      -3.60284224e-02, -9.76402089e-02,  1.65668249e-01,\n",
+       "                      -8.34911838e-02,  7.12872595e-02,  3.44360694e-02,\n",
+       "                       7.70075917e-02,  6.81297109e-02, -3.08290645e-02],\n",
+       "                     [ 1.20040596e-01,  6.12675473e-02,  1.29310817e-01,\n",
+       "                      -7.74290562e-02, -7.78047889e-02,  8.89190733e-02,\n",
+       "                      -3.96793000e-02,  7.09067658e-02, -7.84836560e-02,\n",
+       "                      -5.97045012e-02, -5.77512644e-02,  1.05530277e-01],\n",
+       "                     [ 5.21370508e-02,  9.81653333e-02,  1.14423938e-01,\n",
+       "                       1.14286542e-01,  5.82821295e-02,  1.18820079e-01,\n",
+       "                      -8.86438638e-02,  5.43031134e-02, -8.52945074e-02,\n",
+       "                       8.23517442e-02, -9.12688896e-02,  3.97731513e-02],\n",
+       "                     [-9.26975161e-02,  1.76723376e-01,  1.12929732e-01,\n",
+       "                       1.46531433e-01,  9.49880015e-03,  1.27589166e-01,\n",
+       "                      -2.04214618e-01,  3.05328611e-03, -1.69557929e-01,\n",
+       "                       1.36818811e-01,  9.52240303e-02,  2.15536699e-01],\n",
+       "                     [-5.74819483e-02,  5.62564880e-02,  1.98273271e-01,\n",
+       "                      -1.17968698e-03,  1.26326323e-01,  1.54033735e-01,\n",
+       "                       1.18295722e-01,  4.89505827e-02,  1.98732257e-01,\n",
+       "                       1.31851271e-01,  1.58291176e-01, -1.05149098e-01],\n",
+       "                     [ 8.80631879e-02,  1.58400908e-01,  1.52702242e-01,\n",
+       "                       1.10614061e-01, -8.25159028e-02,  2.31264345e-02,\n",
+       "                      -1.75350800e-01,  9.48455557e-02,  8.91729742e-02,\n",
+       "                       1.68625101e-01, -4.55371849e-02,  1.06890120e-01]], dtype=float32)>\n",
+       "              (seg_embed): <tf.Variable 'transformer/layer_._1/rel_attn/seg_embed:0' shape=(2, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[ 7.61602633e-03, -1.85396653e-02,  1.41175482e-02,\n",
+       "                        1.02747520e-02, -1.02692777e-02, -5.79114538e-03,\n",
+       "                       -2.25887215e-03,  1.97049114e-03,  5.02155814e-03,\n",
+       "                       -6.39485754e-03, -4.06287983e-03,  1.60969961e-02],\n",
+       "                      [-1.68735627e-02, -4.82341414e-03,  6.73457189e-03,\n",
+       "                        9.00006853e-04, -2.81745940e-03, -5.75073343e-03,\n",
+       "                        6.85399212e-03, -3.11884983e-03,  1.24747735e-02,\n",
+       "                       -5.00333635e-03,  1.04523534e-02, -9.33902338e-03],\n",
+       "                      [ 3.03338887e-03,  1.81995309e-03, -4.44657216e-03,\n",
+       "                       -6.89545879e-04,  8.68439456e-05,  4.08066344e-03,\n",
+       "                        6.55966694e-04, -1.95205770e-02, -2.45983759e-03,\n",
+       "                        2.33589532e-03,  3.92747996e-03, -1.79917943e-02],\n",
+       "                      [-7.01340672e-04,  1.79661233e-02, -1.47282165e-02,\n",
+       "                       -1.05006841e-03,  1.18477382e-02,  4.56858613e-03,\n",
+       "                       -1.35715781e-02,  1.63909830e-02, -1.83726789e-03,\n",
+       "                       -4.62263270e-05, -1.51350088e-02,  1.84442364e-02],\n",
+       "                      [ 3.17642442e-03, -1.64884496e-02,  1.18464208e-03,\n",
+       "                        6.03873935e-03,  1.23784514e-02, -6.32783957e-03,\n",
+       "                        3.94236110e-03,  7.08509982e-03,  1.44205999e-03,\n",
+       "                        8.04485381e-03,  3.18194245e-04, -3.99992894e-03],\n",
+       "                      [-1.37944268e-02, -4.84130438e-03,  1.68232359e-02,\n",
+       "                        1.21006211e-02,  1.01589188e-02, -8.44671298e-03,\n",
+       "                       -1.34035468e-03, -2.33793142e-03,  1.44077949e-02,\n",
+       "                        1.12157769e-03,  9.63134400e-04, -1.19164761e-03],\n",
+       "                      [-5.74960979e-03,  6.86749723e-03,  1.20431418e-02,\n",
+       "                       -4.14077239e-03, -1.14332717e-02,  1.46603184e-02,\n",
+       "                       -2.92793987e-03, -5.18011584e-05,  5.89169236e-03,\n",
+       "                        5.62065002e-03, -1.54455882e-02, -1.93359759e-02],\n",
+       "                      [-1.32184587e-02, -8.09574313e-03,  1.73612162e-02,\n",
+       "                        1.75058469e-02,  1.21301925e-02,  1.62602477e-02,\n",
+       "                       -1.33753968e-02,  3.75581020e-03, -4.20281896e-03,\n",
+       "                        1.55054042e-02, -1.15841664e-02, -2.08650995e-03],\n",
+       "                      [ 7.34686246e-03,  1.02794832e-02,  1.31241558e-03,\n",
+       "                        2.87566753e-03,  5.84390247e-03,  3.02153081e-03,\n",
+       "                       -7.33443536e-03, -7.87269603e-03,  4.51662997e-03,\n",
+       "                        2.32343981e-03,  9.98496637e-03, -9.53329075e-03],\n",
+       "                      [ 9.44391824e-03, -1.56681787e-03,  5.64246729e-04,\n",
+       "                        8.50769039e-03, -5.61839016e-03,  1.00806393e-02,\n",
+       "                        4.45341272e-03,  1.17781861e-02, -9.62750241e-03,\n",
+       "                        1.01322914e-02,  1.13904784e-02, -2.56038038e-03],\n",
+       "                      [-6.31258730e-03, -7.30622979e-03, -4.83252574e-03,\n",
+       "                        1.29672261e-02, -2.86618783e-03, -6.99736294e-04,\n",
+       "                        8.63193162e-03,  1.24630332e-02, -1.86973754e-02,\n",
+       "                        9.60467104e-03,  4.52060765e-03,  7.15382455e-04],\n",
+       "                      [ 6.44308235e-03,  9.21295118e-03, -1.06562199e-02,\n",
+       "                        5.58915641e-03,  5.59847150e-03, -1.35788438e-03,\n",
+       "                       -9.19332448e-03, -2.69832183e-03, -3.68528347e-03,\n",
+       "                        1.15745421e-02, -1.17136361e-02, -1.45567106e-02],\n",
+       "                      [ 2.83513777e-03,  3.74191441e-04, -1.22113694e-02,\n",
+       "                        6.28614333e-03,  7.08920229e-03, -8.08887556e-03,\n",
+       "                        1.31595219e-02,  1.39163062e-03, -3.51439044e-03,\n",
+       "                       -4.80555138e-03,  1.24805709e-02,  4.39498993e-03],\n",
+       "                      [-6.46104245e-03, -1.21651953e-02,  4.77740867e-03,\n",
+       "                        1.86753627e-02,  6.51393831e-03,  5.62973600e-03,\n",
+       "                       -8.28108564e-03, -4.60683648e-03, -2.26973137e-03,\n",
+       "                        1.69612304e-03,  1.37645304e-02,  4.08384204e-03],\n",
+       "                      [ 1.00966161e-02,  4.48917999e-04, -7.04559498e-03,\n",
+       "                        8.03261995e-03, -8.51394236e-03, -1.22877944e-03,\n",
+       "                        1.14519382e-02,  1.36096608e-02,  1.72907033e-03,\n",
+       "                        7.85259437e-03,  1.05255041e-02,  8.69190600e-03],\n",
+       "                      [-8.03734455e-03, -1.39566569e-03,  2.11605406e-03,\n",
+       "                       -1.92271248e-02,  6.85958471e-03,  4.88640182e-03,\n",
+       "                       -1.38192775e-03, -1.90305218e-04,  4.97502321e-03,\n",
+       "                       -2.50085886e-03, -7.32155377e-03, -1.67938080e-02]],\n",
+       "              \n",
+       "                     [[ 1.62638456e-03,  2.68377247e-03,  3.17260344e-03,\n",
+       "                        5.79241151e-03, -7.17955036e-03,  8.01912975e-03,\n",
+       "                       -1.63808875e-02, -9.24083032e-03,  3.45636159e-03,\n",
+       "                       -1.23387324e-02, -7.20368931e-04, -9.56835225e-03],\n",
+       "                      [ 9.82169900e-03,  1.30084464e-02, -8.22803937e-03,\n",
+       "                        6.71537360e-04,  9.21022613e-03,  1.52312005e-02,\n",
+       "                       -5.26927318e-03,  1.06863305e-02,  2.06984673e-03,\n",
+       "                       -3.76264495e-03,  7.69555243e-07, -4.93265106e-04],\n",
+       "                      [ 2.69030291e-03,  1.87809858e-02,  6.67323358e-03,\n",
+       "                       -4.26321942e-03,  4.72564157e-03, -1.31812878e-02,\n",
+       "                       -7.40861241e-03, -2.29317695e-03, -1.57082290e-03,\n",
+       "                       -1.32690351e-02, -1.30699258e-02,  1.92320778e-03],\n",
+       "                      [ 9.12022125e-03, -5.23217348e-03, -2.81146332e-03,\n",
+       "                       -4.00763704e-03,  5.03227348e-03,  5.72717097e-03,\n",
+       "                        2.91952444e-03,  1.11247518e-03,  9.63956481e-05,\n",
+       "                       -4.55610408e-03, -8.37675110e-03,  1.22519284e-02],\n",
+       "                      [-1.25213778e-02,  8.71963392e-04,  5.76882577e-03,\n",
+       "                       -9.85392556e-03,  5.49371168e-03, -1.67311262e-02,\n",
+       "                        5.46998065e-03,  4.39474359e-03,  2.89234682e-03,\n",
+       "                        6.99596014e-03,  6.47728844e-03, -1.53464787e-02],\n",
+       "                      [-1.01970322e-02, -1.51678976e-02,  6.84761163e-03,\n",
+       "                       -1.76049639e-02, -6.48754463e-03, -7.78641377e-04,\n",
+       "                       -1.47116324e-02,  5.12523763e-03, -2.96233199e-03,\n",
+       "                        7.93477241e-03,  1.36973644e-02,  1.22740660e-02],\n",
+       "                      [-3.13485460e-03, -1.59246139e-02, -2.70899059e-03,\n",
+       "                        5.44029754e-03,  7.52424821e-03,  7.31652137e-03,\n",
+       "                        8.10533017e-03, -1.90883912e-02,  5.15720714e-03,\n",
+       "                        3.53280571e-04,  6.17373036e-03,  1.06591405e-03],\n",
+       "                      [-1.56332664e-02,  1.97712099e-04,  2.64872634e-03,\n",
+       "                        3.45370430e-03, -4.22930811e-03,  1.24690169e-02,\n",
+       "                        5.05634700e-04,  1.37720944e-03, -6.16728095e-03,\n",
+       "                       -7.40552146e-04,  1.39584523e-02, -7.06139440e-03],\n",
+       "                      [ 9.77421529e-04,  3.80252837e-03, -7.89496861e-03,\n",
+       "                       -1.29530979e-02,  1.14574879e-02, -2.45792069e-03,\n",
+       "                        3.06926225e-03,  4.14119754e-03,  8.37595493e-04,\n",
+       "                       -6.71465555e-03,  1.04225632e-02,  8.42171349e-03],\n",
+       "                      [ 1.56976059e-02, -4.26411582e-03, -1.29620070e-02,\n",
+       "                        1.14640398e-02, -1.17234429e-02, -2.09121429e-03,\n",
+       "                        5.49160130e-03,  9.51116718e-03, -2.61860876e-03,\n",
+       "                        1.29721547e-03,  5.72805619e-03, -1.54486364e-02],\n",
+       "                      [-3.25736636e-03,  1.26759680e-02,  1.27404844e-02,\n",
+       "                        1.17001981e-02, -1.16444677e-02, -9.64581780e-03,\n",
+       "                       -2.40927562e-03, -5.55342529e-03,  9.27424431e-03,\n",
+       "                       -1.71160791e-04,  1.56472288e-02, -6.92155631e-03],\n",
+       "                      [ 7.27083022e-03, -4.46589151e-03,  1.09822885e-03,\n",
+       "                        2.19783024e-03, -8.46979953e-03, -1.37587897e-02,\n",
+       "                        8.10799282e-03, -7.17377802e-03,  8.80086981e-03,\n",
+       "                       -7.99593702e-03,  6.07788330e-03, -7.93825951e-04],\n",
+       "                      [ 1.49642804e-03, -1.11999689e-02,  4.39703232e-03,\n",
+       "                        4.85239923e-03,  1.54058973e-03, -1.47980507e-02,\n",
+       "                       -6.85563916e-03,  6.63761189e-03, -1.56310081e-04,\n",
+       "                       -6.49932865e-03,  3.30587942e-03, -1.08573148e-02],\n",
+       "                      [-2.20668572e-03,  4.14557988e-03, -1.93234999e-02,\n",
+       "                       -5.82999643e-03,  3.43196769e-03,  5.27025107e-03,\n",
+       "                        8.35015997e-03, -4.63553797e-03, -6.61056815e-03,\n",
+       "                       -3.66679509e-03,  4.02782438e-03, -3.52020166e-03],\n",
+       "                      [ 6.47542719e-03,  9.46311373e-03, -5.95815713e-03,\n",
+       "                       -3.98951210e-03, -1.26922242e-02, -8.83757137e-04,\n",
+       "                       -5.64072188e-03,  1.16748745e-02,  2.87583284e-03,\n",
+       "                       -2.04839162e-03, -9.87775158e-03,  8.34393501e-03],\n",
+       "                      [-5.55553939e-03, -2.07615201e-03, -5.13571315e-03,\n",
+       "                       -1.45472540e-02, -1.17446017e-02, -1.51618780e-03,\n",
+       "                       -2.92225089e-03, -1.33080781e-02, -6.99464139e-03,\n",
+       "                       -1.41988527e-02, -1.21150836e-02,  1.95427015e-02]]],\n",
+       "                    dtype=float32)>\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "            (ff): TFXLNetFeedForward(\n",
+       "              (layer_norm): LayerNormalization(\n",
+       "                (axis): List(\n",
+       "                  (0): 2\n",
+       "                )\n",
+       "                (gamma): <tf.Variable 'transformer/layer_._1/ff/layer_norm/gamma:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([1.0242676 , 1.0201554 , 0.981655  , 1.022025  , 1.007073  ,\n",
+       "                       1.045315  , 1.0340022 , 1.0059034 , 0.99349135, 1.0217655 ,\n",
+       "                       1.0187205 , 1.025378  , 0.994724  , 1.0449401 , 0.9978945 ,\n",
+       "                       0.9911819 , 1.0020549 , 0.9941773 , 1.0036273 , 1.0188001 ,\n",
+       "                       1.0051787 , 1.1197566 , 1.02651   , 1.0183053 , 0.98811615,\n",
+       "                       0.99960953, 0.9662069 , 1.023346  , 1.0210128 , 1.0216892 ,\n",
+       "                       0.9806572 , 1.0309644 , 1.0199112 , 1.0103893 , 0.9986699 ,\n",
+       "                       1.0303093 , 1.0149937 , 1.0205405 , 1.0189662 , 0.9963332 ,\n",
+       "                       1.0298607 , 1.0065924 , 1.0308235 , 1.0236278 , 1.0338595 ,\n",
+       "                       0.9944997 , 1.0148902 , 1.0015576 , 1.0081712 , 1.0300711 ,\n",
+       "                       1.0326444 , 0.9802065 , 1.031543  , 1.0039631 , 1.025484  ,\n",
+       "                       1.0000758 , 0.9787232 , 0.99785537, 1.0325978 , 0.9884796 ,\n",
+       "                       1.018895  , 0.98055667, 1.0263902 , 1.0205623 , 1.0014325 ,\n",
+       "                       1.0014066 , 0.98294795, 1.0587208 , 1.0157356 , 1.0120552 ,\n",
+       "                       1.0324315 , 1.0007839 , 0.99985874, 1.0201912 , 1.0071391 ,\n",
+       "                       1.00749   , 0.9991882 , 1.0052526 , 0.9652451 , 1.0244923 ,\n",
+       "                       1.0113801 , 0.9739409 , 0.9995484 , 1.0089414 , 1.0357728 ,\n",
+       "                       1.0092472 , 1.0074127 , 0.99813294, 1.0280186 , 0.99566907,\n",
+       "                       1.033792  , 0.99090743, 0.98742676, 1.00218   , 0.9944762 ,\n",
+       "                       1.0180073 , 1.0204257 , 0.9978386 , 1.0030422 , 1.0376201 ,\n",
+       "                       1.0196778 , 1.0020446 , 0.9946544 , 1.0287017 , 1.0023233 ,\n",
+       "                       1.0151851 , 1.0085427 , 1.0258116 , 1.0106041 , 0.9923284 ,\n",
+       "                       1.0228347 , 1.0039704 , 0.99091953, 0.9823107 , 1.016947  ,\n",
+       "                       1.0215237 , 1.0077496 , 1.0370032 , 0.9993619 , 1.0059168 ,\n",
+       "                       0.9826532 , 1.0285178 , 1.0367659 , 1.0070248 , 1.0034032 ,\n",
+       "                       1.0442673 , 0.99493504, 1.004249  , 1.0280426 , 1.0017502 ,\n",
+       "                       0.988515  , 0.9967804 , 1.0113221 , 1.0154219 , 1.0005659 ,\n",
+       "                       1.0015084 , 0.99482644, 1.0037222 , 1.009357  , 1.0022448 ,\n",
+       "                       0.9883776 , 1.0405829 , 1.0310917 , 0.9933524 , 1.0433357 ,\n",
+       "                       0.9818653 , 1.0083051 , 1.0214539 , 0.9923552 , 1.0301536 ,\n",
+       "                       1.0080968 , 0.9818375 , 0.9923027 , 1.0172874 , 0.98352754,\n",
+       "                       1.0107327 , 1.0151389 , 1.0274394 , 0.983884  , 1.0131593 ,\n",
+       "                       0.99889815, 1.0262815 , 0.96433216, 1.0211636 , 1.0312902 ,\n",
+       "                       1.0047783 , 0.9924638 , 1.0092816 , 0.9730608 , 0.9828258 ,\n",
+       "                       1.0578774 , 1.0200232 , 0.98963594, 0.9977363 , 1.0138032 ,\n",
+       "                       0.9713009 , 1.0304941 , 1.0180733 , 1.0288314 , 0.9973552 ,\n",
+       "                       1.0352954 , 1.0003406 , 0.98862803, 1.0030655 , 0.9941499 ,\n",
+       "                       1.0280615 , 1.0016365 , 1.0180489 , 1.0040277 , 0.9607358 ,\n",
+       "                       1.0037141 , 1.0396017 ], dtype=float32)>\n",
+       "                (beta): <tf.Variable 'transformer/layer_._1/ff/layer_norm/beta:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([ 3.43603594e-03,  2.67952736e-02, -3.19796521e-03,  2.77959052e-02,\n",
+       "                       -2.27564160e-05,  3.00053079e-02,  4.48617749e-02,  1.97070669e-02,\n",
+       "                        1.02396915e-02,  1.72215980e-02, -2.75892112e-03, -2.48206849e-03,\n",
+       "                        2.81982850e-02, -1.42260175e-02, -5.90529153e-03,  1.90874767e-02,\n",
+       "                       -2.45346106e-03,  9.29297972e-03,  4.25612368e-03, -1.09480857e-03,\n",
+       "                       -9.13006626e-03,  9.24918726e-02,  2.37285383e-02,  2.87201833e-02,\n",
+       "                       -1.14277247e-02,  1.90680362e-02, -5.39551210e-03,  4.02982607e-02,\n",
+       "                       -2.37562824e-02, -1.89014245e-02,  6.41179970e-03, -8.68414938e-02,\n",
+       "                       -1.77674480e-02, -1.51537284e-02, -3.89129203e-03,  8.26284010e-03,\n",
+       "                        3.10518011e-03,  4.06105816e-03,  2.47969031e-02,  2.05240212e-03,\n",
+       "                        3.35611892e-03,  3.25422660e-02, -3.05853598e-02, -4.77116788e-03,\n",
+       "                        3.65033038e-02,  1.88807324e-02,  2.03111116e-02, -8.56510364e-03,\n",
+       "                        2.65865661e-02,  1.14510898e-02,  1.09779397e-02,  2.67214663e-02,\n",
+       "                       -4.07271273e-03, -2.48218258e-03,  1.46750696e-02,  1.35427015e-02,\n",
+       "                       -4.20185179e-03, -2.13467292e-02, -2.53253579e-02, -5.92954690e-03,\n",
+       "                        1.69605445e-02, -1.05276778e-02,  4.37114276e-02, -1.17301363e-02,\n",
+       "                        2.32506916e-03, -1.35039715e-02, -2.17513070e-02, -3.11144497e-02,\n",
+       "                       -1.43129388e-02, -1.83722116e-02, -1.85610689e-02, -1.80336367e-02,\n",
+       "                       -2.43042596e-02, -1.66123174e-02, -2.11378951e-02, -7.68155232e-03,\n",
+       "                       -2.80298945e-02, -1.23204431e-02, -7.89987575e-03, -3.82007994e-02,\n",
+       "                       -1.71284825e-02,  1.24480464e-02,  2.00545415e-02, -2.08343454e-02,\n",
+       "                        1.72695480e-02,  2.07619276e-02,  2.32151970e-02,  1.25586363e-02,\n",
+       "                        1.58736091e-02, -1.25755509e-03, -2.24005152e-02, -1.52119324e-02,\n",
+       "                       -1.03766266e-02,  1.39645461e-04,  2.10134406e-02, -3.91801484e-02,\n",
+       "                       -1.45232119e-02,  7.89888389e-03,  1.21645015e-02, -2.37555783e-02,\n",
+       "                       -5.84158637e-02,  1.74354929e-02,  1.84537917e-02,  2.19647903e-02,\n",
+       "                        2.39719935e-02,  4.19057608e-02,  1.49248559e-02,  2.69626584e-02,\n",
+       "                        2.89687188e-03, -1.89197827e-02, -3.71705405e-02, -2.37737875e-02,\n",
+       "                       -1.55493245e-02,  2.42294502e-02,  2.57444680e-02,  6.11581467e-03,\n",
+       "                       -2.08301488e-02,  1.96516458e-02, -1.59827378e-02, -8.61831009e-03,\n",
+       "                       -8.13416112e-03, -3.82699817e-02, -3.71116959e-02,  1.84831508e-02,\n",
+       "                        2.84379604e-03,  2.33847219e-02,  6.22194773e-03,  1.49291959e-02,\n",
+       "                       -1.83297582e-02,  1.81909986e-02,  2.15157811e-02, -1.39271868e-02,\n",
+       "                       -2.89638322e-02,  1.10881520e-03,  2.82157250e-02,  1.69136934e-02,\n",
+       "                       -8.84730276e-03,  1.59577336e-02,  2.03611460e-02, -1.65258385e-02,\n",
+       "                        1.78473722e-02, -2.39159130e-02, -1.36998538e-02, -1.71729792e-02,\n",
+       "                       -8.58519524e-02,  5.03670378e-03,  2.72648726e-02, -3.53694940e-03,\n",
+       "                       -3.04428395e-02,  1.27652185e-02, -2.31311023e-02, -2.26891320e-02,\n",
+       "                       -1.19382478e-02,  2.88316160e-02,  1.76204331e-02,  8.55787750e-03,\n",
+       "                        7.90143199e-03,  1.71625689e-02, -2.07985323e-02, -3.48045398e-03,\n",
+       "                        5.18445577e-03,  2.67593451e-02, -1.53288562e-02,  1.13617973e-02,\n",
+       "                        2.61260439e-02,  2.27058493e-02, -9.55688581e-03,  1.24905221e-02,\n",
+       "                        3.68422344e-02, -1.28372628e-02, -3.99196036e-02, -5.12610860e-02,\n",
+       "                        4.03299890e-02, -3.13749239e-02, -4.93869931e-03, -2.10509915e-02,\n",
+       "                       -3.29953581e-02, -5.14064655e-02, -3.82981487e-02, -1.65885733e-03,\n",
+       "                       -2.91457716e-02,  9.37298220e-03, -1.69041883e-02,  3.74249443e-02,\n",
+       "                       -1.32612139e-02,  3.82047258e-02,  8.21203087e-03, -2.99716964e-02,\n",
+       "                        1.45867635e-02,  1.26736856e-03, -8.91199056e-03, -6.25200244e-03],\n",
+       "                      dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (layer_1): Dense(\n",
+       "                768, activation=linear, use_bias=True\n",
+       "                (kernel): <tf.Variable 'transformer/layer_._1/ff/layer_1/kernel:0' shape=(192, 768) dtype=float32, numpy=\n",
+       "                array([[-0.01936796, -0.01727297,  0.02798706, ..., -0.00043308,\n",
+       "                        -0.01548608,  0.01052339],\n",
+       "                       [ 0.0217678 ,  0.00543513, -0.0440179 , ...,  0.01921584,\n",
+       "                        -0.00281928, -0.00167585],\n",
+       "                       [-0.02762845,  0.01751809, -0.01518949, ..., -0.00809754,\n",
+       "                        -0.03134314, -0.02594296],\n",
+       "                       ...,\n",
+       "                       [-0.04703904, -0.06811567, -0.04486849, ...,  0.00712049,\n",
+       "                         0.04625429, -0.03096718],\n",
+       "                       [ 0.01649503, -0.0038292 ,  0.03609787, ...,  0.0124039 ,\n",
+       "                        -0.01003346, -0.00525536],\n",
+       "                       [-0.01172524, -0.03267535, -0.0185673 , ...,  0.03373903,\n",
+       "                        -0.01304786, -0.035545  ]], dtype=float32)>\n",
+       "                (bias): <tf.Variable 'transformer/layer_._1/ff/layer_1/bias:0' shape=(768,) dtype=float32, numpy=\n",
+       "                array([-2.02730969e-02, -1.72163453e-02, -3.96374911e-02,  9.25439177e-04,\n",
+       "                       -4.36484031e-02, -2.00147685e-02, -1.71882827e-02, -3.47368903e-02,\n",
+       "                        5.66399482e-04, -3.84117700e-02, -9.10965260e-03,  2.74756015e-03,\n",
+       "                       -1.80025201e-03,  9.61851515e-03,  4.73078527e-03,  4.82578995e-03,\n",
+       "                       -1.18976750e-03, -3.83619703e-02, -1.34952469e-02, -1.35540264e-02,\n",
+       "                       -1.20289333e-03, -6.07461929e-02, -2.38492060e-02, -7.87904486e-04,\n",
+       "                        9.72030219e-03, -2.31057182e-02,  1.04524931e-02,  6.30092947e-03,\n",
+       "                       -5.97665533e-02, -1.25674810e-03,  7.68401567e-03, -2.56892614e-04,\n",
+       "                        4.59111482e-03, -1.09384181e-02,  4.45268257e-03, -1.41052697e-02,\n",
+       "                       -1.63422208e-02,  4.66172909e-03,  8.07574391e-03, -4.54686359e-02,\n",
+       "                        1.60025507e-02, -9.59658623e-03,  8.28578882e-03, -2.48896070e-02,\n",
+       "                       -2.15898622e-02, -1.55484192e-02,  5.97327203e-03, -2.75620334e-02,\n",
+       "                       -4.66338173e-02, -3.95550160e-07,  8.05350486e-04, -2.27461364e-02,\n",
+       "                       -1.24393404e-02,  8.30512773e-03, -3.38091608e-03, -5.77073358e-03,\n",
+       "                       -2.96839513e-02, -4.13544625e-02,  2.24601105e-03, -1.36652626e-02,\n",
+       "                       -1.96060464e-02, -3.98634113e-02, -1.41905267e-02,  1.77390352e-02,\n",
+       "                       -1.33622885e-02, -6.83417497e-03,  3.87142715e-03, -1.46481190e-02,\n",
+       "                       -7.40471156e-03, -2.74524000e-02, -2.04818901e-02, -6.72868500e-03,\n",
+       "                       -2.39155442e-02, -4.22676764e-02, -1.39555512e-02, -5.67868992e-04,\n",
+       "                       -3.41841839e-02,  2.03465912e-02,  4.76055406e-03, -6.00655982e-03,\n",
+       "                        1.05688032e-02, -4.46136780e-02, -5.22093195e-03, -3.42974998e-02,\n",
+       "                       -4.84602014e-03, -1.54305240e-02, -2.88315918e-02, -2.42710151e-02,\n",
+       "                        6.89190486e-03, -1.06102470e-02,  1.16604185e-02, -6.36164285e-03,\n",
+       "                        1.76626742e-02, -2.76263505e-02, -1.81746799e-02,  1.68347117e-02,\n",
+       "                       -2.11666878e-02, -2.66354941e-02, -1.48490481e-02,  4.81047761e-03,\n",
+       "                        4.19533439e-03, -7.29140267e-03,  5.83578832e-03,  1.83147267e-02,\n",
+       "                       -2.89011337e-02,  1.99224800e-02,  2.33192053e-02, -1.17651206e-02,\n",
+       "                       -9.48132947e-03, -3.80671844e-02, -6.97254250e-03, -5.80234174e-03,\n",
+       "                       -2.95534590e-03, -1.68973021e-02,  6.81369333e-03, -2.98659261e-02,\n",
+       "                       -4.21552286e-02, -6.81099389e-03, -8.78395606e-03, -1.27584357e-02,\n",
+       "                       -2.28257608e-02,  1.10510215e-02, -9.74175520e-03, -5.33285458e-03,\n",
+       "                        2.30560894e-03,  1.34414751e-02, -1.65234245e-02, -3.12085904e-04,\n",
+       "                       -2.15259232e-02,  2.44667870e-03, -4.03293176e-04, -2.27069166e-02,\n",
+       "                       -2.79640649e-02, -1.86381284e-02, -2.70746183e-02, -3.35429721e-02,\n",
+       "                       -1.51718426e-02, -8.92117992e-03,  1.50545919e-02, -1.28146186e-02,\n",
+       "                       -2.84793153e-02,  1.30716702e-02,  1.73362158e-02,  1.04466139e-03,\n",
+       "                       -1.12203090e-02, -5.85076399e-02, -4.21808520e-03,  1.34438546e-02,\n",
+       "                       -1.10811321e-03,  1.77231431e-02, -2.33806157e-03,  2.92738043e-02,\n",
+       "                       -8.34393501e-03,  4.49858513e-03, -9.37382691e-03, -9.02433135e-03,\n",
+       "                       -8.02938081e-03, -1.90042872e-02, -3.04585975e-02, -3.98852862e-02,\n",
+       "                       -4.17789333e-02, -1.66377705e-02, -9.60725360e-03, -1.49319484e-03,\n",
+       "                        1.98501945e-02, -1.57562755e-02, -5.30303158e-02, -6.36109523e-03,\n",
+       "                       -2.39910167e-02,  1.18866307e-03, -1.68753341e-02, -8.01526383e-02,\n",
+       "                       -4.10544388e-02,  7.16660218e-03, -5.72163565e-03, -1.77054796e-02,\n",
+       "                       -3.42064979e-03, -1.32517936e-02,  2.85892412e-02,  2.75228405e-03,\n",
+       "                       -1.05867181e-02, -8.94123688e-03, -7.82309752e-03, -1.23709049e-02,\n",
+       "                        3.22665437e-03,  8.23641941e-03, -1.72391906e-02,  4.11677780e-03,\n",
+       "                       -1.57788415e-02,  2.83235274e-02,  1.20825451e-02,  9.10627469e-03,\n",
+       "                       -1.31589000e-03, -3.31720822e-02, -3.95477414e-02, -1.60696432e-02,\n",
+       "                        1.00599974e-03, -4.13404442e-02,  9.88238957e-03, -2.03417242e-02,\n",
+       "                       -2.17924453e-03, -2.85398886e-02,  5.66473557e-03,  1.53433271e-02,\n",
+       "                        1.60060227e-02, -1.68967023e-02, -2.83081476e-02, -2.64291056e-02,\n",
+       "                       -1.57325342e-02,  9.99413617e-03, -1.07601415e-02, -4.59073186e-02,\n",
+       "                       -7.32598477e-04,  2.11031605e-02, -2.77611818e-02,  1.44040724e-02,\n",
+       "                       -2.24381872e-02, -1.91908900e-03, -4.10638936e-02,  4.44361009e-04,\n",
+       "                       -2.92663351e-02,  2.04936545e-02,  6.32207748e-03, -3.43109742e-02,\n",
+       "                       -1.34509047e-02, -5.81239350e-02,  1.67944189e-02, -2.27752663e-02,\n",
+       "                        5.27992845e-03, -2.44366862e-02, -3.37892435e-02, -8.63631908e-03,\n",
+       "                       -3.40979779e-03, -2.28613541e-02,  1.03544090e-02, -1.03079081e-02,\n",
+       "                       -2.27480102e-02, -8.28197040e-03,  3.05404793e-03,  6.86701527e-03,\n",
+       "                        1.70611078e-03, -6.15844736e-04, -2.25477908e-02, -1.91879030e-02,\n",
+       "                       -1.09220268e-02, -1.05120335e-02,  7.52746407e-03, -6.16745558e-03,\n",
+       "                       -4.02863923e-04,  5.69625199e-03, -4.14612219e-02,  6.82809995e-03,\n",
+       "                        5.11092553e-03, -3.99447940e-02, -1.39821991e-02, -6.75095897e-03,\n",
+       "                       -1.76455695e-02, -3.17825340e-02, -2.47324333e-02, -1.16888667e-02,\n",
+       "                       -4.36839722e-02, -1.80751383e-02, -3.45760658e-02, -1.67294051e-02,\n",
+       "                        1.48514751e-02, -1.07286517e-02,  1.06422873e-02, -4.75126877e-03,\n",
+       "                       -1.78854894e-02, -1.26997447e-02,  1.95242390e-02,  8.47190060e-03,\n",
+       "                       -1.91945845e-04, -9.36024543e-03, -2.00828295e-02, -1.21161118e-02,\n",
+       "                       -4.84504132e-03,  1.75416321e-02, -1.37205329e-02, -2.43347771e-02,\n",
+       "                        4.87131439e-03,  5.27615938e-03, -1.47305001e-02, -2.15904955e-02,\n",
+       "                       -2.33575199e-02, -6.61554048e-03, -2.56092777e-03, -1.26826074e-02,\n",
+       "                        6.26714528e-03,  2.45168898e-03,  1.62922833e-02, -2.74149259e-03,\n",
+       "                       -5.68998680e-02,  1.56744905e-02, -9.12281312e-03,  1.78000834e-02,\n",
+       "                       -3.62905003e-02,  7.11219618e-03, -8.98136874e-04, -1.32871466e-02,\n",
+       "                       -1.43234096e-02,  2.74861394e-03, -4.30019433e-03, -3.29636261e-02,\n",
+       "                       -9.63856187e-03, -1.89240500e-02, -2.61130854e-02, -4.91014943e-02,\n",
+       "                       -1.34954117e-02, -2.40241829e-02, -3.60400975e-03,  8.44172947e-03,\n",
+       "                        2.74142437e-03,  4.92954510e-04,  8.39409605e-03, -1.02594271e-02,\n",
+       "                        1.24602579e-02, -1.07601611e-02, -1.88089907e-02, -6.94376091e-03,\n",
+       "                        1.07152490e-02, -2.51998808e-02, -3.05384048e-04, -2.22030841e-02,\n",
+       "                        2.27522459e-02,  4.93783038e-03,  4.13542788e-04, -5.84202865e-03,\n",
+       "                       -3.55486609e-02,  6.57991180e-03,  2.02657469e-02, -8.46680067e-03,\n",
+       "                        1.85093528e-03, -4.74362914e-03,  1.63280349e-02, -1.74182784e-02,\n",
+       "                        1.33596628e-03,  2.01811492e-02, -2.63537467e-02, -3.98929492e-02,\n",
+       "                        1.01095112e-03,  1.42210315e-03, -1.06787616e-02, -5.45299938e-03,\n",
+       "                       -4.68486287e-02, -1.30118029e-02, -2.19423864e-02, -1.33587964e-04,\n",
+       "                        3.92357528e-04, -8.55443031e-02, -1.89563315e-02, -1.14462031e-02,\n",
+       "                       -6.67757262e-03, -1.09370230e-02, -6.51147170e-03,  2.61508133e-02,\n",
+       "                       -3.04248054e-02, -1.70873217e-02, -3.45333070e-02,  1.14384610e-02,\n",
+       "                        3.57219647e-03,  2.35397834e-03, -1.16945207e-02,  7.03913299e-03,\n",
+       "                       -2.15787832e-02, -2.59910841e-02,  7.86962267e-03, -1.90627389e-02,\n",
+       "                       -9.06899385e-03, -1.13378987e-02, -1.59990210e-02, -2.40502376e-02,\n",
+       "                        7.58200511e-03, -2.38405541e-03, -1.56799629e-02, -6.49033580e-03,\n",
+       "                       -1.45801324e-02, -1.07867159e-02,  5.38399536e-03, -2.63710693e-02,\n",
+       "                        9.06795356e-03, -2.23380048e-02,  6.40973798e-04, -2.08435990e-02,\n",
+       "                       -3.54930665e-03, -2.61892695e-02, -2.43403837e-02,  1.45022171e-02,\n",
+       "                       -1.11294333e-02,  2.22975109e-02, -2.88649276e-02,  8.83427728e-03,\n",
+       "                       -1.71264182e-04, -2.00522859e-02, -2.22262572e-02, -2.64064576e-02,\n",
+       "                       -3.25897448e-02,  3.27128638e-03, -2.39347070e-02, -4.62485291e-02,\n",
+       "                       -2.10695155e-02,  1.28054693e-02, -7.54281729e-02,  4.13044542e-03,\n",
+       "                       -3.69404964e-02, -1.50013510e-02, -3.06449854e-03, -2.17315014e-02,\n",
+       "                        1.08699258e-02, -6.91265427e-03, -2.96049239e-03, -3.04010976e-02,\n",
+       "                       -1.17014181e-02, -1.68799460e-02,  1.65505484e-02, -2.11988632e-02,\n",
+       "                       -5.35056321e-03, -1.93487015e-02, -2.19009928e-02,  9.98965185e-03,\n",
+       "                       -4.48127203e-02, -1.70589089e-02, -1.49650453e-02, -3.53463888e-02,\n",
+       "                        1.08261164e-02,  8.66322126e-03,  1.09988675e-02,  5.07105980e-03,\n",
+       "                       -1.09785991e-02, -8.24725349e-03, -7.05766352e-03, -2.93953102e-02,\n",
+       "                       -1.99896973e-02,  1.87788866e-02,  7.44108669e-03, -1.36157889e-02,\n",
+       "                       -2.46517863e-02, -5.10792900e-03, -3.37912096e-03, -5.00590242e-02,\n",
+       "                       -3.30806077e-02,  3.06895375e-03, -1.39247607e-02, -1.32991076e-02,\n",
+       "                       -2.84706913e-02, -2.39872653e-02, -1.41443796e-02, -2.87217030e-04,\n",
+       "                       -5.37853176e-03, -2.31699413e-03,  1.24481134e-02,  2.81007700e-02,\n",
+       "                        1.63598135e-02, -5.36525249e-03,  4.11947863e-03, -8.87962710e-03,\n",
+       "                        7.01108202e-03, -2.79064216e-02,  1.86030604e-02, -1.84345972e-02,\n",
+       "                        9.82684270e-03, -3.05190459e-02, -1.66466013e-02,  7.72549713e-04,\n",
+       "                        1.54814508e-03,  3.96430143e-04,  3.52570880e-03, -2.07410306e-02,\n",
+       "                       -4.09877440e-03,  2.37259106e-03, -2.46705618e-02,  6.25023479e-03,\n",
+       "                       -1.99402794e-02,  1.34928676e-03,  1.01430779e-02, -3.21491691e-03,\n",
+       "                        6.11917814e-03, -1.14797940e-02, -6.87398063e-03,  1.76550762e-04,\n",
+       "                        1.37082450e-02,  1.26474327e-03,  1.39204646e-02, -2.22524889e-02,\n",
+       "                        8.97681457e-05,  1.88891031e-02, -1.98963750e-02, -2.37500835e-02,\n",
+       "                       -1.45162186e-02, -1.76579468e-02, -4.85126860e-03,  2.73216609e-03,\n",
+       "                       -2.76307054e-02,  1.23566557e-02,  7.31245056e-03,  1.25627527e-02,\n",
+       "                       -5.04276110e-03, -1.19638499e-02, -1.18406191e-02,  6.97168894e-03,\n",
+       "                        1.20525099e-02, -2.73218355e-03, -4.18124301e-03, -1.69247333e-02,\n",
+       "                       -3.16366227e-03, -4.72069159e-03, -3.73938009e-02, -1.98564995e-02,\n",
+       "                       -2.44545266e-02, -2.88034491e-02,  9.98098217e-03,  5.21743670e-03,\n",
+       "                        1.93960182e-02,  8.70525651e-03, -2.18096245e-02, -1.38377806e-03,\n",
+       "                       -4.20307964e-02, -2.30455790e-02, -2.23685917e-03, -3.45625132e-02,\n",
+       "                        2.33609974e-02,  8.25913530e-03, -6.18917309e-03, -2.46669389e-02,\n",
+       "                       -1.78897451e-03,  3.98437865e-03, -8.35600216e-03,  5.77223767e-03,\n",
+       "                       -2.84034549e-03, -3.58642917e-03, -6.18770486e-03, -8.90398864e-03,\n",
+       "                        5.72477176e-04,  1.38246790e-02, -1.21220071e-02, -1.20190228e-03,\n",
+       "                        9.34968051e-03, -2.07452327e-02, -3.20062190e-02, -2.53834538e-02,\n",
+       "                       -1.34317875e-02, -1.97784398e-02, -4.15071892e-03, -2.73645706e-02,\n",
+       "                       -1.25424266e-02,  7.18894880e-03, -2.15254407e-02, -2.59364340e-02,\n",
+       "                       -3.32168043e-02, -5.32375872e-02,  4.73892782e-03, -3.15329432e-02,\n",
+       "                        1.17336446e-03,  1.20503269e-02,  8.81805178e-03, -1.79140083e-02,\n",
+       "                       -6.54526567e-03,  1.82500295e-03,  1.05281603e-02,  1.61723625e-02,\n",
+       "                        2.05972083e-02, -1.97964087e-02,  6.55350232e-06,  1.87991858e-02,\n",
+       "                        2.06013061e-02, -1.17481954e-03,  5.10920864e-03, -6.09265687e-03,\n",
+       "                       -1.72222387e-02, -7.33022811e-04, -1.90670881e-02, -3.63333821e-02,\n",
+       "                       -1.54390512e-02,  7.49356346e-03,  2.69417036e-02, -1.88536178e-02,\n",
+       "                        9.53572243e-03, -8.18822626e-03,  2.66291890e-02, -3.50175761e-02,\n",
+       "                       -1.75517949e-03, -3.63707147e-03, -2.96578407e-02,  4.85087978e-03,\n",
+       "                        2.29683891e-02, -1.07311681e-02, -5.93151152e-03, -6.43233676e-03,\n",
+       "                       -9.02256090e-03,  5.71041647e-03, -1.11940848e-02, -7.63751753e-03,\n",
+       "                       -2.96609430e-03, -1.74308917e-03, -5.73345507e-03, -4.00085747e-02,\n",
+       "                       -1.08280014e-02,  2.45840847e-03, -1.65827647e-02, -3.04641202e-02,\n",
+       "                       -1.91303175e-02, -6.34902045e-02, -2.71443985e-02, -8.48556217e-03,\n",
+       "                       -5.78744244e-03, -1.78982951e-02, -1.84806883e-02, -1.90523081e-02,\n",
+       "                        4.01735492e-03,  2.23109615e-03, -1.74209196e-02,  1.19515928e-03,\n",
+       "                        1.03071714e-02, -8.02234039e-02,  1.24981962e-02, -1.32194627e-02,\n",
+       "                       -6.72617368e-03,  2.29350757e-03,  2.68838392e-03, -1.07558258e-02,\n",
+       "                       -7.45773548e-03, -3.24521516e-03, -3.60023528e-02, -5.36000133e-02,\n",
+       "                        5.89652080e-03, -3.65445241e-02,  1.57442577e-02, -1.11889504e-02,\n",
+       "                        2.01796740e-02, -1.89142656e-02,  3.69664375e-03, -9.64444969e-03,\n",
+       "                       -1.99025124e-02, -5.27735911e-02, -6.18071482e-03,  1.96429584e-02,\n",
+       "                        9.04919766e-03, -2.44172849e-03,  2.42983419e-02,  7.77297560e-03,\n",
+       "                        1.86291113e-02,  1.43718664e-02,  4.88520274e-03, -1.74652059e-02,\n",
+       "                       -3.91945206e-02, -2.85394844e-02, -6.52817870e-03, -4.53838333e-03,\n",
+       "                        5.24704205e-03, -3.72513458e-02, -2.26468854e-02,  2.32792087e-03,\n",
+       "                        1.88641832e-03,  5.58300922e-03, -9.78803448e-03,  2.33869310e-02,\n",
+       "                       -4.18912135e-02, -3.19908485e-02, -8.90049245e-03, -1.94256715e-02,\n",
+       "                        6.74062036e-03, -1.12374388e-02,  1.40834944e-02, -1.58932773e-04,\n",
+       "                       -3.85522889e-03, -2.52304543e-02,  1.09773213e-02, -3.49628739e-02,\n",
+       "                        2.02956498e-02, -1.83961205e-02, -9.16141830e-03, -6.89430069e-03,\n",
+       "                       -1.82250026e-03,  3.91215971e-03, -3.02790329e-02,  4.85412357e-03,\n",
+       "                        5.21492213e-03, -2.76922695e-02,  7.46305939e-03,  4.57040616e-04,\n",
+       "                       -2.80272998e-02,  5.70539059e-03, -2.35484336e-02,  5.97323524e-03,\n",
+       "                       -3.80400121e-02, -2.14953162e-03, -5.47003699e-03, -2.85517797e-03,\n",
+       "                        1.21851694e-02,  1.71587861e-03, -2.77664978e-02, -2.20162105e-02,\n",
+       "                        8.68351292e-03, -2.04854421e-02,  3.65737732e-03, -4.93340136e-04,\n",
+       "                       -6.58130087e-03,  8.45880434e-03,  9.36099607e-03, -6.69793831e-03,\n",
+       "                       -1.45707000e-02, -1.48070045e-02,  2.04449962e-03,  2.96859490e-03,\n",
+       "                       -2.96394285e-02,  1.08581251e-02, -1.75250992e-02,  1.53381256e-02,\n",
+       "                       -2.64075790e-02,  1.73933804e-02,  6.86512422e-03, -1.24971373e-02,\n",
+       "                        9.37248301e-03, -8.76329548e-04, -2.70201601e-02, -1.37452129e-02,\n",
+       "                       -2.48217899e-02, -2.12847032e-02, -2.02346016e-02,  4.97383205e-03,\n",
+       "                       -1.45821357e-02, -6.21638354e-03,  1.60615034e-02,  8.42541736e-03,\n",
+       "                       -1.73121586e-03,  1.84763055e-02,  1.38618983e-02,  6.79083809e-04,\n",
+       "                       -3.76517028e-02, -5.53824613e-03, -1.61262881e-02,  2.18251087e-02,\n",
+       "                       -1.41914962e-02, -2.67606135e-03, -9.26637370e-03,  1.47592397e-02,\n",
+       "                       -8.86621326e-03,  1.54802157e-02,  3.15189059e-03,  9.82165709e-03,\n",
+       "                        3.27752903e-03,  2.13089865e-02, -2.70583443e-02, -7.42953736e-03,\n",
+       "                       -2.50007659e-02, -1.14361225e-02, -9.81700886e-03, -8.11999850e-03,\n",
+       "                       -1.84244197e-02, -2.75552347e-02, -2.94755609e-03, -6.37403829e-03,\n",
+       "                       -1.25843631e-02, -3.07683572e-02, -3.49259959e-03,  7.75923207e-03,\n",
+       "                        1.38970942e-03, -2.76233349e-02,  6.77595520e-03,  1.63823506e-03,\n",
+       "                        5.47163363e-05, -2.44897380e-02, -6.46863133e-03, -7.09528523e-03,\n",
+       "                       -1.90487560e-02, -1.02440035e-02,  4.92857816e-03, -5.28441332e-02],\n",
+       "                      dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (layer_2): Dense(\n",
+       "                192, activation=linear, use_bias=True\n",
+       "                (kernel): <tf.Variable 'transformer/layer_._1/ff/layer_2/kernel:0' shape=(768, 192) dtype=float32, numpy=\n",
+       "                array([[-0.01873498,  0.02679233, -0.07056118, ...,  0.00398566,\n",
+       "                         0.02154048,  0.01009107],\n",
+       "                       [ 0.0023489 ,  0.03306963, -0.01094123, ..., -0.01874584,\n",
+       "                         0.02311078, -0.03246025],\n",
+       "                       [ 0.01395899, -0.01199064,  0.03589186, ..., -0.00253369,\n",
+       "                         0.00015564,  0.01200298],\n",
+       "                       ...,\n",
+       "                       [-0.0110327 ,  0.01484329, -0.02025447, ..., -0.01528619,\n",
+       "                        -0.00044155, -0.00768675],\n",
+       "                       [-0.00518769, -0.0190341 ,  0.00541804, ..., -0.04019772,\n",
+       "                         0.00462436,  0.00114423],\n",
+       "                       [-0.01649309, -0.022153  ,  0.00116507, ...,  0.00092028,\n",
+       "                         0.0192393 , -0.00191616]], dtype=float32)>\n",
+       "                (bias): <tf.Variable 'transformer/layer_._1/ff/layer_2/bias:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([-0.00875727,  0.00844772, -0.00638411,  0.00979791,  0.00631264,\n",
+       "                        0.01925564,  0.01764304,  0.01935392, -0.00319467,  0.00851334,\n",
+       "                       -0.00302966,  0.0017067 ,  0.01643271,  0.00013498,  0.01369039,\n",
+       "                        0.0075578 , -0.00901533,  0.00556126,  0.00525395,  0.00601836,\n",
+       "                       -0.00113361,  0.06682169,  0.01941927,  0.02516656, -0.00994125,\n",
+       "                        0.01200988, -0.01820031,  0.02928668, -0.02253202, -0.02094638,\n",
+       "                       -0.00215082, -0.04950898, -0.01214268, -0.00775701, -0.00567762,\n",
+       "                        0.00155565, -0.00412368,  0.01876251,  0.01938802,  0.01385835,\n",
+       "                       -0.00753018,  0.01650311, -0.01765283, -0.0175887 ,  0.01734858,\n",
+       "                        0.02780465,  0.01827991, -0.00259388,  0.00857305,  0.00877466,\n",
+       "                        0.01454839,  0.0185861 ,  0.00305506, -0.01850432,  0.00327083,\n",
+       "                        0.01592625, -0.02423782, -0.02307841, -0.02633888, -0.0118603 ,\n",
+       "                        0.00033595, -0.01579602,  0.03260851, -0.01295588,  0.00152569,\n",
+       "                       -0.01920031, -0.02093989, -0.00928893, -0.01716848,  0.00329048,\n",
+       "                       -0.03092022, -0.00813805, -0.02732819, -0.02910862, -0.00923078,\n",
+       "                       -0.02219846, -0.00552739, -0.01209938, -0.01768913, -0.03044659,\n",
+       "                        0.00433539,  0.01937628,  0.02478183, -0.01579314,  0.02210511,\n",
+       "                        0.02426847,  0.03000535,  0.02216269,  0.00996924, -0.01001132,\n",
+       "                       -0.01479168, -0.02210437, -0.01065945, -0.00187033,  0.00778272,\n",
+       "                       -0.03885601, -0.0236426 , -0.0003459 ,  0.00390934, -0.01730723,\n",
+       "                       -0.04346146,  0.00464112,  0.0187731 ,  0.02091447,  0.00887477,\n",
+       "                        0.03617691,  0.01600332,  0.01941076, -0.00550917, -0.02156864,\n",
+       "                       -0.02627692, -0.02292657, -0.0195347 ,  0.00989026,  0.01694178,\n",
+       "                       -0.00581628, -0.01517762,  0.02600943, -0.01791165, -0.00931305,\n",
+       "                       -0.01767998, -0.01953321, -0.0226922 ,  0.02001677, -0.00639939,\n",
+       "                        0.03065447,  0.0072672 ,  0.01034329, -0.01980901,  0.01084015,\n",
+       "                        0.01425455, -0.01764459, -0.02957735, -0.00409907,  0.0226249 ,\n",
+       "                        0.02194628, -0.01227286,  0.01358387,  0.02082218, -0.02336786,\n",
+       "                        0.01717109, -0.01016011, -0.01469659, -0.01017225, -0.05480007,\n",
+       "                        0.00403081,  0.02459577,  0.00297031, -0.01252157,  0.0100858 ,\n",
+       "                       -0.02109952, -0.01984255,  0.0088863 ,  0.02306723,  0.00677673,\n",
+       "                        0.00027088,  0.00272076,  0.01193484, -0.00655524, -0.02220269,\n",
+       "                        0.00476494,  0.02373325, -0.00927185,  0.0072583 ,  0.021671  ,\n",
+       "                        0.00589487, -0.00776884,  0.01278425,  0.024796  , -0.00481928,\n",
+       "                       -0.02029314, -0.03756877,  0.03063949, -0.0084965 ,  0.00194776,\n",
+       "                       -0.02170036, -0.03632088, -0.02481564, -0.02177641,  0.0025987 ,\n",
+       "                       -0.01534427,  0.01370342, -0.0128414 ,  0.02587708, -0.01888825,\n",
+       "                        0.02439466,  0.01731913, -0.00958412,  0.01613715,  0.01427922,\n",
+       "                       -0.01684757, -0.00175023], dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (dropout): Dropout(\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "            (dropout): Dropout(\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "            (_feature_shapes): Dict()\n",
+       "            (_feature_dtypes): Dict()\n",
+       "          )\n",
+       "          (2): TFXLNetLayer(\n",
+       "            (rel_attn): TFXLNetRelativeAttention(\n",
+       "              (layer_norm): LayerNormalization(\n",
+       "                (axis): List(\n",
+       "                  (0): 2\n",
+       "                )\n",
+       "                (gamma): <tf.Variable 'transformer/layer_._2/rel_attn/layer_norm/gamma:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([1.0217174 , 1.0251529 , 1.0009836 , 1.0462228 , 1.0023384 ,\n",
+       "                       1.0702455 , 1.0446848 , 1.0141752 , 1.016957  , 1.033185  ,\n",
+       "                       1.0181712 , 1.0153837 , 0.9992023 , 1.0347466 , 1.0211351 ,\n",
+       "                       1.0018849 , 1.0121537 , 0.99940306, 1.0072032 , 1.0192038 ,\n",
+       "                       1.0209839 , 1.187853  , 1.0392752 , 1.0235384 , 1.0065316 ,\n",
+       "                       1.022949  , 1.0093213 , 1.0211647 , 1.0060023 , 1.0248559 ,\n",
+       "                       1.0059446 , 1.0761709 , 1.0173205 , 1.0236268 , 0.98880196,\n",
+       "                       1.0349165 , 1.0256321 , 1.0104129 , 1.0246964 , 0.9955374 ,\n",
+       "                       1.0396379 , 1.0044645 , 1.028682  , 1.0409732 , 1.0322639 ,\n",
+       "                       1.0058585 , 1.0145588 , 0.99829394, 1.0104554 , 1.0500244 ,\n",
+       "                       1.0286031 , 1.0021374 , 1.0364661 , 0.9966459 , 1.022384  ,\n",
+       "                       1.017586  , 0.98369807, 1.0039334 , 1.0339525 , 1.0041248 ,\n",
+       "                       1.0204359 , 0.98249644, 1.032949  , 1.0197221 , 1.0263952 ,\n",
+       "                       0.9926133 , 0.99735445, 1.0876801 , 1.0224211 , 1.0198096 ,\n",
+       "                       1.0506258 , 1.0010437 , 0.99980325, 1.0300628 , 1.0086097 ,\n",
+       "                       1.0204959 , 1.0012923 , 1.0035007 , 0.9980045 , 1.0441691 ,\n",
+       "                       1.0204487 , 0.9990266 , 0.9966284 , 1.0186629 , 1.0485342 ,\n",
+       "                       1.0253004 , 1.0131625 , 1.0052114 , 1.0252738 , 1.0075058 ,\n",
+       "                       1.0343914 , 1.0002061 , 0.9924983 , 1.0421573 , 1.0040683 ,\n",
+       "                       1.0187975 , 1.0190364 , 1.0011268 , 0.99671876, 1.0547765 ,\n",
+       "                       1.025715  , 1.0177215 , 1.0108784 , 1.0226917 , 1.0155568 ,\n",
+       "                       0.9973636 , 1.0079739 , 1.0572509 , 1.0273353 , 1.0160165 ,\n",
+       "                       1.0249956 , 1.0097992 , 1.0126355 , 0.99393314, 1.0213517 ,\n",
+       "                       1.0287503 , 1.0278797 , 1.0104443 , 1.0232205 , 1.005057  ,\n",
+       "                       0.9942467 , 1.033091  , 1.0228969 , 1.007807  , 1.0081193 ,\n",
+       "                       1.0374564 , 0.9998273 , 1.0164163 , 1.0237519 , 1.0112252 ,\n",
+       "                       1.0251505 , 0.99518573, 1.0173032 , 1.017753  , 1.0192963 ,\n",
+       "                       1.0150547 , 0.99565893, 1.0140896 , 1.003712  , 1.000266  ,\n",
+       "                       1.001154  , 1.0525979 , 1.0441524 , 1.0055293 , 1.0802695 ,\n",
+       "                       1.003204  , 1.0219046 , 1.0287489 , 0.9960544 , 1.0255774 ,\n",
+       "                       1.026497  , 0.98832685, 0.9979249 , 1.0186322 , 1.0093694 ,\n",
+       "                       1.0192312 , 1.0199887 , 1.0398    , 0.9829798 , 1.0415385 ,\n",
+       "                       1.0186274 , 1.0384295 , 0.983487  , 1.0242232 , 1.0270193 ,\n",
+       "                       1.0064057 , 0.9939754 , 1.0075631 , 1.0031563 , 0.99732876,\n",
+       "                       1.0779532 , 1.0452689 , 1.0039006 , 0.98994976, 1.015347  ,\n",
+       "                       0.9903972 , 1.0386693 , 1.0151427 , 1.0464522 , 1.0083725 ,\n",
+       "                       1.038116  , 0.99612683, 1.0135477 , 1.0054603 , 1.0062294 ,\n",
+       "                       1.028863  , 1.0152918 , 1.0330389 , 1.0156182 , 0.9869547 ,\n",
+       "                       1.0048147 , 1.0276642 ], dtype=float32)>\n",
+       "                (beta): <tf.Variable 'transformer/layer_._2/rel_attn/layer_norm/beta:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([ 3.06162308e-03,  1.86115298e-02, -1.31628076e-02,  1.06461560e-02,\n",
+       "                       -4.11694031e-03,  3.30818594e-02,  4.02924716e-02,  6.59284927e-03,\n",
+       "                        3.38024739e-03,  4.59420588e-03,  4.78615239e-03,  6.62528677e-04,\n",
+       "                        6.70902058e-03, -2.52860878e-02, -1.48927094e-02,  4.62446781e-03,\n",
+       "                        6.38968835e-04,  7.71211181e-03,  7.99407065e-03,  1.95953436e-02,\n",
+       "                        7.16714747e-03,  9.20696408e-02,  2.76485197e-02,  5.97401522e-03,\n",
+       "                       -1.40910083e-02,  1.01603949e-02,  6.01712102e-03,  2.28405371e-02,\n",
+       "                       -7.97405839e-03, -1.86992937e-03,  5.27088996e-04, -7.22015649e-02,\n",
+       "                       -1.31994477e-02, -1.27156395e-02,  1.02564795e-02,  1.32799195e-02,\n",
+       "                       -1.20413559e-03, -4.15205443e-03, -9.66252945e-03, -1.11156877e-03,\n",
+       "                        1.75651070e-02,  2.47061532e-02, -3.22925635e-02,  6.95932051e-03,\n",
+       "                        9.56356898e-03, -1.50442692e-02,  1.64015479e-02,  5.24280732e-03,\n",
+       "                        3.17716822e-02, -5.53713785e-03, -1.06571664e-04,  9.43160616e-03,\n",
+       "                        9.63144936e-03, -5.56897651e-03,  1.13199570e-03,  1.25727803e-02,\n",
+       "                       -6.73677167e-03, -1.04960650e-02,  9.34011885e-04, -1.03336098e-02,\n",
+       "                        1.40871098e-02, -1.59239639e-02,  2.29182914e-02,  6.17692422e-05,\n",
+       "                       -3.35305231e-03,  7.19197124e-05, -1.17311468e-02, -3.22010480e-02,\n",
+       "                        5.37329866e-03, -9.16972011e-03, -4.40349337e-03, -1.91465244e-02,\n",
+       "                       -4.95484797e-03, -2.49018818e-02, -1.20322015e-02, -1.08357696e-02,\n",
+       "                       -1.00547625e-02, -2.94450088e-03,  5.77213243e-03, -1.24915829e-02,\n",
+       "                       -1.69879310e-02,  1.47916187e-04, -3.30431107e-03,  3.74537683e-03,\n",
+       "                       -6.71420526e-03,  2.85739498e-03, -5.88525691e-05,  4.38376237e-03,\n",
+       "                        8.50109477e-03,  5.33880573e-03, -1.12952897e-02, -8.53516534e-03,\n",
+       "                       -2.40853615e-03, -3.99530260e-03,  1.60534661e-02, -5.62854763e-03,\n",
+       "                       -3.77693970e-04,  1.23287737e-02,  2.00105105e-02, -1.42252818e-02,\n",
+       "                       -3.90752554e-02, -5.64790098e-03, -5.97694074e-04,  1.19732199e-02,\n",
+       "                        1.37916040e-02,  4.39003063e-03,  1.62776583e-03,  6.12852676e-03,\n",
+       "                       -2.70602433e-03, -1.48238158e-02, -2.96681095e-02, -1.44181950e-02,\n",
+       "                        8.72193649e-03,  1.24358824e-02,  1.52108464e-02,  1.06202485e-02,\n",
+       "                       -8.53042875e-05, -9.98889934e-03, -5.43701509e-03,  8.10975954e-03,\n",
+       "                        3.15054669e-03, -5.17641008e-03, -7.31557794e-03,  3.30039300e-03,\n",
+       "                        2.07848335e-03,  1.37262873e-03, -5.56092802e-03,  1.41495364e-02,\n",
+       "                       -1.32099232e-02,  1.03573129e-03,  1.63320545e-02, -6.14388322e-04,\n",
+       "                       -9.34190303e-03,  7.67122116e-03,  6.12509670e-04,  2.17823172e-03,\n",
+       "                       -5.67103876e-03,  1.09491777e-02,  6.37806486e-03,  5.85651305e-03,\n",
+       "                        2.79139308e-03, -3.87229025e-03, -3.13691562e-03, -4.91503440e-03,\n",
+       "                       -6.06452599e-02,  9.29491594e-03,  9.19607189e-03,  3.91248288e-03,\n",
+       "                       -1.18186893e-02,  2.82759406e-03, -9.46957152e-03, -1.18294284e-02,\n",
+       "                       -2.55618896e-03,  6.68200152e-03,  6.41459227e-03,  1.52630685e-02,\n",
+       "                        9.96001530e-03,  5.96510945e-03, -7.90067762e-03,  4.33216989e-03,\n",
+       "                        7.29350885e-03,  6.58101402e-03, -4.42307536e-03,  4.33848379e-03,\n",
+       "                        6.38639415e-03,  1.33568821e-02, -1.26913534e-02,  3.80871398e-03,\n",
+       "                        1.93254575e-02, -1.42886303e-02, -7.10068271e-03, -3.35032977e-02,\n",
+       "                        9.40572284e-03, -1.38211465e-02, -1.02185896e-02, -1.26630822e-02,\n",
+       "                       -2.23257244e-02, -1.92523561e-02, -3.01279314e-02,  2.53150007e-03,\n",
+       "                       -1.12993028e-02,  9.79227107e-03, -7.08208373e-03,  2.55916603e-02,\n",
+       "                        2.86390772e-03,  3.20686027e-02, -2.30147969e-03, -1.51887033e-02,\n",
+       "                        1.19875781e-02, -1.32277906e-02, -2.15940084e-03,  5.77947544e-03],\n",
+       "                      dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (dropout): Dropout(\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (q): <tf.Variable 'transformer/layer_._2/rel_attn/q:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[-4.81137522e-02,  1.51717179e-02,  1.91733846e-03, ...,\n",
+       "                       -2.15504169e-02, -8.80663171e-02, -5.14865741e-02],\n",
+       "                      [-2.29916703e-02, -5.24781160e-02, -6.03806712e-02, ...,\n",
+       "                       -8.62903253e-05, -4.47642431e-03,  7.90688917e-02],\n",
+       "                      [ 1.12126365e-01,  3.48391198e-02, -5.96038513e-02, ...,\n",
+       "                        1.68225244e-02,  2.80025396e-02, -1.32860793e-02],\n",
+       "                      ...,\n",
+       "                      [ 6.81161508e-03,  5.21353967e-02,  2.45775543e-02, ...,\n",
+       "                        2.16543674e-02,  8.77359789e-03, -2.10702680e-02],\n",
+       "                      [ 1.58886798e-02,  1.51693877e-02, -9.94204450e-03, ...,\n",
+       "                        9.39156860e-03,  1.01508182e-02, -3.07718641e-03],\n",
+       "                      [-2.86811162e-02, -2.62935236e-02,  1.51471458e-02, ...,\n",
+       "                        1.70202483e-03,  3.09125576e-02, -4.09694621e-03]],\n",
+       "              \n",
+       "                     [[ 3.37063894e-02, -1.63897295e-02,  6.96284231e-03, ...,\n",
+       "                       -7.82956369e-03,  5.46475984e-02, -4.21468318e-02],\n",
+       "                      [ 3.24924961e-02,  2.07625646e-02, -6.96102679e-02, ...,\n",
+       "                       -6.44863173e-02, -7.28632137e-02,  4.93840724e-02],\n",
+       "                      [ 3.49648520e-02,  4.40866686e-02,  4.10161763e-02, ...,\n",
+       "                        3.23176309e-02,  5.57911135e-02,  4.16656248e-02],\n",
+       "                      ...,\n",
+       "                      [ 3.62646729e-02, -2.21277811e-02,  1.90648821e-03, ...,\n",
+       "                        3.49440463e-02, -5.95782511e-02,  4.22822535e-02],\n",
+       "                      [-3.51860039e-02, -2.13885438e-02,  4.00259346e-02, ...,\n",
+       "                       -4.20402475e-02, -1.41877644e-02,  4.43436131e-02],\n",
+       "                      [ 2.43175644e-02,  1.39741208e-02,  3.49960700e-02, ...,\n",
+       "                        1.55997453e-02, -1.60364714e-02,  2.10535321e-02]],\n",
+       "              \n",
+       "                     [[ 3.32882740e-02, -1.96926738e-03, -1.55992284e-02, ...,\n",
+       "                        8.14008191e-02,  1.38205756e-02, -1.51603227e-03],\n",
+       "                      [ 3.59372562e-03,  2.50430964e-03,  2.58572530e-02, ...,\n",
+       "                        3.24064456e-02,  2.29581203e-02, -1.92896519e-02],\n",
+       "                      [ 1.43919000e-02,  1.51500767e-02, -2.80712657e-02, ...,\n",
+       "                        5.12368865e-02,  9.74925887e-03, -5.37651917e-03],\n",
+       "                      ...,\n",
+       "                      [ 3.90181039e-03,  3.26900743e-02,  9.40683577e-03, ...,\n",
+       "                        8.45516333e-04,  8.35157279e-03, -1.66299427e-03],\n",
+       "                      [ 3.23605747e-03, -6.58250833e-03,  1.32873598e-02, ...,\n",
+       "                        1.53540606e-02, -2.06754059e-02,  1.22069884e-02],\n",
+       "                      [ 3.42889782e-03, -5.71477169e-04, -1.83276646e-02, ...,\n",
+       "                        2.04541571e-02, -1.27389310e-02,  1.50542082e-02]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[ 3.72777767e-02, -5.42798452e-02,  3.09000630e-03, ...,\n",
+       "                       -2.05895375e-03,  4.08504084e-02, -3.67017463e-02],\n",
+       "                      [ 2.81978864e-02,  2.46209782e-02, -5.35734519e-02, ...,\n",
+       "                       -9.81846265e-03, -6.76249191e-02,  4.47309017e-02],\n",
+       "                      [-1.71915013e-02, -1.91664733e-02, -3.03540640e-02, ...,\n",
+       "                       -1.37790563e-02,  8.39917455e-03,  1.95486043e-02],\n",
+       "                      ...,\n",
+       "                      [ 4.39666398e-03,  1.65959522e-02,  4.79898555e-03, ...,\n",
+       "                        3.13505344e-03,  4.33057360e-03, -4.27076186e-04],\n",
+       "                      [ 1.57838222e-02,  2.59035290e-03,  1.50174825e-02, ...,\n",
+       "                       -5.15849795e-04, -3.30348127e-03,  6.75350800e-03],\n",
+       "                      [ 1.95149593e-02, -9.67641245e-04,  9.85140260e-03, ...,\n",
+       "                        1.70841943e-02, -2.58299336e-02,  7.08191376e-03]],\n",
+       "              \n",
+       "                     [[-1.05452873e-02,  2.40855291e-02, -3.36844176e-02, ...,\n",
+       "                       -4.62573469e-02, -1.49153080e-03,  6.79138154e-02],\n",
+       "                      [ 4.84222826e-03,  1.13523463e-02,  3.25595327e-02, ...,\n",
+       "                       -2.86528356e-02,  3.52971703e-02, -3.56208794e-02],\n",
+       "                      [-1.18880443e-01, -3.07634361e-02,  2.19099987e-02, ...,\n",
+       "                       -5.25062606e-02, -4.03628685e-02, -4.92011150e-03],\n",
+       "                      ...,\n",
+       "                      [-1.91243179e-02, -4.92599839e-03, -8.33099522e-03, ...,\n",
+       "                       -3.46056446e-02,  3.18350689e-03, -8.50734068e-04],\n",
+       "                      [ 3.76518033e-02,  3.41102369e-02, -5.76552041e-02, ...,\n",
+       "                        1.96692292e-02,  4.78661954e-02, -4.84392270e-02],\n",
+       "                      [-3.47922626e-03, -1.39467446e-02,  2.18370315e-02, ...,\n",
+       "                       -2.02156343e-02,  1.19114574e-02, -2.46745106e-02]],\n",
+       "              \n",
+       "                     [[ 6.54376950e-03,  3.02088279e-02, -5.81995286e-02, ...,\n",
+       "                       -7.68325403e-02,  6.12843484e-02,  3.78722101e-02],\n",
+       "                      [ 9.42414347e-03, -5.04070967e-02, -2.94177290e-02, ...,\n",
+       "                       -5.24935313e-03, -6.23170584e-02,  4.45930520e-03],\n",
+       "                      [-4.07862365e-02, -3.37571464e-02,  2.19498202e-02, ...,\n",
+       "                        7.29233166e-03, -5.56845069e-02, -2.92345323e-02],\n",
+       "                      ...,\n",
+       "                      [ 2.81625874e-02, -1.72678512e-02, -2.19437256e-02, ...,\n",
+       "                        8.62976443e-03, -4.02266011e-02,  2.57315841e-02],\n",
+       "                      [-8.77696928e-03, -1.04554817e-02,  6.81386003e-03, ...,\n",
+       "                       -2.19753687e-03,  5.88407274e-03, -7.93407857e-03],\n",
+       "                      [-1.05217602e-02,  9.43640154e-03, -6.24175705e-02, ...,\n",
+       "                       -3.55250388e-02, -6.71412144e-03,  2.17702035e-02]]],\n",
+       "                    dtype=float32)>\n",
+       "              (k): <tf.Variable 'transformer/layer_._2/rel_attn/k:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[-0.00293928, -0.0109784 , -0.00407117, ...,  0.06720299,\n",
+       "                        0.00220658, -0.01070606],\n",
+       "                      [ 0.02917756,  0.01057504,  0.0149243 , ..., -0.02115533,\n",
+       "                       -0.03522046,  0.00336731],\n",
+       "                      [ 0.0072771 ,  0.00142857, -0.00595553, ..., -0.01464644,\n",
+       "                       -0.02712567, -0.00692069],\n",
+       "                      ...,\n",
+       "                      [ 0.00619581,  0.00026811,  0.03295753, ..., -0.04673641,\n",
+       "                        0.00351168, -0.01507777],\n",
+       "                      [ 0.00376089,  0.0103442 , -0.0184721 , ..., -0.01987653,\n",
+       "                        0.01558526, -0.00548268],\n",
+       "                      [-0.00744516, -0.00281895, -0.01078221, ...,  0.00610567,\n",
+       "                       -0.01862272,  0.00915155]],\n",
+       "              \n",
+       "                     [[-0.02782594, -0.0039578 ,  0.07950357, ..., -0.02373442,\n",
+       "                       -0.05951536, -0.01053701],\n",
+       "                      [-0.00720376,  0.01994296,  0.05216808, ...,  0.00521234,\n",
+       "                        0.04455427, -0.03069338],\n",
+       "                      [ 0.00991428,  0.02514814,  0.03120906, ..., -0.03899101,\n",
+       "                        0.017482  ,  0.02697489],\n",
+       "                      ...,\n",
+       "                      [-0.05309541, -0.00619643, -0.05110249, ..., -0.0535032 ,\n",
+       "                        0.04024338, -0.0384163 ],\n",
+       "                      [-0.02037921, -0.01771634,  0.03101053, ..., -0.00896538,\n",
+       "                        0.00090393,  0.01484353],\n",
+       "                      [-0.00921424,  0.0160069 , -0.00579366, ...,  0.02471853,\n",
+       "                       -0.01938148, -0.00959876]],\n",
+       "              \n",
+       "                     [[ 0.00509293, -0.02846905, -0.06832287, ...,  0.01379875,\n",
+       "                        0.01978015,  0.00669768],\n",
+       "                      [-0.00238889, -0.03830735, -0.07192513, ...,  0.02121064,\n",
+       "                       -0.02788975,  0.04276541],\n",
+       "                      [ 0.01299973, -0.02591552, -0.03836127, ..., -0.0018938 ,\n",
+       "                       -0.0080095 , -0.04260714],\n",
+       "                      ...,\n",
+       "                      [-0.00532516,  0.0437762 , -0.01197581, ..., -0.00461747,\n",
+       "                        0.02074965, -0.03320842],\n",
+       "                      [ 0.01869402,  0.00926195, -0.03418873, ...,  0.01149853,\n",
+       "                        0.00745646, -0.01764916],\n",
+       "                      [-0.00859777, -0.03077263,  0.02499374, ..., -0.03628961,\n",
+       "                        0.02713079, -0.02098218]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[-0.00255963, -0.00792341, -0.01311781, ..., -0.01471253,\n",
+       "                        0.00773418,  0.0028765 ],\n",
+       "                      [-0.01693467, -0.01684431,  0.01218338, ..., -0.00594166,\n",
+       "                        0.01953993, -0.00055485],\n",
+       "                      [ 0.00725681, -0.01396647, -0.01421928, ..., -0.02032903,\n",
+       "                        0.00128055, -0.01244337],\n",
+       "                      ...,\n",
+       "                      [ 0.04216336, -0.01187535,  0.03545079, ...,  0.05167695,\n",
+       "                       -0.03074895,  0.02474623],\n",
+       "                      [ 0.01909629,  0.00693916,  0.00172379, ...,  0.0171647 ,\n",
+       "                        0.01141954, -0.00754204],\n",
+       "                      [ 0.03014773,  0.00731963,  0.05709034, ...,  0.02683626,\n",
+       "                       -0.02091517,  0.02028517]],\n",
+       "              \n",
+       "                     [[ 0.0074964 , -0.00856717,  0.02979018, ...,  0.03537965,\n",
+       "                        0.00690144, -0.0624721 ],\n",
+       "                      [-0.00064552, -0.02535983, -0.01051644, ..., -0.00985349,\n",
+       "                        0.00672527,  0.04417474],\n",
+       "                      [ 0.06582981,  0.01555467,  0.0155565 , ...,  0.03326725,\n",
+       "                        0.01875504, -0.01086921],\n",
+       "                      ...,\n",
+       "                      [ 0.01764918,  0.02719252,  0.02960117, ...,  0.03690163,\n",
+       "                        0.02842108, -0.02001433],\n",
+       "                      [-0.03356929, -0.02933718,  0.04107409, ..., -0.02876418,\n",
+       "                       -0.03791892,  0.05297501],\n",
+       "                      [ 0.04199879,  0.03726116,  0.02551803, ...,  0.02520091,\n",
+       "                       -0.0426075 ,  0.04186616]],\n",
+       "              \n",
+       "                     [[-0.03414296,  0.00657422,  0.04984473, ..., -0.02375824,\n",
+       "                       -0.05163334, -0.02703283],\n",
+       "                      [-0.00742817,  0.03634953, -0.00377172, ..., -0.01132715,\n",
+       "                        0.03730771, -0.01465937],\n",
+       "                      [-0.02270306,  0.00535163, -0.02442615, ..., -0.06195223,\n",
+       "                        0.00054794,  0.0272242 ],\n",
+       "                      ...,\n",
+       "                      [-0.0495413 ,  0.02071496, -0.01031443, ..., -0.08232274,\n",
+       "                        0.0433554 , -0.05423561],\n",
+       "                      [ 0.02054976,  0.02180232, -0.00914375, ...,  0.02327339,\n",
+       "                        0.01977414, -0.02690084],\n",
+       "                      [ 0.00422481,  0.00880208,  0.04090318, ...,  0.03197616,\n",
+       "                        0.00156149, -0.00067797]]], dtype=float32)>\n",
+       "              (v): <tf.Variable 'transformer/layer_._2/rel_attn/v:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[ 0.00665421, -0.00124323,  0.00077421, ...,  0.03188131,\n",
+       "                        0.0309326 , -0.01376203],\n",
+       "                      [ 0.05372431,  0.03682763, -0.01067041, ..., -0.00807943,\n",
+       "                       -0.00639856,  0.01343099],\n",
+       "                      [ 0.01893931, -0.01041871, -0.0559322 , ...,  0.01476059,\n",
+       "                       -0.02740676,  0.00521749],\n",
+       "                      ...,\n",
+       "                      [ 0.01157789, -0.00384533,  0.01601262, ...,  0.03651634,\n",
+       "                       -0.02067197,  0.02215986],\n",
+       "                      [ 0.03778082, -0.01276081,  0.03520799, ..., -0.00878477,\n",
+       "                        0.01457549, -0.02071035],\n",
+       "                      [ 0.00282983, -0.03704467,  0.02245468, ...,  0.04747025,\n",
+       "                       -0.03342215, -0.00695839]],\n",
+       "              \n",
+       "                     [[ 0.01376876, -0.03680427, -0.02725985, ...,  0.00445622,\n",
+       "                       -0.01388015, -0.05727502],\n",
+       "                      [ 0.04148179,  0.01627039, -0.03839501, ..., -0.01536803,\n",
+       "                        0.02744391, -0.00661899],\n",
+       "                      [-0.01462931, -0.00733666,  0.00704345, ..., -0.01936535,\n",
+       "                        0.00024902,  0.00248078],\n",
+       "                      ...,\n",
+       "                      [ 0.00872552, -0.01589725,  0.00721518, ...,  0.01352625,\n",
+       "                       -0.03614037, -0.00738423],\n",
+       "                      [-0.01501117, -0.00353953,  0.03562136, ..., -0.01327041,\n",
+       "                        0.01113886,  0.02501536],\n",
+       "                      [-0.00858908,  0.04791915,  0.01760549, ...,  0.0177771 ,\n",
+       "                       -0.00661571, -0.03333431]],\n",
+       "              \n",
+       "                     [[-0.01187906, -0.04443332,  0.04576288, ...,  0.00167149,\n",
+       "                       -0.00927628,  0.00616596],\n",
+       "                      [-0.01270569,  0.02138975, -0.05224277, ...,  0.00306947,\n",
+       "                        0.00871206, -0.05778804],\n",
+       "                      [ 0.01868859, -0.05713747, -0.0174821 , ..., -0.03733874,\n",
+       "                        0.02836852, -0.04284712],\n",
+       "                      ...,\n",
+       "                      [ 0.0349387 ,  0.03672682, -0.02753093, ...,  0.00166308,\n",
+       "                       -0.01772935,  0.00616858],\n",
+       "                      [-0.0030303 , -0.00437067, -0.0290189 , ...,  0.01580735,\n",
+       "                       -0.01613746, -0.03987672],\n",
+       "                      [ 0.01220608, -0.08185615,  0.02158659, ..., -0.02559558,\n",
+       "                        0.01645808, -0.03744602]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[ 0.0013312 , -0.05324713,  0.00172486, ..., -0.04377612,\n",
+       "                        0.05795961, -0.02054776],\n",
+       "                      [-0.01609062, -0.01902576,  0.00800247, ..., -0.02614984,\n",
+       "                        0.03733749,  0.00026225],\n",
+       "                      [-0.00247638, -0.01931726, -0.01522283, ...,  0.00588738,\n",
+       "                       -0.00190235, -0.00399782],\n",
+       "                      ...,\n",
+       "                      [ 0.06571385, -0.00344569, -0.00669769, ...,  0.001024  ,\n",
+       "                        0.03480022, -0.01587555],\n",
+       "                      [ 0.02889877,  0.03159959,  0.02333231, ..., -0.00581144,\n",
+       "                       -0.02998798, -0.03450729],\n",
+       "                      [-0.02668998, -0.0034108 , -0.0105373 , ..., -0.02762248,\n",
+       "                        0.00860727,  0.02687717]],\n",
+       "              \n",
+       "                     [[ 0.01648841, -0.01285174,  0.01358325, ..., -0.08152249,\n",
+       "                        0.04437737, -0.03391603],\n",
+       "                      [ 0.07113062, -0.0359729 , -0.01348723, ..., -0.0176398 ,\n",
+       "                        0.03200765,  0.06134365],\n",
+       "                      [ 0.01156471, -0.06770372,  0.02843059, ..., -0.01153438,\n",
+       "                       -0.01228396,  0.01346244],\n",
+       "                      ...,\n",
+       "                      [-0.00569895,  0.00055908,  0.06838486, ...,  0.08354934,\n",
+       "                        0.05700811,  0.00101427],\n",
+       "                      [ 0.01807693, -0.01333605, -0.00154606, ...,  0.01078754,\n",
+       "                        0.02314062,  0.01037679],\n",
+       "                      [-0.02781903, -0.05354921, -0.06595469, ..., -0.05279655,\n",
+       "                        0.01851269, -0.00904128]],\n",
+       "              \n",
+       "                     [[ 0.00583097,  0.04983573,  0.03094061, ..., -0.02316775,\n",
+       "                       -0.02365098,  0.01838909],\n",
+       "                      [-0.02851329,  0.01512148,  0.02271658, ..., -0.03578778,\n",
+       "                        0.0036391 , -0.01013733],\n",
+       "                      [-0.10941688, -0.05352794, -0.03661714, ...,  0.01911658,\n",
+       "                       -0.0331871 ,  0.01334788],\n",
+       "                      ...,\n",
+       "                      [ 0.02926285, -0.00778401, -0.00936453, ...,  0.05407878,\n",
+       "                       -0.02920299, -0.00677245],\n",
+       "                      [ 0.00341181, -0.01542326, -0.00013787, ...,  0.00919122,\n",
+       "                       -0.00327538,  0.00982734],\n",
+       "                      [ 0.04222366, -0.00887216,  0.04550539, ..., -0.03900504,\n",
+       "                        0.02140583, -0.05328723]]], dtype=float32)>\n",
+       "              (o): <tf.Variable 'transformer/layer_._2/rel_attn/o:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[-0.0459144 ,  0.04068733, -0.01355186, ..., -0.01989118,\n",
+       "                       -0.03472243,  0.01304346],\n",
+       "                      [-0.03370773, -0.03767217,  0.01916665, ...,  0.02566565,\n",
+       "                        0.01706363,  0.0169379 ],\n",
+       "                      [ 0.02327448,  0.02124598, -0.00851453, ...,  0.04678395,\n",
+       "                       -0.03150146,  0.02959211],\n",
+       "                      ...,\n",
+       "                      [ 0.02368829,  0.03962338,  0.01558492, ...,  0.0044567 ,\n",
+       "                       -0.0315103 ,  0.04004923],\n",
+       "                      [ 0.01133197, -0.01993851,  0.027225  , ..., -0.02620822,\n",
+       "                        0.00454007,  0.01773539],\n",
+       "                      [-0.03604782, -0.03206643,  0.01872083, ...,  0.06024332,\n",
+       "                       -0.00716398,  0.0511735 ]],\n",
+       "              \n",
+       "                     [[ 0.00405366, -0.04948125,  0.03672703, ..., -0.00733926,\n",
+       "                       -0.01024133, -0.0456225 ],\n",
+       "                      [ 0.04979887,  0.01724279, -0.01421242, ..., -0.00306262,\n",
+       "                        0.02512117,  0.02159863],\n",
+       "                      [-0.03722695,  0.00468144,  0.0289183 , ..., -0.05651103,\n",
+       "                        0.02156329, -0.00495635],\n",
+       "                      ...,\n",
+       "                      [ 0.01668868,  0.01374733,  0.00024095, ...,  0.02230918,\n",
+       "                       -0.03669459, -0.01169418],\n",
+       "                      [-0.01635886, -0.00344317,  0.01114676, ..., -0.02080308,\n",
+       "                        0.01682055,  0.00250151],\n",
+       "                      [-0.01110393, -0.02011649,  0.01129264, ...,  0.02056844,\n",
+       "                       -0.02213018, -0.00444395]],\n",
+       "              \n",
+       "                     [[-0.00764826, -0.01075712, -0.065015  , ..., -0.00079673,\n",
+       "                       -0.04441076,  0.02999873],\n",
+       "                      [ 0.02219415, -0.04028346, -0.03506127, ...,  0.01997649,\n",
+       "                        0.00269448, -0.02619188],\n",
+       "                      [-0.04424787, -0.01318666, -0.00114819, ..., -0.04353184,\n",
+       "                        0.05100081, -0.00196214],\n",
+       "                      ...,\n",
+       "                      [-0.00140231,  0.04148398, -0.02321989, ..., -0.02140379,\n",
+       "                        0.00641817, -0.00452846],\n",
+       "                      [-0.00375441, -0.01005294,  0.00477563, ...,  0.03219246,\n",
+       "                       -0.0210044 , -0.00747442],\n",
+       "                      [ 0.01919622, -0.03384344,  0.02077735, ..., -0.01202968,\n",
+       "                        0.02690425,  0.01807844]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[-0.01119938, -0.01464343,  0.00398871, ...,  0.00364551,\n",
+       "                        0.00344581, -0.00462025],\n",
+       "                      [ 0.06504844, -0.01730673,  0.02013603, ..., -0.02582743,\n",
+       "                       -0.03860147, -0.0139975 ],\n",
+       "                      [-0.04559997,  0.00583538, -0.00664801, ..., -0.0149008 ,\n",
+       "                        0.03558432, -0.01965741],\n",
+       "                      ...,\n",
+       "                      [ 0.00025523,  0.00819261, -0.0307526 , ..., -0.01076851,\n",
+       "                        0.02486686, -0.02093521],\n",
+       "                      [ 0.02401941,  0.03498043,  0.0014439 , ...,  0.01171041,\n",
+       "                       -0.00058519, -0.02835972],\n",
+       "                      [ 0.00732349, -0.00456121, -0.03796291, ..., -0.03865096,\n",
+       "                       -0.01785722, -0.04314538]],\n",
+       "              \n",
+       "                     [[ 0.00726655,  0.03450558,  0.02211844, ..., -0.03010445,\n",
+       "                       -0.02838681, -0.0039719 ],\n",
+       "                      [-0.01016848,  0.01256592,  0.07358556, ..., -0.0117584 ,\n",
+       "                        0.04732952, -0.02382375],\n",
+       "                      [-0.02834523,  0.01466386,  0.03074974, ..., -0.00940978,\n",
+       "                       -0.00022519, -0.07195798],\n",
+       "                      ...,\n",
+       "                      [ 0.01355847,  0.01601157,  0.02397542, ...,  0.03484057,\n",
+       "                        0.04077799, -0.03013852],\n",
+       "                      [ 0.00740167,  0.02471284, -0.0393412 , ...,  0.02263542,\n",
+       "                        0.01461129,  0.01385937],\n",
+       "                      [ 0.02695005, -0.00959161, -0.01261136, ..., -0.00971951,\n",
+       "                        0.03261755,  0.00980215]],\n",
+       "              \n",
+       "                     [[ 0.02489883, -0.02117315, -0.01708841, ...,  0.02682983,\n",
+       "                        0.02765293, -0.03892074],\n",
+       "                      [ 0.00359684,  0.02647137, -0.0155964 , ..., -0.02545275,\n",
+       "                       -0.01858809, -0.01930472],\n",
+       "                      [-0.01306243,  0.00480867,  0.00555033, ...,  0.00739669,\n",
+       "                       -0.02284159, -0.00387958],\n",
+       "                      ...,\n",
+       "                      [ 0.01714972, -0.00192116,  0.00112109, ..., -0.01120449,\n",
+       "                       -0.02290132, -0.00165214],\n",
+       "                      [-0.02095219, -0.00792485,  0.00188622, ...,  0.01830022,\n",
+       "                        0.00613669, -0.02693458],\n",
+       "                      [-0.05250171, -0.0118492 , -0.01927755, ..., -0.01943363,\n",
+       "                        0.01223021, -0.01266978]]], dtype=float32)>\n",
+       "              (r): <tf.Variable 'transformer/layer_._2/rel_attn/r:0' shape=(192, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[-1.74154818e-01,  1.71483576e-01, -1.57918856e-01, ...,\n",
+       "                       -1.09398648e-01, -1.66214570e-01,  1.69107735e-01],\n",
+       "                      [-1.34248465e-01, -1.37429506e-01,  1.49386033e-01, ...,\n",
+       "                        1.27640173e-01,  1.43373027e-01, -1.56313241e-01],\n",
+       "                      [-1.09571531e-01, -1.28932819e-01, -1.36733443e-01, ...,\n",
+       "                       -1.53899968e-01, -1.61415860e-01, -1.55967340e-01],\n",
+       "                      ...,\n",
+       "                      [-2.67540216e-02,  9.91882980e-02, -5.10194190e-02, ...,\n",
+       "                       -3.43626109e-03,  3.33151408e-02, -3.82135659e-02],\n",
+       "                      [ 6.43306673e-02,  4.39539142e-02, -2.82719377e-02, ...,\n",
+       "                        5.20758294e-02,  4.51205000e-02, -1.25731584e-02],\n",
+       "                      [-1.54505864e-01, -1.45732820e-01, -1.48832098e-01, ...,\n",
+       "                       -1.36694744e-01,  1.42165855e-01, -1.38038144e-01]],\n",
+       "              \n",
+       "                     [[-1.34223402e-01,  1.29062846e-01, -1.10095568e-01, ...,\n",
+       "                       -4.56332713e-02, -1.35236993e-01,  1.25871733e-01],\n",
+       "                      [-1.04855791e-01, -9.51494128e-02,  1.04910910e-01, ...,\n",
+       "                        1.04753070e-01,  1.28032610e-01, -1.11456059e-01],\n",
+       "                      [-9.41539183e-02, -1.49656698e-01, -1.33008048e-01, ...,\n",
+       "                       -1.56195447e-01, -1.33284256e-01, -1.50071308e-01],\n",
+       "                      ...,\n",
+       "                      [-1.65088084e-02,  7.33572915e-02, -3.98807749e-02, ...,\n",
+       "                        2.30416749e-02,  1.75641049e-02, -4.62100022e-02],\n",
+       "                      [ 3.67465951e-02,  4.43068817e-02, -1.63640715e-02, ...,\n",
+       "                        4.77316864e-02,  4.48581763e-02,  1.15232123e-03],\n",
+       "                      [-1.06183678e-01, -9.87367705e-02, -1.01419248e-01, ...,\n",
+       "                       -8.46716315e-02,  8.80824402e-02, -1.13163486e-01]],\n",
+       "              \n",
+       "                     [[-9.73633751e-02,  8.78513753e-02, -1.10944688e-01, ...,\n",
+       "                       -5.38534336e-02, -9.78744626e-02,  1.34479314e-01],\n",
+       "                      [-8.19151998e-02, -9.94543955e-02,  5.58716655e-02, ...,\n",
+       "                        9.10466388e-02,  8.79919752e-02, -7.91056827e-02],\n",
+       "                      [-1.07165791e-01, -1.16330668e-01, -1.04530655e-01, ...,\n",
+       "                       -1.26266211e-01, -1.14166744e-01, -1.32683665e-01],\n",
+       "                      ...,\n",
+       "                      [-6.09156210e-03,  5.80127090e-02, -3.35601829e-02, ...,\n",
+       "                       -1.27315565e-04,  1.89231914e-02, -1.03578214e-02],\n",
+       "                      [ 3.55091467e-02,  3.06853075e-02, -3.44112329e-02, ...,\n",
+       "                        4.85388599e-02,  9.87971947e-03, -2.19964515e-02],\n",
+       "                      [-6.60627335e-02, -6.56424835e-02, -8.05212483e-02, ...,\n",
+       "                       -7.00480193e-02,  7.31544569e-02, -6.39438108e-02]],\n",
+       "              \n",
+       "                     ...,\n",
+       "              \n",
+       "                     [[-1.48311350e-02, -1.23089608e-02,  3.57820955e-03, ...,\n",
+       "                       -2.04090904e-02,  1.94556732e-03, -1.02494638e-02],\n",
+       "                      [ 4.35499102e-03, -6.63030194e-04,  1.95456371e-02, ...,\n",
+       "                       -6.83242688e-03, -1.00761633e-02, -1.73593359e-03],\n",
+       "                      [-1.80752464e-02, -1.66376941e-02, -1.10558709e-02, ...,\n",
+       "                       -2.73382664e-02,  1.69053709e-03, -1.61816720e-02],\n",
+       "                      ...,\n",
+       "                      [ 1.91931371e-02, -7.00070197e-03,  2.42002066e-02, ...,\n",
+       "                        3.97639628e-03, -8.44740868e-03,  1.29894456e-02],\n",
+       "                      [-8.07208288e-03, -4.40871762e-03,  4.02785353e-02, ...,\n",
+       "                       -2.72978912e-03, -2.89322101e-02,  1.82679240e-02],\n",
+       "                      [-2.15032008e-02, -2.35424191e-02, -3.08847502e-02, ...,\n",
+       "                       -2.68492289e-02,  9.08977166e-03, -2.62664557e-02]],\n",
+       "              \n",
+       "                     [[ 4.63743974e-03,  8.47169757e-03, -1.44635988e-02, ...,\n",
+       "                       -1.65978130e-02,  1.24762636e-02,  2.84114317e-03],\n",
+       "                      [ 2.10315473e-02,  3.91109427e-03,  1.73604600e-02, ...,\n",
+       "                       -2.32025096e-03,  5.87290479e-03,  9.85332299e-05],\n",
+       "                      [-2.55174581e-02, -5.42022474e-03,  4.37739212e-03, ...,\n",
+       "                       -2.30460241e-03,  3.03133507e-03, -1.33659486e-02],\n",
+       "                      ...,\n",
+       "                      [-1.23453815e-03, -1.62221733e-02,  1.88910943e-02, ...,\n",
+       "                       -2.35769432e-02,  1.02529228e-02,  9.97068919e-03],\n",
+       "                      [ 1.09659694e-02,  4.10200097e-03, -3.22548039e-02, ...,\n",
+       "                        9.11346730e-03,  1.90772861e-02, -2.13330518e-02],\n",
+       "                      [ 8.70900694e-03,  3.51738883e-03, -1.52583178e-02, ...,\n",
+       "                       -3.99373658e-03, -7.65542360e-03,  1.30024115e-02]],\n",
+       "              \n",
+       "                     [[-1.07049560e-02,  2.16062423e-02, -2.15930026e-02, ...,\n",
+       "                        1.26719456e-02,  7.11302564e-05,  8.03572778e-03],\n",
+       "                      [ 1.24141166e-04,  7.36288028e-03, -6.79872115e-04, ...,\n",
+       "                        2.49428093e-03, -1.16298664e-02,  2.27960074e-04],\n",
+       "                      [-9.86421760e-03, -2.49710362e-02, -2.40540970e-02, ...,\n",
+       "                       -4.42250725e-03, -2.89662927e-02, -1.20275375e-02],\n",
+       "                      ...,\n",
+       "                      [ 3.12622730e-03, -6.99984375e-03, -2.77643427e-02, ...,\n",
+       "                       -1.10041993e-02, -2.18351595e-02,  2.90531025e-05],\n",
+       "                      [-3.10673728e-03, -1.49604697e-02,  1.97154842e-02, ...,\n",
+       "                        2.03390904e-02, -1.56578294e-03, -5.11408225e-03],\n",
+       "                      [ 2.66231168e-02,  1.82542447e-02,  2.63125654e-02, ...,\n",
+       "                        1.70649234e-02, -2.89466791e-02,  2.94499528e-02]]],\n",
+       "                    dtype=float32)>\n",
+       "              (r_r_bias): <tf.Variable 'transformer/layer_._2/rel_attn/r_r_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "              array([[ 0.2688689 , -0.26965415,  0.24901254, -0.21432097, -0.2537209 ,\n",
+       "                      -0.25497636, -0.25866804, -0.26985508,  0.279801  ,  0.13522011,\n",
+       "                       0.25756484, -0.24836208],\n",
+       "                     [ 0.22552061,  0.24260372, -0.19067137,  0.22706836,  0.24444126,\n",
+       "                      -0.22470543, -0.20988142,  0.21856506, -0.21155524, -0.23370892,\n",
+       "                      -0.24733196,  0.22796093],\n",
+       "                     [ 0.17451425,  0.24542138,  0.25050005,  0.22542311,  0.23060308,\n",
+       "                       0.23414634, -0.24786818, -0.22182368, -0.26085967,  0.2449251 ,\n",
+       "                       0.23860171,  0.2544802 ],\n",
+       "                     [-0.26321352,  0.25723347, -0.26902857,  0.26281124, -0.2697539 ,\n",
+       "                      -0.25095993,  0.2511667 , -0.26299623,  0.25617778, -0.26167557,\n",
+       "                       0.23467393, -0.2685565 ],\n",
+       "                     [ 0.17467302, -0.16205215, -0.1877693 ,  0.19500752,  0.2010059 ,\n",
+       "                       0.19327593, -0.15914948, -0.15686454,  0.17404646, -0.18154949,\n",
+       "                      -0.19225396, -0.22171909],\n",
+       "                     [ 0.2911585 ,  0.2944224 ,  0.30023518, -0.28492442,  0.29406187,\n",
+       "                       0.27411905,  0.28787902,  0.2629663 , -0.2700486 ,  0.28186122,\n",
+       "                       0.26866576, -0.2760028 ],\n",
+       "                     [ 0.23711525,  0.24224289,  0.2396094 ,  0.23603547,  0.22876322,\n",
+       "                      -0.1514269 , -0.21984197, -0.25572085,  0.22679004, -0.22610106,\n",
+       "                      -0.18015033,  0.23062935],\n",
+       "                     [ 0.14032885,  0.17071794, -0.17316875, -0.16643512,  0.1764703 ,\n",
+       "                      -0.16535877,  0.16976672, -0.17395648, -0.18172397, -0.16909888,\n",
+       "                      -0.15671346,  0.17406578],\n",
+       "                     [ 0.27129218,  0.0269384 ,  0.30974644, -0.32017758,  0.30744395,\n",
+       "                       0.3084069 ,  0.29277486, -0.2918221 ,  0.30702245, -0.3208851 ,\n",
+       "                      -0.31668597,  0.30160227],\n",
+       "                     [ 0.20867229,  0.26565212,  0.240152  ,  0.25398126,  0.25057864,\n",
+       "                      -0.2671012 , -0.22444747, -0.25539088, -0.20067541,  0.24432313,\n",
+       "                       0.25486085,  0.24394904],\n",
+       "                     [-0.11263231, -0.10217136,  0.11905885,  0.11843061, -0.04683039,\n",
+       "                      -0.1214601 , -0.13461663, -0.11759   , -0.09937124, -0.11690577,\n",
+       "                      -0.11399411, -0.11268682],\n",
+       "                     [-0.3255043 ,  0.3025848 , -0.32363445,  0.31425825,  0.33041543,\n",
+       "                      -0.32620475,  0.33724216, -0.34903747,  0.33359587, -0.32901266,\n",
+       "                      -0.20129874, -0.27945545],\n",
+       "                     [-0.28321803,  0.30109507,  0.28544128, -0.2959158 , -0.2607007 ,\n",
+       "                      -0.3055412 , -0.2917673 ,  0.05050412,  0.29260388,  0.3141212 ,\n",
+       "                       0.2934034 ,  0.27473462],\n",
+       "                     [ 0.13607652, -0.15221834,  0.12748647,  0.13965258, -0.13058284,\n",
+       "                       0.11827224, -0.14616172, -0.1512048 , -0.14531319,  0.12655123,\n",
+       "                      -0.13622668,  0.14556718],\n",
+       "                     [-0.11822458, -0.13290364,  0.12828259, -0.10410035,  0.11239365,\n",
+       "                      -0.1154983 ,  0.11172337, -0.07072505, -0.13299397, -0.14156868,\n",
+       "                      -0.13565728,  0.12855493],\n",
+       "                     [ 0.21563186,  0.2163769 ,  0.20157547, -0.1918813 ,  0.2039993 ,\n",
+       "                      -0.17185296,  0.20537192, -0.22688936,  0.17318453,  0.20538278,\n",
+       "                      -0.20797041,  0.21802594]], dtype=float32)>\n",
+       "              (r_s_bias): <tf.Variable 'transformer/layer_._2/rel_attn/r_s_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "              array([[0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n",
+       "                     [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.]], dtype=float32)>\n",
+       "              (r_w_bias): <tf.Variable 'transformer/layer_._2/rel_attn/r_w_bias:0' shape=(16, 12) dtype=float32, numpy=\n",
+       "              array([[-0.05696932,  0.06740195, -0.04667107,  0.03021106,  0.06784655,\n",
+       "                       0.05382765,  0.11438312,  0.06822202, -0.05993791,  0.0104263 ,\n",
+       "                      -0.05300143,  0.05010788],\n",
+       "                     [-0.01765995, -0.00319457, -0.00498415, -0.02782676, -0.0098952 ,\n",
+       "                       0.0253829 ,  0.00407754, -0.00715973, -0.01590695,  0.03437943,\n",
+       "                      -0.00520796,  0.01617681],\n",
+       "                     [ 0.03272007, -0.02977583, -0.0506134 , -0.02890366, -0.02049887,\n",
+       "                      -0.01999169,  0.02516508,  0.0137186 ,  0.05666393,  0.01375697,\n",
+       "                      -0.00890318, -0.02950851],\n",
+       "                     [ 0.04980705, -0.10362899,  0.11056181, -0.00730947,  0.0607907 ,\n",
+       "                       0.11900052, -0.05051542,  0.00662729, -0.07860364,  0.10183192,\n",
+       "                      -0.06212043,  0.10200542],\n",
+       "                     [-0.01238653,  0.01794332,  0.01029513,  0.01060856,  0.06930448,\n",
+       "                       0.02380366,  0.03477835, -0.00071606, -0.01467696,  0.02097475,\n",
+       "                      -0.05677698, -0.02087275],\n",
+       "                     [-0.00938045, -0.10405949, -0.16658893,  0.11485966, -0.09381208,\n",
+       "                      -0.09224471, -0.08554322, -0.10385393,  0.05632018, -0.08339553,\n",
+       "                      -0.07872038,  0.08625405],\n",
+       "                     [-0.00826191,  0.00976967, -0.05739374, -0.0021869 , -0.01485464,\n",
+       "                       0.04506572,  0.01217067, -0.02800449, -0.05174134,  0.00862589,\n",
+       "                      -0.048445  , -0.01480543],\n",
+       "                     [-0.03782475,  0.02112421, -0.02993089,  0.02389399,  0.01590282,\n",
+       "                      -0.07890326,  0.02925709, -0.01764274, -0.01462149, -0.02284196,\n",
+       "                      -0.00965995,  0.03196143],\n",
+       "                     [-0.0716677 ,  0.02040408, -0.10738931,  0.01476234, -0.13842428,\n",
+       "                      -0.16400102, -0.10327879,  0.12093128, -0.10067357,  0.06000268,\n",
+       "                       0.1498203 , -0.13828841],\n",
+       "                     [-0.0734336 , -0.03922071,  0.04693641,  0.04044463, -0.02889867,\n",
+       "                       0.02146053,  0.02633213,  0.03645428,  0.01565466, -0.03198807,\n",
+       "                      -0.04235039, -0.03586181],\n",
+       "                     [-0.0363492 , -0.01702744,  0.01083277,  0.03850618, -0.03934945,\n",
+       "                       0.0334761 , -0.01588807, -0.02619908, -0.03216818, -0.01060551,\n",
+       "                      -0.02627585, -0.02604468],\n",
+       "                     [ 0.17790402, -0.12851508,  0.15003633, -0.08518519, -0.14476636,\n",
+       "                       0.15762399, -0.1230861 ,  0.11259855, -0.1162812 ,  0.04080873,\n",
+       "                      -0.05779656,  0.01974249],\n",
+       "                     [ 0.1006938 , -0.01474479, -0.12138946,  0.09284463, -0.03289664,\n",
+       "                       0.10987794,  0.07332658,  0.07245267, -0.06578953, -0.04563607,\n",
+       "                      -0.05779454, -0.10485042],\n",
+       "                     [ 0.02835969, -0.02732395, -0.03461828,  0.03488555, -0.0194285 ,\n",
+       "                      -0.02805083, -0.03940667, -0.04644369, -0.04771877,  0.0372751 ,\n",
+       "                      -0.04531232,  0.04370135],\n",
+       "                     [-0.03590996, -0.0298533 ,  0.03344881, -0.02929044,  0.0327831 ,\n",
+       "                      -0.03273273,  0.03038734, -0.01118592, -0.02868269, -0.02645629,\n",
+       "                      -0.03735423,  0.03250728],\n",
+       "                     [ 0.02255821, -0.00829006,  0.02793193, -0.03778297, -0.00788219,\n",
+       "                      -0.04285704,  0.02978727,  0.05981049, -0.03792181,  0.03670314,\n",
+       "                      -0.02965603,  0.01923521]], dtype=float32)>\n",
+       "              (seg_embed): <tf.Variable 'transformer/layer_._2/rel_attn/seg_embed:0' shape=(2, 16, 12) dtype=float32, numpy=\n",
+       "              array([[[-1.76201500e-02,  7.23677780e-03,  2.01333477e-03,\n",
+       "                       -2.08359188e-03, -1.94589060e-03, -4.36071586e-03,\n",
+       "                       -2.57775449e-04,  7.59294024e-03, -1.73478248e-03,\n",
+       "                       -8.46251752e-03, -1.39660882e-02, -3.43717635e-03],\n",
+       "                      [-4.64910455e-03, -1.21313529e-02,  4.58984112e-04,\n",
+       "                       -1.35235321e-02, -1.04260454e-02, -1.50275379e-02,\n",
+       "                        1.48641376e-03,  1.55189037e-02,  5.91089716e-03,\n",
+       "                       -1.43639045e-03, -4.50501451e-03, -1.60674599e-03],\n",
+       "                      [ 1.60457045e-02,  1.19220214e-02, -1.28411585e-02,\n",
+       "                        9.09075513e-03, -1.58246304e-03,  1.31560909e-03,\n",
+       "                        1.35482438e-02,  5.81168523e-03, -1.05840880e-02,\n",
+       "                       -2.59173219e-03, -1.32385837e-02, -1.04863010e-02],\n",
+       "                      [-1.21809123e-02, -9.36632976e-03,  1.40900621e-02,\n",
+       "                        5.91376238e-03,  3.72369075e-03, -2.30165408e-03,\n",
+       "                        6.51500374e-03, -1.45569751e-02,  1.43247042e-02,\n",
+       "                        8.62884428e-03,  8.86701699e-03,  7.06208264e-03],\n",
+       "                      [ 1.02975138e-03, -1.51113952e-02,  1.51367933e-02,\n",
+       "                        9.86063853e-03, -2.37684697e-03,  1.99867710e-02,\n",
+       "                        8.06052238e-03, -7.84497056e-03,  3.50654381e-03,\n",
+       "                        3.82472947e-03, -3.21561890e-03,  7.42827263e-03],\n",
+       "                      [-1.18214521e-03, -1.43715926e-02, -8.06425512e-03,\n",
+       "                       -4.83092666e-03, -6.24039629e-03, -8.07906594e-03,\n",
+       "                       -8.29043146e-03, -1.61064218e-03,  4.77965921e-03,\n",
+       "                       -1.74443778e-02,  1.33291204e-02,  2.52250186e-03],\n",
+       "                      [-2.72214878e-04, -5.96261350e-03, -4.04428970e-03,\n",
+       "                       -6.11912599e-03, -6.60097087e-03,  1.76098440e-02,\n",
+       "                        2.69631855e-03,  1.54615650e-02, -2.30501313e-03,\n",
+       "                        1.05330944e-02,  6.35499740e-03,  9.17971018e-04],\n",
+       "                      [ 1.18885133e-02, -1.31673440e-02, -1.38173029e-02,\n",
+       "                       -3.70214053e-04,  5.35412400e-04, -1.37663968e-02,\n",
+       "                        1.87561940e-02, -2.42887018e-03,  1.48599371e-02,\n",
+       "                        3.21199768e-03, -1.09921275e-02, -5.65451774e-05],\n",
+       "                      [-3.74776288e-03,  1.38268322e-02,  9.05366149e-04,\n",
+       "                        1.20775551e-02,  1.10800657e-02, -8.72297771e-03,\n",
+       "                        4.18304279e-03,  4.37156297e-03, -1.07811140e-02,\n",
+       "                        1.92405155e-03,  3.25367018e-03,  8.75506643e-03],\n",
+       "                      [-1.75420940e-02,  6.48414111e-03, -9.18684620e-03,\n",
+       "                        1.14019576e-03, -1.57787383e-03,  5.56192547e-03,\n",
+       "                       -2.17733742e-03,  1.37266740e-02,  1.05201543e-04,\n",
+       "                        6.03883620e-03, -6.69960165e-03,  7.33956508e-03],\n",
+       "                      [-3.18406359e-03, -3.90002085e-03,  1.50526362e-02,\n",
+       "                       -1.12941780e-03,  7.90258031e-03,  5.57251694e-03,\n",
+       "                       -7.09417462e-03,  1.54607017e-02,  7.53346644e-03,\n",
+       "                        3.84633575e-04, -3.10583878e-03, -1.67749040e-02],\n",
+       "                      [ 1.35503442e-03,  1.14696333e-02,  1.69651874e-03,\n",
+       "                       -7.29335006e-03, -5.32992696e-03,  1.07378103e-02,\n",
+       "                        4.87127202e-03, -2.83743930e-03,  1.49954585e-02,\n",
+       "                       -4.96328762e-03,  3.51505092e-04, -1.27301645e-02],\n",
+       "                      [-1.52372206e-02,  1.93297828e-03,  1.31188966e-02,\n",
+       "                        1.51950726e-02, -5.42309275e-03,  5.40221622e-03,\n",
+       "                       -4.99887299e-03,  1.21317999e-02, -7.83546944e-04,\n",
+       "                       -1.46692842e-02,  3.18376743e-03,  6.29057584e-04],\n",
+       "                      [ 1.57519914e-02,  1.33262370e-02,  1.81965269e-02,\n",
+       "                       -7.42383441e-03, -1.89367812e-02, -6.97921682e-03,\n",
+       "                        1.48802875e-02,  1.46334016e-04,  7.02118780e-03,\n",
+       "                       -5.09436592e-04, -1.18623655e-02,  8.64821393e-03],\n",
+       "                      [ 7.67512945e-03, -8.17312021e-03,  2.41133641e-03,\n",
+       "                        6.33313879e-03,  7.54179759e-03, -3.57080396e-04,\n",
+       "                       -1.65680032e-02, -1.17100859e-02, -3.40799033e-03,\n",
+       "                       -1.27221271e-02,  8.30271374e-03,  7.56895775e-03],\n",
+       "                      [-9.88331065e-03, -1.54634397e-02,  3.01517267e-03,\n",
+       "                        1.49145685e-02,  3.77843564e-04,  5.24123758e-03,\n",
+       "                        7.02060014e-03, -1.07852966e-02,  1.04165310e-02,\n",
+       "                       -1.54804869e-03,  1.93265197e-03,  1.79295102e-03]],\n",
+       "              \n",
+       "                     [[-9.20055062e-03, -4.07590671e-03,  1.03095314e-02,\n",
+       "                        1.51754147e-03, -6.64392672e-03,  3.19885346e-03,\n",
+       "                       -4.18524677e-03, -1.13258476e-03, -1.70869473e-02,\n",
+       "                        1.26075298e-02, -1.30983908e-02, -7.83024263e-03],\n",
+       "                      [ 8.46219435e-03,  1.79808959e-02, -5.26713906e-03,\n",
+       "                       -1.21411623e-03,  1.86999720e-02, -3.02859768e-03,\n",
+       "                       -7.32064573e-03,  6.67995447e-03, -1.27523849e-02,\n",
+       "                       -9.06828791e-04,  9.74638015e-03, -1.72092929e-03],\n",
+       "                      [-2.01144046e-03, -5.63319679e-03, -5.22003649e-03,\n",
+       "                       -6.08433876e-03, -4.08862112e-03,  1.46857975e-02,\n",
+       "                        5.76145761e-03, -5.26309886e-04,  1.52066564e-02,\n",
+       "                       -9.31825582e-03,  1.23050511e-02, -4.26228344e-03],\n",
+       "                      [ 5.15877875e-03,  1.52563385e-03,  3.33353621e-03,\n",
+       "                        1.24664837e-02,  2.89318291e-03,  1.85139419e-03,\n",
+       "                        1.32558951e-02, -6.19108090e-03, -9.30891279e-03,\n",
+       "                       -1.32808858e-03,  7.90562108e-03, -1.03561748e-02],\n",
+       "                      [ 5.24061127e-03,  1.13433264e-02,  9.25735664e-03,\n",
+       "                       -4.02201712e-03,  2.17584849e-04,  5.15505997e-03,\n",
+       "                        1.17364945e-02, -2.31140363e-03, -5.13278367e-03,\n",
+       "                        1.39841707e-02,  6.70559751e-03, -6.61857938e-03],\n",
+       "                      [-8.77800304e-03,  2.86807003e-03, -2.38788500e-03,\n",
+       "                       -4.60851612e-03, -1.44038992e-02, -1.35576446e-02,\n",
+       "                        2.62864912e-03,  1.24858366e-02, -4.75487951e-03,\n",
+       "                       -1.43712144e-02,  7.60273263e-03,  3.79640306e-03],\n",
+       "                      [-7.03944918e-03,  1.97168030e-02, -7.26960087e-03,\n",
+       "                       -1.95749779e-03,  1.92702599e-02,  4.81317611e-03,\n",
+       "                        3.79350944e-03, -4.26485110e-03, -8.09873175e-03,\n",
+       "                        9.86441132e-03,  1.22883695e-03,  1.08946105e-02],\n",
+       "                      [-5.65246725e-03,  1.21349460e-02,  8.74449220e-03,\n",
+       "                        2.44105165e-03,  9.21645202e-04, -1.55313788e-02,\n",
+       "                       -5.02558984e-03, -8.27753078e-03,  1.90036907e-03,\n",
+       "                       -5.53005328e-03, -4.72517498e-03,  2.99230800e-03],\n",
+       "                      [ 9.09654330e-03,  3.31225386e-03, -9.27547738e-03,\n",
+       "                        1.19113754e-02, -1.02159902e-02,  6.25002244e-03,\n",
+       "                        1.22169312e-02, -9.51310806e-03,  1.30269127e-02,\n",
+       "                       -9.39868111e-03, -5.70971100e-03, -4.75845346e-03],\n",
+       "                      [-7.14318268e-03, -1.64083187e-02, -2.20953533e-03,\n",
+       "                        6.77416055e-03,  7.19653070e-03, -7.37716153e-04,\n",
+       "                       -9.68988799e-03, -8.25300999e-03, -4.56864573e-03,\n",
+       "                       -2.91621801e-03, -5.80342347e-03, -3.35400272e-03],\n",
+       "                      [-1.02773616e-02, -5.61380177e-04,  1.61001328e-02,\n",
+       "                        2.81318300e-03, -4.40954976e-03,  1.18312403e-03,\n",
+       "                        6.44329004e-03, -6.98125642e-03, -1.70135554e-02,\n",
+       "                       -3.60937743e-03, -7.53390486e-04, -2.80036475e-03],\n",
+       "                      [ 3.10404622e-03,  1.14401504e-02, -5.79726277e-03,\n",
+       "                        1.60975326e-02,  6.44704467e-03, -1.83150265e-02,\n",
+       "                        1.08390385e-02,  1.02912402e-02, -8.38461891e-03,\n",
+       "                        5.39217493e-04, -9.44596343e-03, -7.39992782e-03],\n",
+       "                      [-2.65034917e-03, -8.84522311e-03, -9.31692962e-03,\n",
+       "                        5.32580819e-03, -1.69087376e-03,  2.63938890e-03,\n",
+       "                        8.64508655e-03,  1.84377395e-02,  1.37084173e-02,\n",
+       "                       -1.89692043e-02,  1.31469080e-02,  1.86770391e-02],\n",
+       "                      [ 2.77522532e-03,  7.73473585e-04, -3.17918998e-03,\n",
+       "                        6.54795533e-03,  2.26482097e-03,  2.92668981e-03,\n",
+       "                        9.05719213e-03, -8.49937089e-03, -7.30413711e-04,\n",
+       "                        5.80394780e-03, -1.54569661e-02, -6.13560947e-03],\n",
+       "                      [-5.60323242e-03,  3.84009560e-03,  1.06589124e-02,\n",
+       "                       -8.98534432e-03,  1.82283614e-02, -5.89990197e-03,\n",
+       "                       -8.10589176e-03,  2.83340388e-03,  1.38193602e-02,\n",
+       "                       -9.81133338e-03,  1.99420359e-02,  9.88560077e-03],\n",
+       "                      [-9.26352944e-03, -9.68698412e-03, -2.24529719e-03,\n",
+       "                        5.43415966e-03,  1.32604288e-02, -3.96666024e-03,\n",
+       "                       -1.34215793e-02,  1.25270914e-02, -1.48909222e-02,\n",
+       "                        2.03456427e-03, -6.15184056e-03, -1.86165944e-02]]],\n",
+       "                    dtype=float32)>\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "            (ff): TFXLNetFeedForward(\n",
+       "              (layer_norm): LayerNormalization(\n",
+       "                (axis): List(\n",
+       "                  (0): 2\n",
+       "                )\n",
+       "                (gamma): <tf.Variable 'transformer/layer_._2/ff/layer_norm/gamma:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([1.2426662 , 1.0785499 , 1.1864272 , 1.1377372 , 1.1753842 ,\n",
+       "                       1.021473  , 0.9678357 , 1.075388  , 1.3095288 , 1.1425663 ,\n",
+       "                       1.1866144 , 1.2455702 , 1.2347478 , 1.1598873 , 1.1709665 ,\n",
+       "                       1.2157438 , 1.2720231 , 1.1773459 , 1.1897057 , 1.2453034 ,\n",
+       "                       1.2315087 , 0.8506601 , 1.070401  , 1.1797608 , 1.2647007 ,\n",
+       "                       1.2300415 , 1.3117491 , 1.0503579 , 1.1387292 , 1.1583905 ,\n",
+       "                       1.3045065 , 0.8964496 , 1.1164156 , 1.2434596 , 1.2388874 ,\n",
+       "                       1.2253768 , 1.1266948 , 1.0823714 , 1.1271874 , 1.1423486 ,\n",
+       "                       1.2114882 , 1.1171185 , 1.1692193 , 1.2141284 , 1.1173588 ,\n",
+       "                       1.2316343 , 1.1557999 , 1.1985208 , 1.1526998 , 1.1652381 ,\n",
+       "                       1.1020889 , 1.2839859 , 1.255206  , 1.2338889 , 1.1334827 ,\n",
+       "                       1.2606637 , 1.1768172 , 1.133126  , 1.1616554 , 1.2591982 ,\n",
+       "                       1.2608087 , 1.2771136 , 1.2220011 , 1.2126131 , 1.3102369 ,\n",
+       "                       1.161485  , 1.2388053 , 1.0854522 , 1.109191  , 1.2433244 ,\n",
+       "                       1.1612333 , 1.119974  , 1.1657274 , 1.2391368 , 1.2408532 ,\n",
+       "                       1.2713405 , 1.2003607 , 1.0934154 , 1.2725589 , 1.2331755 ,\n",
+       "                       1.1576575 , 1.2792869 , 1.0979929 , 1.2165016 , 1.2552319 ,\n",
+       "                       1.2154813 , 1.2387912 , 1.2113545 , 1.092492  , 1.287265  ,\n",
+       "                       1.2405735 , 1.086961  , 1.2186264 , 1.3057741 , 1.2447143 ,\n",
+       "                       1.145893  , 1.0720298 , 1.1931537 , 1.2258768 , 1.2223678 ,\n",
+       "                       1.1108402 , 1.2334076 , 1.2989581 , 1.0500095 , 1.2545264 ,\n",
+       "                       1.254883  , 1.06171   , 1.1827933 , 1.2883551 , 1.2290361 ,\n",
+       "                       1.1559633 , 1.0829264 , 1.2454283 , 1.2021191 , 1.1572067 ,\n",
+       "                       1.1571015 , 1.2683761 , 1.0523615 , 1.1081159 , 1.1978542 ,\n",
+       "                       1.2392715 , 1.1955217 , 1.154171  , 1.1076897 , 1.2144334 ,\n",
+       "                       1.0649818 , 1.2400447 , 1.1655055 , 1.1342129 , 1.2052649 ,\n",
+       "                       1.3010224 , 1.1970998 , 1.0977236 , 1.2325233 , 1.1176093 ,\n",
+       "                       1.1990188 , 1.1427927 , 1.1808167 , 1.1174316 , 1.1828363 ,\n",
+       "                       1.1767571 , 1.2167183 , 1.1697968 , 1.1744046 , 0.8939868 ,\n",
+       "                       1.2574182 , 1.2255412 , 1.2447684 , 1.1385155 , 1.1537726 ,\n",
+       "                       1.2788998 , 1.1112866 , 1.2417119 , 1.2249215 , 1.2867014 ,\n",
+       "                       1.1683307 , 1.2784356 , 1.1631655 , 1.1246334 , 1.2807626 ,\n",
+       "                       1.2504355 , 1.09938   , 1.2896625 , 1.2980561 , 1.1257046 ,\n",
+       "                       1.246858  , 1.0817022 , 1.0696605 , 1.2495583 , 1.2915183 ,\n",
+       "                       1.1820105 , 0.96095157, 1.1545107 , 1.1149871 , 1.1985911 ,\n",
+       "                       1.2794744 , 1.1154523 , 1.1982616 , 1.1381829 , 1.22324   ,\n",
+       "                       1.1455675 , 1.1988021 , 1.3195752 , 1.2144073 , 1.2616345 ,\n",
+       "                       1.1431206 , 1.2790085 , 1.0831236 , 1.125044  , 1.2778053 ,\n",
+       "                       1.1591135 , 1.1882532 ], dtype=float32)>\n",
+       "                (beta): <tf.Variable 'transformer/layer_._2/ff/layer_norm/beta:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([-0.01049791,  0.02152375, -0.03378561,  0.03164947,  0.00819711,\n",
+       "                       -0.01405335, -0.02091987,  0.00788867, -0.01027707, -0.00172993,\n",
+       "                       -0.01103046,  0.00836649,  0.00941498,  0.0382531 , -0.00642702,\n",
+       "                        0.01852331,  0.00470948,  0.02344545,  0.01141193,  0.00127532,\n",
+       "                        0.01603293, -0.04580598, -0.01747353,  0.02438874, -0.04060405,\n",
+       "                        0.00479471, -0.00592997, -0.00421144, -0.01156144, -0.00946089,\n",
+       "                       -0.00481299,  0.04446075, -0.04495647, -0.01447472,  0.02050785,\n",
+       "                       -0.00235888, -0.0057586 ,  0.01404028, -0.0084481 , -0.00079954,\n",
+       "                        0.00200081,  0.01832308, -0.01832635,  0.01489427,  0.00268834,\n",
+       "                       -0.02017709,  0.04548539,  0.05178156,  0.02737129, -0.00052763,\n",
+       "                        0.00891565,  0.01618693,  0.02362686, -0.01064536,  0.01651912,\n",
+       "                        0.03200817, -0.01955355, -0.00421685, -0.05510062, -0.00611641,\n",
+       "                       -0.01592397, -0.02227358, -0.02164057, -0.01181097,  0.00364242,\n",
+       "                       -0.01818874,  0.02677143,  0.00873136,  0.00520407,  0.00165503,\n",
+       "                       -0.0106048 , -0.0474345 , -0.01927847, -0.00275519, -0.05010425,\n",
+       "                        0.00443012, -0.02050812, -0.01938166,  0.02276452, -0.0491508 ,\n",
+       "                       -0.02156696,  0.00576269,  0.01251344, -0.00798486,  0.01934762,\n",
+       "                       -0.00466829,  0.02987502,  0.0449635 ,  0.02794607, -0.01035585,\n",
+       "                       -0.03455339, -0.02017214, -0.01751639,  0.00814069, -0.00960286,\n",
+       "                        0.02078385, -0.00918255,  0.04219389,  0.01527736, -0.00782714,\n",
+       "                       -0.01744033,  0.02201356, -0.01601992,  0.038303  ,  0.03574631,\n",
+       "                        0.04583006,  0.00173102,  0.02031284,  0.0127416 , -0.04929825,\n",
+       "                       -0.00745583, -0.00845573, -0.00315962,  0.0541168 ,  0.03200234,\n",
+       "                        0.00109879, -0.00174849,  0.01873765,  0.00980952,  0.03789899,\n",
+       "                       -0.00356435, -0.02858787, -0.01368637,  0.0037826 , -0.00455629,\n",
+       "                       -0.02301045, -0.03979176,  0.02152948, -0.0191615 ,  0.05090038,\n",
+       "                        0.01223159, -0.01177116, -0.01836306, -0.01753503,  0.00840725,\n",
+       "                        0.01081169, -0.03334855,  0.02582728, -0.00310735,  0.01060186,\n",
+       "                        0.02900856, -0.00193786, -0.00611028, -0.02355231,  0.02730693,\n",
+       "                        0.0168157 ,  0.0453185 , -0.00795171, -0.0490472 ,  0.01299703,\n",
+       "                       -0.01211376, -0.04820883, -0.00058289,  0.03355829,  0.00526739,\n",
+       "                       -0.00226219, -0.00548809,  0.01104187, -0.01620302, -0.01379755,\n",
+       "                        0.03002222,  0.01691281, -0.03559435,  0.02778582,  0.00775762,\n",
+       "                        0.00697485, -0.00750486,  0.02037126,  0.01142175,  0.00481389,\n",
+       "                        0.00276021,  0.05482011,  0.04322674, -0.00956445,  0.00750658,\n",
+       "                       -0.03632697, -0.00013556, -0.03406565, -0.01553119,  0.00891615,\n",
+       "                       -0.03667552,  0.0512755 ,  0.0034136 ,  0.03808332, -0.01828413,\n",
+       "                        0.01024727,  0.03339678, -0.01204124,  0.01003862, -0.00612356,\n",
+       "                       -0.00908286,  0.01659943], dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (layer_1): Dense(\n",
+       "                768, activation=linear, use_bias=True\n",
+       "                (kernel): <tf.Variable 'transformer/layer_._2/ff/layer_1/kernel:0' shape=(192, 768) dtype=float32, numpy=\n",
+       "                array([[ 0.0200138 ,  0.0453618 ,  0.05944573, ..., -0.03587371,\n",
+       "                         0.01224422, -0.00072175],\n",
+       "                       [ 0.02137091, -0.01859555, -0.04710541, ..., -0.02794299,\n",
+       "                         0.01419899, -0.0136291 ],\n",
+       "                       [-0.03292815,  0.00347762,  0.05609084, ...,  0.03168143,\n",
+       "                        -0.0128223 ,  0.00386102],\n",
+       "                       ...,\n",
+       "                       [-0.02450894, -0.02459157, -0.0068263 , ...,  0.04013702,\n",
+       "                        -0.00466742, -0.02921941],\n",
+       "                       [ 0.03239494, -0.00134928,  0.00123798, ...,  0.00292211,\n",
+       "                        -0.00111932,  0.02714985],\n",
+       "                       [-0.02418012,  0.01257174, -0.00812958, ..., -0.04709027,\n",
+       "                         0.01096694, -0.02088788]], dtype=float32)>\n",
+       "                (bias): <tf.Variable 'transformer/layer_._2/ff/layer_1/bias:0' shape=(768,) dtype=float32, numpy=\n",
+       "                array([-3.33372578e-02, -1.20304301e-02, -2.64285505e-02, -8.84530786e-03,\n",
+       "                        9.27949324e-03, -1.14668226e-02, -3.10168378e-02, -1.43622728e-02,\n",
+       "                       -1.12179536e-02, -3.48813981e-02, -7.80524500e-03, -6.67409645e-03,\n",
+       "                       -2.71618329e-02,  1.33763952e-02, -1.43442694e-02, -2.26112269e-02,\n",
+       "                       -1.89228449e-02,  4.67353873e-03, -7.46711437e-03, -4.57441760e-03,\n",
+       "                       -1.14336181e-02, -3.73703078e-03, -4.13804967e-03, -2.49586198e-02,\n",
+       "                       -2.95854453e-02,  6.92587765e-03, -2.84688734e-03, -8.96761846e-03,\n",
+       "                        2.66582938e-04,  2.34540319e-03, -1.01395976e-02, -1.24753118e-02,\n",
+       "                       -2.55310051e-02, -1.66565515e-02, -2.73905843e-02, -1.69004244e-03,\n",
+       "                       -9.20773949e-03, -1.39765264e-02, -1.25533100e-02, -6.37155911e-03,\n",
+       "                       -2.09209453e-02, -3.99773149e-03, -1.79250874e-02,  4.29014070e-03,\n",
+       "                       -5.00511331e-03, -9.72811226e-03,  1.04333623e-04, -1.89962573e-02,\n",
+       "                       -1.60261542e-02, -1.94814522e-02,  1.01348842e-02, -8.10685009e-03,\n",
+       "                        2.04461813e-03, -2.24812888e-02, -6.67038467e-03, -1.02129420e-02,\n",
+       "                       -1.79766286e-02, -8.14508274e-03,  8.25855602e-03, -2.43141619e-03,\n",
+       "                       -7.08713830e-02, -1.82897076e-02, -2.60730693e-03, -1.65768694e-02,\n",
+       "                       -1.64023545e-02, -1.30782751e-02, -4.28689923e-03,  6.52118400e-03,\n",
+       "                       -1.96230076e-02, -3.99262942e-02, -2.73289271e-02,  4.30044835e-04,\n",
+       "                       -1.49638178e-02, -5.51447086e-02, -9.65916365e-03,  3.96977365e-03,\n",
+       "                        1.84384976e-02, -5.73096680e-04, -2.91963312e-04, -1.73625816e-02,\n",
+       "                       -3.48348282e-02, -7.23623345e-03, -1.28294611e-02, -1.53274667e-02,\n",
+       "                       -4.12606215e-03, -1.72958728e-02, -1.18990690e-02, -3.26990895e-02,\n",
+       "                       -4.20313291e-02,  5.03082108e-03,  2.19244440e-03, -2.19866037e-02,\n",
+       "                       -1.68198347e-02, -3.78365703e-02, -9.67846625e-03, -6.25378080e-03,\n",
+       "                       -1.03926891e-03,  1.34079829e-02,  3.34297912e-03, -2.53701061e-02,\n",
+       "                       -9.54755396e-03, -1.01934336e-02, -1.20657152e-02, -2.67628189e-02,\n",
+       "                       -8.09953455e-03, -6.08193688e-03,  3.38082924e-03, -1.18695842e-02,\n",
+       "                       -3.71371172e-02, -7.80474115e-03,  1.11220693e-02, -8.33167508e-03,\n",
+       "                       -5.58236428e-03, -1.80757064e-02, -2.09607501e-02,  5.48776379e-03,\n",
+       "                       -2.94951964e-02, -2.46344414e-02, -1.53862284e-02, -3.09490436e-03,\n",
+       "                       -3.11847795e-02, -1.71698779e-02, -3.63941677e-03, -2.74066366e-02,\n",
+       "                       -1.05475530e-03, -9.25327931e-03, -2.82230861e-02, -1.94824096e-02,\n",
+       "                       -1.38977701e-02, -1.04714287e-02,  4.30400576e-03, -2.20607650e-02,\n",
+       "                       -1.64322909e-02, -2.57586893e-02, -1.70667171e-02,  6.02981949e-04,\n",
+       "                       -2.33562738e-02,  6.21822709e-03, -3.45053500e-03, -1.09830648e-02,\n",
+       "                       -8.82339850e-03, -3.73522788e-02, -4.52396683e-02, -2.81988066e-02,\n",
+       "                        1.19963416e-03, -1.27797676e-02, -2.18338128e-02, -2.80943122e-02,\n",
+       "                       -3.59988119e-03, -1.18604396e-02, -6.16526231e-03,  2.33954028e-03,\n",
+       "                       -1.63589418e-03, -2.47196518e-02,  2.08187494e-02, -4.36770730e-02,\n",
+       "                       -3.05688493e-02, -1.34526286e-03, -3.30831483e-02,  3.23941559e-03,\n",
+       "                       -3.06175444e-02, -2.90571637e-02, -2.06385646e-02,  8.43056943e-03,\n",
+       "                        2.05167918e-03,  1.05036711e-02, -4.97501083e-02,  8.82736221e-03,\n",
+       "                       -3.26694426e-04, -1.03351744e-02,  8.86771642e-03, -2.79260948e-02,\n",
+       "                       -9.40874964e-03, -2.87361499e-02,  5.42023219e-03, -2.59471256e-02,\n",
+       "                       -4.26682644e-03, -1.39961147e-03,  5.25543839e-03,  1.44586945e-03,\n",
+       "                       -4.93929535e-03, -1.81996729e-02, -3.66596431e-02, -7.88619276e-03,\n",
+       "                       -7.22077349e-03, -1.38734980e-02, -2.62850765e-02, -1.04199219e-02,\n",
+       "                        4.22720285e-03, -4.93065640e-02, -1.53207366e-04,  1.66621129e-03,\n",
+       "                       -2.31967121e-02,  7.48836808e-03, -2.90694274e-02, -6.71045436e-03,\n",
+       "                       -2.49706525e-02, -3.15400236e-03, -2.88101286e-02, -1.17433537e-02,\n",
+       "                        1.22765440e-03, -8.89103208e-03, -1.20216729e-02, -2.58050431e-02,\n",
+       "                       -2.23770384e-02, -5.27241342e-02,  4.58361907e-03, -9.20900144e-03,\n",
+       "                       -4.86494834e-03,  5.95131190e-03, -3.35572027e-02, -5.22214063e-02,\n",
+       "                       -2.77308151e-02, -2.04498172e-02, -1.13594290e-02,  4.46268264e-03,\n",
+       "                       -1.38799436e-02, -2.00398602e-02, -1.42829427e-02,  4.64145560e-03,\n",
+       "                        2.28046585e-04, -4.69782483e-03, -2.27966066e-02,  7.99322035e-03,\n",
+       "                       -3.26800458e-02, -1.99418738e-02,  9.19471588e-03, -2.12415587e-02,\n",
+       "                       -2.27290746e-02, -1.31595824e-02, -1.15283253e-02, -7.50241475e-03,\n",
+       "                       -2.39377823e-02, -6.95785088e-03, -1.58205442e-02, -1.71613060e-02,\n",
+       "                       -1.08889155e-02, -2.31623300e-03, -1.26144765e-02, -1.01996101e-02,\n",
+       "                       -5.04346937e-03, -4.60104551e-03, -5.06210662e-02, -6.60978723e-03,\n",
+       "                       -5.96453110e-03, -7.14415684e-02, -1.78630725e-02,  5.41150104e-03,\n",
+       "                       -1.03690885e-02, -5.87195996e-03, -1.95817929e-02, -1.92977004e-02,\n",
+       "                        1.77244954e-02,  1.22857792e-03, -2.35614125e-02,  8.67873151e-03,\n",
+       "                       -1.04582077e-02, -1.39173279e-02, -3.24732549e-02, -3.26969177e-02,\n",
+       "                       -1.23288631e-02,  5.84124122e-03,  3.75783164e-03, -6.03185035e-02,\n",
+       "                       -5.38562834e-02, -1.87854804e-02,  1.52939111e-02, -1.73892621e-02,\n",
+       "                        1.84238015e-03,  4.95142397e-03, -3.33155915e-02, -1.19728940e-02,\n",
+       "                       -3.54210101e-03, -3.57735856e-03, -1.00171883e-02,  1.33268954e-02,\n",
+       "                        5.69132995e-03,  1.47731975e-02, -1.83567614e-03, -3.20666321e-02,\n",
+       "                       -2.86797527e-02, -2.64031384e-02, -7.56429462e-03, -1.20009044e-02,\n",
+       "                        1.12973684e-02, -5.62287122e-03, -1.97638269e-03, -2.07206514e-02,\n",
+       "                       -8.64086524e-02,  1.15817529e-04, -1.07997051e-02, -5.99109055e-03,\n",
+       "                        5.98610938e-03, -3.76985781e-03, -1.16103915e-02, -4.73026782e-02,\n",
+       "                       -3.24012749e-02, -1.52687272e-02,  1.39175309e-02, -3.89402099e-02,\n",
+       "                        4.79430798e-03, -3.10392287e-02, -1.22434238e-03, -1.20959114e-02,\n",
+       "                       -6.41068676e-03,  1.71033880e-05, -6.88490784e-03, -1.94683392e-02,\n",
+       "                       -1.64008960e-02, -2.63622683e-02, -5.85283060e-03, -1.85996443e-02,\n",
+       "                       -2.71032117e-02, -2.38017156e-03, -4.95283352e-03, -9.60978493e-03,\n",
+       "                       -1.25073837e-02, -1.55702140e-02, -1.95839349e-02, -2.03742441e-02,\n",
+       "                       -1.85265532e-03,  5.65958768e-03, -6.40596682e-03, -4.88626864e-03,\n",
+       "                       -2.15109205e-03, -9.18837916e-03, -2.19131261e-02, -3.64525206e-02,\n",
+       "                       -1.73025541e-02, -2.00000545e-03, -8.19304609e-04,  6.57165097e-03,\n",
+       "                       -6.28626253e-03, -2.95665115e-02, -6.25590011e-02, -1.84975117e-02,\n",
+       "                        6.67490123e-04, -2.22133230e-02, -1.77290067e-02, -3.24275382e-02,\n",
+       "                        7.81799573e-03, -2.80588735e-02, -1.20364176e-02, -7.06162909e-03,\n",
+       "                       -5.66909835e-03, -5.73322969e-03, -1.52700823e-02,  8.84732977e-03,\n",
+       "                       -1.49889970e-02, -1.92730948e-02,  1.35639915e-03, -3.77680473e-02,\n",
+       "                       -2.19104849e-02, -2.64837239e-02, -9.12345655e-04, -2.44116709e-02,\n",
+       "                        1.09210573e-02, -1.41132390e-04,  1.17622353e-02, -3.11280079e-02,\n",
+       "                        7.26891309e-03, -4.66628969e-02, -1.35422535e-02, -3.92462946e-02,\n",
+       "                       -3.86740407e-03, -1.41668820e-03,  1.08932122e-03, -1.82715822e-02,\n",
+       "                       -1.30463401e-02, -2.50185985e-04, -1.38900643e-02,  1.21532627e-04,\n",
+       "                       -7.55504519e-03, -6.68428373e-03,  3.75840045e-03,  3.87968845e-03,\n",
+       "                       -2.96963658e-02, -3.35212089e-02, -2.25975411e-03,  3.00933095e-03,\n",
+       "                       -4.02128510e-02, -1.42791662e-02, -5.48909791e-03, -3.20998975e-03,\n",
+       "                       -1.32048894e-02, -1.12547325e-02, -1.24998428e-02, -2.58491207e-02,\n",
+       "                        9.08760849e-05,  1.16652362e-02, -1.65408142e-02,  5.10796235e-05,\n",
+       "                       -8.15010723e-03, -1.28825111e-02, -3.89126949e-02, -9.37087275e-03,\n",
+       "                       -6.18562428e-03, -6.63009584e-02, -9.35898162e-03, -2.45649852e-02,\n",
+       "                       -7.92087708e-03, -1.31273726e-02, -1.97531860e-02, -1.37249520e-02,\n",
+       "                       -8.93866643e-03, -4.28636521e-02, -3.74601525e-03, -2.80440412e-02,\n",
+       "                       -1.74158271e-02,  9.33865644e-03,  4.91131470e-03,  1.11120502e-02,\n",
+       "                       -2.57497951e-02, -4.39163633e-02,  6.66483399e-03, -5.06761135e-04,\n",
+       "                       -2.32957341e-02, -2.53415443e-02, -4.46022581e-03,  1.13388188e-02,\n",
+       "                        2.02134461e-03, -1.31819705e-02,  1.01864496e-02, -3.78090749e-03,\n",
+       "                       -3.53341899e-03, -1.36399046e-02, -1.20440796e-02, -1.36488294e-02,\n",
+       "                       -1.38256513e-02, -6.28865436e-02, -4.16373424e-02, -4.74301493e-03,\n",
+       "                       -2.44922694e-02,  1.66400254e-03, -1.12737331e-03, -3.13604530e-03,\n",
+       "                       -3.24759744e-02, -1.65949818e-02,  2.92222598e-03, -1.58712268e-03,\n",
+       "                       -1.77903417e-02, -1.66294689e-03, -5.67669561e-03, -1.32287908e-02,\n",
+       "                       -1.93906557e-02, -4.19550687e-02,  1.61865051e-03, -2.05391757e-02,\n",
+       "                       -2.26580556e-02,  1.11057591e-02, -6.92468788e-03, -5.12448046e-03,\n",
+       "                       -3.18950079e-02, -4.35872423e-03, -2.53419876e-02,  1.55006526e-02,\n",
+       "                        1.20479669e-02, -1.77465249e-02, -2.14677062e-02,  2.35745008e-03,\n",
+       "                       -1.81921013e-02, -7.76443025e-03, -3.23890446e-04, -5.32940868e-03,\n",
+       "                        1.67221632e-02, -1.97462440e-02,  1.09343296e-02,  1.14851557e-02,\n",
+       "                       -2.77556907e-02, -8.87866947e-04,  1.33279143e-04, -5.81024587e-02,\n",
+       "                       -3.61334137e-03, -2.81540696e-02, -1.51612861e-02, -1.97562072e-02,\n",
+       "                        5.15708001e-04, -6.83074538e-03, -1.87120978e-02, -2.43883245e-02,\n",
+       "                       -7.91893061e-03, -4.11415892e-03, -8.43337551e-03,  1.16346637e-02,\n",
+       "                       -2.43854988e-02, -2.16020066e-02, -3.26048471e-02, -1.09725781e-02,\n",
+       "                       -3.57973687e-02, -5.08582965e-02, -1.33388182e-02,  5.90886362e-03,\n",
+       "                       -1.32997604e-02, -9.13704652e-03,  1.77791761e-03, -1.10328160e-02,\n",
+       "                        1.60120130e-02, -2.30981521e-02, -1.49227204e-02,  5.10551268e-03,\n",
+       "                        6.10626582e-03, -2.87795793e-02,  1.70728483e-03, -1.78763717e-02,\n",
+       "                       -1.94948930e-02, -1.66736473e-03, -1.70627479e-02,  1.37127992e-02,\n",
+       "                       -1.32692317e-02,  6.65037474e-03, -1.29313814e-02,  5.57297794e-03,\n",
+       "                       -1.12800766e-02,  4.67792340e-03, -7.82010332e-03, -4.64824103e-02,\n",
+       "                       -2.65281610e-02,  1.47148669e-02, -4.31900006e-03, -2.03008670e-02,\n",
+       "                       -2.63399538e-03, -2.16606539e-02, -1.90197546e-02, -1.78931039e-02,\n",
+       "                       -1.38731794e-02, -3.75676341e-02, -8.64620414e-03, -6.58054799e-02,\n",
+       "                       -1.70020033e-02, -3.28940749e-02,  4.65774618e-04, -1.98039897e-02,\n",
+       "                       -2.59156171e-02, -7.85135943e-03, -1.25278654e-02, -1.11970643e-03,\n",
+       "                       -2.91844960e-02, -1.97878089e-02,  2.52304319e-03,  5.96133480e-03,\n",
+       "                       -5.23802266e-02, -2.73484532e-02, -3.66229527e-02, -1.43872052e-02,\n",
+       "                       -4.07523988e-03, -5.29169776e-02, -2.10777409e-02, -3.25676277e-02,\n",
+       "                       -9.24565084e-03, -5.09950239e-03, -1.04549387e-02, -2.45881788e-02,\n",
+       "                       -3.48805226e-02, -5.53940125e-02, -3.37969400e-02, -5.90338185e-03,\n",
+       "                       -5.14366738e-02, -2.08435231e-03, -7.82921351e-03, -1.05392961e-02,\n",
+       "                       -6.99244160e-03, -2.68173851e-02, -1.15421731e-02, -2.56756227e-02,\n",
+       "                        1.55956158e-03, -4.72193910e-03, -1.58323143e-02, -9.19513591e-03,\n",
+       "                       -2.00888999e-02, -3.19119655e-02, -3.35531938e-03, -1.04231259e-03,\n",
+       "                       -9.81072523e-03, -1.77766923e-02, -2.31661070e-02, -3.86816682e-03,\n",
+       "                       -5.58865443e-03, -1.16977030e-02, -2.61800736e-02, -1.86645531e-03,\n",
+       "                       -3.06399371e-02, -9.05887131e-03, -1.93412770e-02, -5.43606542e-02,\n",
+       "                        2.60276510e-03, -8.96754768e-03, -3.24303173e-02, -3.29047143e-02,\n",
+       "                        2.46463460e-03, -3.13622109e-03, -1.11212321e-02, -1.36358421e-02,\n",
+       "                       -1.89102590e-02, -3.58816683e-02, -8.04788154e-03, -3.75765860e-02,\n",
+       "                        1.24625880e-02, -3.20654698e-02, -6.90695737e-03,  1.00988441e-03,\n",
+       "                        2.75147846e-03, -1.61069054e-02,  2.06897836e-02,  1.87683210e-03,\n",
+       "                       -1.62859093e-02, -2.90039498e-02, -1.36160792e-03, -1.72167066e-02,\n",
+       "                        7.65678659e-03,  2.95401318e-04, -7.96781853e-03, -3.59004922e-02,\n",
+       "                       -1.22297904e-03,  1.20183127e-02, -3.44441235e-02,  3.89194262e-04,\n",
+       "                       -2.51837485e-02, -1.65693760e-02, -3.02922279e-02,  6.05576904e-03,\n",
+       "                        3.68867512e-03,  3.91587103e-03, -6.81368308e-03, -6.03012135e-03,\n",
+       "                       -1.47708375e-02, -1.30854193e-02, -9.50133801e-03, -3.45344692e-02,\n",
+       "                       -2.94285733e-02,  8.44507944e-03, -2.27477471e-03, -1.56889744e-02,\n",
+       "                        1.59581471e-02, -1.25193940e-02, -1.91157572e-02, -3.21304277e-02,\n",
+       "                        8.02859943e-03, -8.64375941e-03,  3.78777785e-03, -6.59673940e-03,\n",
+       "                       -3.39506269e-02,  5.64883510e-03, -6.13440014e-02, -7.93107785e-03,\n",
+       "                       -1.50270360e-02, -1.61594078e-02, -1.94392912e-02, -1.68349724e-02,\n",
+       "                        3.09064277e-02,  4.93095955e-03, -3.94429043e-02, -1.15872324e-02,\n",
+       "                       -1.28836315e-02, -2.01286804e-02, -3.84248607e-02, -3.05649750e-02,\n",
+       "                       -1.04364334e-02, -2.77922582e-03, -2.36243010e-02, -2.01014858e-02,\n",
+       "                       -4.84081805e-02, -2.26343190e-03,  6.25391584e-03, -6.36793440e-03,\n",
+       "                       -6.46613713e-04, -9.01893992e-03, -3.63259926e-03, -6.74518943e-03,\n",
+       "                       -2.59635970e-02, -2.46191379e-02, -1.03657711e-02, -2.07470562e-02,\n",
+       "                       -7.71256257e-03, -2.91075669e-02, -1.47521086e-02, -7.92815816e-03,\n",
+       "                       -6.64313324e-03, -1.91371590e-02, -1.40240137e-02, -5.21422923e-02,\n",
+       "                       -3.74027751e-02, -2.06586719e-03, -3.58425593e-03, -2.08234824e-02,\n",
+       "                       -2.45748758e-02,  9.72781982e-03, -4.43681739e-02, -8.66457354e-03,\n",
+       "                       -4.82482389e-02, -1.56797916e-02, -2.47380249e-02,  1.87400840e-02,\n",
+       "                       -3.79825868e-02, -1.38318846e-02, -2.10447628e-02,  1.08323405e-02,\n",
+       "                       -2.42531281e-02,  1.12944627e-02,  2.59104045e-03, -1.14521887e-02,\n",
+       "                       -1.68768931e-02, -1.68022700e-02, -5.14307059e-03,  3.44281056e-04,\n",
+       "                       -4.87398217e-03, -9.55253374e-03, -1.22880088e-02, -2.63365097e-02,\n",
+       "                       -3.84489149e-02, -2.61132549e-02, -7.96650629e-03, -1.69632696e-02,\n",
+       "                       -1.71560347e-02, -2.25002784e-02, -8.88591073e-03, -2.72413641e-02,\n",
+       "                       -2.03668867e-04, -1.90096684e-02,  8.35950393e-03, -1.64371338e-02,\n",
+       "                        1.47741567e-02, -5.84984869e-02, -1.04708606e-02, -1.68935489e-02,\n",
+       "                       -3.54976244e-02, -2.78694136e-03, -1.73107199e-02,  5.00151608e-03,\n",
+       "                       -3.82142793e-03,  1.13632660e-02, -1.49819618e-02,  1.17110950e-03,\n",
+       "                       -2.05652462e-03, -8.59066565e-03, -2.67075058e-02, -2.47322544e-02,\n",
+       "                       -7.30546482e-04, -2.14617644e-02, -2.84397081e-02, -1.64100621e-02,\n",
+       "                       -1.08914925e-02, -1.72290541e-02, -1.59400273e-02,  8.52343906e-03,\n",
+       "                       -6.42960984e-03, -1.95234921e-02, -2.53217611e-02, -1.46880426e-04,\n",
+       "                       -4.34152931e-02, -2.06201486e-02, -7.12397024e-02, -8.53891764e-03,\n",
+       "                       -9.43581574e-03,  3.32818925e-02, -1.99020449e-02, -8.32063705e-03,\n",
+       "                       -1.83409415e-02, -1.25894314e-02,  1.62209210e-03, -3.50676570e-03,\n",
+       "                       -2.81427167e-02, -1.38427606e-02,  3.03339353e-03, -2.49240994e-02,\n",
+       "                        7.31371716e-03, -1.02051990e-02, -1.33559704e-02, -6.67838380e-04],\n",
+       "                      dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (layer_2): Dense(\n",
+       "                192, activation=linear, use_bias=True\n",
+       "                (kernel): <tf.Variable 'transformer/layer_._2/ff/layer_2/kernel:0' shape=(768, 192) dtype=float32, numpy=\n",
+       "                array([[-0.00277009, -0.00766354,  0.00111258, ...,  0.0023168 ,\n",
+       "                        -0.00371265,  0.03133386],\n",
+       "                       [ 0.01033583,  0.01263355,  0.00214211, ..., -0.03399085,\n",
+       "                         0.01188842, -0.0047044 ],\n",
+       "                       [ 0.03755607,  0.01134737, -0.00071585, ...,  0.00905287,\n",
+       "                         0.0055303 ,  0.00608071],\n",
+       "                       ...,\n",
+       "                       [-0.02624071,  0.00230232, -0.0022273 , ...,  0.02333591,\n",
+       "                        -0.00608842, -0.00880447],\n",
+       "                       [ 0.02174632, -0.01645869,  0.00782272, ..., -0.02966961,\n",
+       "                        -0.0024398 ,  0.01270658],\n",
+       "                       [ 0.00865628, -0.00132068, -0.02910091, ...,  0.00513306,\n",
+       "                         0.0078499 ,  0.0188979 ]], dtype=float32)>\n",
+       "                (bias): <tf.Variable 'transformer/layer_._2/ff/layer_2/bias:0' shape=(192,) dtype=float32, numpy=\n",
+       "                array([ 2.13714177e-03,  7.69167487e-03, -5.89249097e-03,  9.38836485e-03,\n",
+       "                        4.06415015e-03,  2.61747669e-02,  2.37808824e-02, -1.49717368e-03,\n",
+       "                       -1.51039485e-03,  3.72942095e-03,  1.19742397e-02,  4.87796776e-03,\n",
+       "                        6.80093654e-04, -7.29197753e-04, -5.09615056e-03, -1.20036164e-02,\n",
+       "                       -1.96033157e-02,  9.48915444e-03, -2.59881979e-03, -1.12662334e-02,\n",
+       "                        7.63040036e-03,  5.20693026e-02, -5.27575146e-03,  3.14396597e-03,\n",
+       "                        1.55584817e-03, -1.92209911e-02, -7.76566193e-03,  1.75420791e-02,\n",
+       "                        4.84731398e-04,  5.83604816e-03, -8.13735416e-04, -4.79252115e-02,\n",
+       "                       -1.84813831e-02, -2.28549889e-03, -6.95835566e-03, -5.86241111e-03,\n",
+       "                       -5.69443172e-03,  1.65568888e-02, -1.38337014e-03,  1.48930652e-02,\n",
+       "                        6.02127891e-03, -1.39874406e-02, -1.65665802e-02,  9.20123979e-03,\n",
+       "                        2.05240049e-03,  1.01555558e-02,  1.16605442e-02,  1.38822282e-02,\n",
+       "                        8.48454516e-03,  8.67671042e-04,  9.06788185e-03,  2.90332711e-03,\n",
+       "                        5.12160128e-03, -7.77168153e-03, -7.38827465e-03, -6.99232193e-03,\n",
+       "                       -1.00234915e-02, -1.26919309e-02, -3.56813939e-03, -8.51563271e-03,\n",
+       "                       -5.44333598e-03, -1.24330847e-02,  7.89948646e-03, -5.10330265e-03,\n",
+       "                        8.52113962e-03, -4.80575487e-03,  5.86674875e-03, -7.98383448e-03,\n",
+       "                       -1.58236409e-03, -3.90194566e-03, -3.19704623e-03, -1.27897607e-02,\n",
+       "                       -1.08337877e-02, -2.88095623e-02,  2.85866234e-04, -8.40043090e-03,\n",
+       "                        1.68466531e-02, -9.48300865e-03,  1.07089747e-02, -6.55804481e-03,\n",
+       "                        1.07785873e-02, -2.03706510e-03, -6.23795530e-03,  1.84131053e-03,\n",
+       "                       -1.19226137e-02, -1.19245518e-02,  1.07499138e-02, -1.60556356e-03,\n",
+       "                        1.48513662e-02,  8.42911075e-04, -7.61739630e-03, -1.00078341e-02,\n",
+       "                       -6.85031665e-03,  6.62403181e-05, -1.47380102e-02,  1.06051601e-02,\n",
+       "                       -1.52580086e-02,  4.62111458e-03, -7.25929858e-03, -9.87567380e-03,\n",
+       "                       -2.11753566e-02, -2.81897746e-03,  7.57926563e-03,  1.56047642e-02,\n",
+       "                       -5.49622765e-03, -1.26458518e-02, -4.95762797e-04, -1.26452465e-02,\n",
+       "                       -5.07163466e-04, -2.44214141e-04, -1.36806136e-02, -6.36481447e-03,\n",
+       "                        9.41760000e-03, -2.01441571e-02,  5.63550880e-03, -9.40112583e-03,\n",
+       "                        8.10766220e-03, -3.01348814e-03, -5.85703761e-04, -6.87783398e-03,\n",
+       "                       -2.04759687e-02,  5.50722983e-03,  1.64064090e-03,  2.13566399e-03,\n",
+       "                       -2.66503030e-03,  1.19713731e-02, -2.46646977e-03,  1.18620200e-02,\n",
+       "                       -9.19723790e-03, -1.83394272e-03,  1.11400019e-02, -7.83916272e-04,\n",
+       "                       -1.84947625e-02, -1.56250689e-02, -4.50070575e-03,  4.96139983e-05,\n",
+       "                        1.15786900e-03, -1.15699519e-03,  8.74574110e-03,  7.34791812e-03,\n",
+       "                       -1.66535741e-04, -4.48113959e-03, -2.73513864e-03,  1.59729156e-03,\n",
+       "                       -4.85743620e-02,  1.04213860e-02,  1.65184797e-03, -8.78975447e-03,\n",
+       "                        2.33145412e-02,  2.71241821e-04, -5.57205081e-03, -6.47265138e-03,\n",
+       "                        7.14300759e-03,  1.50586208e-02, -7.69229233e-03, -6.83056330e-03,\n",
+       "                        1.11706341e-02, -5.33302967e-03,  1.01505285e-02, -1.04286522e-03,\n",
+       "                        5.20325173e-03,  7.18424190e-03, -5.82816964e-03, -1.94616728e-02,\n",
+       "                       -9.02798609e-04, -1.22039793e-02, -1.85265485e-02,  6.41540438e-03,\n",
+       "                        2.65102787e-03,  1.07528424e-04,  8.87938961e-03, -6.68506231e-03,\n",
+       "                        6.87584700e-03, -5.48701826e-03,  8.97261198e-04, -1.17392847e-02,\n",
+       "                       -9.75791924e-03,  1.70990115e-03, -5.55254053e-03,  1.12752430e-02,\n",
+       "                       -6.84495084e-04,  1.56747233e-02,  1.91728352e-03, -1.50278080e-02,\n",
+       "                        5.20985387e-03, -2.47837487e-03,  2.45351926e-03,  6.19899435e-03,\n",
+       "                        1.05873914e-02,  8.07140023e-03, -5.94343990e-04, -3.08463769e-03],\n",
+       "                      dtype=float32)>\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (dropout): Dropout(\n",
+       "                (_feature_shapes): Dict()\n",
+       "                (_feature_dtypes): Dict()\n",
+       "              )\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "            (dropout): Dropout(\n",
+       "              (_feature_shapes): Dict()\n",
+       "              (_feature_dtypes): Dict()\n",
+       "            )\n",
+       "            (_feature_shapes): Dict()\n",
+       "            (_feature_dtypes): Dict()\n",
+       "          )\n",
+       "        )\n",
+       "        (dropout): Dropout(\n",
+       "          (_feature_shapes): Dict()\n",
+       "          (_feature_dtypes): Dict()\n",
+       "        )\n",
+       "        (_kwargs): Dict(\n",
+       "          (name): 'transformer'\n",
+       "          (trainable): True\n",
+       "          (dtype): 'float32'\n",
+       "        )\n",
+       "        (mask_emb): <tf.Variable 'model/mask_emb:0' shape=(1, 1, 192) dtype=float32, numpy=\n",
+       "        array([[[ 4.04036790e-03,  2.15086387e-03,  1.04019826e-03,\n",
+       "                 -1.42265148e-02,  1.21783582e-04,  8.70395917e-03,\n",
+       "                  6.63713319e-03,  7.36431265e-03, -1.54305118e-04,\n",
+       "                 -9.43066180e-03, -1.04995137e-02,  8.46136641e-03,\n",
+       "                  7.09149288e-04,  7.55310385e-03,  1.56539027e-02,\n",
+       "                 -1.72090076e-03,  4.24924027e-03, -5.31134475e-03,\n",
+       "                 -1.48346564e-02, -2.87283910e-03,  6.70258282e-03,\n",
+       "                 -1.77564528e-02,  7.61946477e-03,  9.40683205e-03,\n",
+       "                 -6.71640271e-03,  8.04069825e-03, -6.12986507e-03,\n",
+       "                  4.19179862e-03, -8.79541412e-03, -1.18354000e-02,\n",
+       "                  1.18796797e-02, -4.27424023e-03,  5.22729533e-04,\n",
+       "                 -2.82752240e-04, -5.58008580e-03,  8.65907688e-03,\n",
+       "                  1.38010653e-02,  1.27496161e-02,  1.39875710e-03,\n",
+       "                  2.82851863e-03,  9.22558014e-04, -9.95281339e-03,\n",
+       "                 -1.83557272e-02,  1.69160645e-02,  1.07988389e-02,\n",
+       "                 -9.23428405e-03, -4.20611026e-03, -1.25393076e-02,\n",
+       "                 -3.94632109e-03, -9.12902178e-04,  5.01031801e-03,\n",
+       "                 -9.91391484e-03,  3.60712525e-04, -4.11095610e-03,\n",
+       "                  7.01457262e-03, -3.89575318e-04, -9.14055016e-03,\n",
+       "                 -1.23113198e-02,  3.95737030e-03, -3.31253605e-03,\n",
+       "                 -1.13035142e-02, -1.94670074e-02,  1.20422023e-03,\n",
+       "                 -1.42025901e-03,  6.52758172e-03,  1.50428945e-02,\n",
+       "                  1.14396252e-02,  9.52708255e-03, -1.09730114e-03,\n",
+       "                 -1.33979488e-02, -1.07515557e-02,  9.95630212e-03,\n",
+       "                 -4.52685449e-03,  5.00414427e-03, -1.98842213e-03,\n",
+       "                  1.37774022e-02,  5.30165201e-03,  1.23802433e-03,\n",
+       "                 -4.73509915e-03,  1.11496374e-02,  1.02096051e-02,\n",
+       "                 -4.51285811e-03, -3.92367877e-03, -7.36222602e-04,\n",
+       "                 -9.84671526e-03, -1.30903888e-02, -1.32385455e-02,\n",
+       "                 -5.05355746e-03,  1.77229438e-02, -1.26720043e-02,\n",
+       "                 -3.81861255e-03,  1.92409288e-03,  4.43383912e-03,\n",
+       "                 -2.90768524e-03, -3.23669449e-03, -6.66979142e-03,\n",
+       "                 -2.06012907e-03, -1.12843849e-02,  4.79723467e-03,\n",
+       "                  4.63116821e-03,  5.16073406e-03,  8.70506628e-05,\n",
+       "                 -5.35136508e-03, -6.81748800e-03,  1.07775088e-02,\n",
+       "                  6.40543317e-03, -5.58225671e-03,  1.11177545e-02,\n",
+       "                 -1.27711734e-02,  5.51164476e-03,  1.43165309e-02,\n",
+       "                 -1.18009234e-02,  1.00297267e-02,  2.94128619e-03,\n",
+       "                  5.09045878e-03,  6.01266325e-03,  3.48583143e-03,\n",
+       "                 -9.97739006e-03,  5.73237287e-03, -1.74200535e-02,\n",
+       "                 -1.05477320e-02, -6.82158954e-03, -1.22792637e-02,\n",
+       "                  1.54061895e-02,  6.61997357e-03, -6.48623565e-03,\n",
+       "                  1.03507945e-02,  4.72886208e-03,  3.41648381e-04,\n",
+       "                  1.56227135e-04, -6.57477323e-03,  1.07179703e-02,\n",
+       "                  1.44143337e-02, -5.46780648e-03,  6.18689740e-03,\n",
+       "                 -9.73255560e-03, -2.16128258e-03, -1.91180315e-03,\n",
+       "                  3.76634533e-03,  2.67042592e-03, -2.67445343e-03,\n",
+       "                  3.32484627e-03,  1.01211574e-02,  2.27720127e-03,\n",
+       "                  7.88620266e-04, -1.48888072e-02,  7.72451982e-03,\n",
+       "                 -1.09812963e-05,  1.72610395e-02, -1.04232905e-02,\n",
+       "                 -5.94944111e-04,  8.15481320e-03, -1.07726390e-02,\n",
+       "                  2.42098351e-03, -7.10068317e-03,  1.06540425e-02,\n",
+       "                  9.72479582e-03,  4.19085007e-03,  5.90282353e-03,\n",
+       "                  1.59875136e-02, -1.69793852e-02,  1.46484468e-04,\n",
+       "                 -9.65306722e-03, -2.21638312e-03, -1.99070992e-03,\n",
+       "                  1.52429137e-02,  7.03723729e-03, -3.10059241e-03,\n",
+       "                  1.18050715e-02,  1.10457819e-02, -8.42266437e-03,\n",
+       "                 -9.11685079e-03, -1.46749020e-02, -5.18356264e-03,\n",
+       "                 -1.54700959e-02,  1.13772415e-02, -5.09043923e-03,\n",
+       "                 -1.58989453e-03, -1.11678680e-02, -1.49724097e-03,\n",
+       "                  2.78852787e-03, -8.65777209e-03,  3.00176186e-03,\n",
+       "                 -1.46945333e-02,  8.13734066e-03,  7.89561775e-03,\n",
+       "                  1.56951277e-03,  7.45176163e-04, -1.99116878e-02,\n",
+       "                  4.55260696e-03, -6.38728775e-03, -4.85596713e-03]]],\n",
+       "              dtype=float32)>\n",
+       "        (_feature_shapes): Dict()\n",
+       "        (_feature_dtypes): Dict()\n",
+       "      )\n",
+       "      (transformer_pre): PrepareTransformerInputs(\n",
+       "        (_feature_shapes): Dict()\n",
+       "        (_feature_dtypes): Dict()\n",
+       "      )\n",
+       "      (transformer_post): LastHiddenState(\n",
+       "        (_feature_shapes): Dict()\n",
+       "        (_feature_dtypes): Dict()\n",
+       "      )\n",
+       "      (_masking_post): SequentialBlock(\n",
+       "        (layers): List(\n",
+       "          (0): TransformerOutputToRagged(\n",
+       "            (_feature_shapes): Dict()\n",
+       "            (_feature_dtypes): Dict()\n",
+       "          )\n",
+       "          (1): TransformerInferenceHiddenState(\n",
+       "            (_feature_shapes): Dict()\n",
+       "            (_feature_dtypes): Dict()\n",
+       "          )\n",
+       "        )\n",
+       "        (_feature_shapes): Dict()\n",
+       "        (_feature_dtypes): Dict()\n",
+       "      )\n",
+       "      (_masking_pre): SequentialBlock(\n",
+       "        (layers): List(\n",
+       "          (0): SequenceCausalLastInference(\n",
+       "            (_feature_shapes): Dict()\n",
+       "            (_feature_dtypes): Dict()\n",
+       "          )\n",
+       "          (1): ExtractMaskFromTargets(\n",
+       "            (_feature_shapes): Dict()\n",
+       "            (_feature_dtypes): Dict()\n",
+       "          )\n",
+       "        )\n",
+       "        (_feature_shapes): Dict()\n",
+       "        (_feature_dtypes): Dict()\n",
+       "      )\n",
+       "      (_feature_shapes): Dict()\n",
+       "      (_feature_dtypes): Dict()\n",
+       "    )\n",
+       "  )\n",
+       "  (signatures): _SignatureMap({'serving_default': <ConcreteFunction signature_wrapper(*, sess_pid_seq__offsets, sess_pid_seq__values) at 0x7FC36CD996D0>})\n",
+       ")"
+      ]
+     },
+     "execution_count": 19,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "model_transformer.load('t4rec_model')"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 20,
+   "id": "2f5a7984",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from merlin.loader.tensorflow import Loader"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 21,
+   "id": "dc4df316",
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "/usr/local/lib/python3.8/dist-packages/merlin/dataloader/tensorflow.py:65: UserWarning: Due to a CUDA memory alignment issue in some Tensorflow operations such as Embedding ops, we recommend that 'batch_size' be at least 16 and also a power of two. Please change 'batch_size' to a number that is a power of two that is greater than or equal to 16.\n",
+      "  warnings.warn(\n"
+     ]
+    }
+   ],
+   "source": [
+    "loader = Loader(valid, batch_size=1)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 22,
+   "id": "f3bfca3f",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "it = iter(loader)"
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 14,
-   "id": "3116726e",
+   "execution_count": 23,
+   "id": "7e1b9bbc",
    "metadata": {},
    "outputs": [],
    "source": [
-    "# cat rees46_schema_modified.pbtxt"
+    "while True:\n",
+    "    b = next(it)\n",
+    "    if b[0]['sess_pid_seq__offsets'].numpy()[1] == 20:\n",
+    "        break"
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 15,
-   "id": "69e8f95c",
+   "execution_count": 24,
+   "id": "7ee5f149",
    "metadata": {},
-   "outputs": [],
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "({'sess_pid_seq__values': <tf.Tensor: shape=(20,), dtype=int32, numpy=\n",
+       "  array([ 204,  241,  506, 1105, 1851, 1720,  497,  685, 2197, 2575, 2508,\n",
+       "         1450, 1493, 2365, 2086, 3363, 8740, 5932, 2748, 5932], dtype=int32)>,\n",
+       "  'sess_pid_seq__offsets': <tf.Tensor: shape=(2,), dtype=int32, numpy=array([ 0, 20], dtype=int32)>},\n",
+       " None)"
+      ]
+     },
+     "execution_count": 24,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
    "source": [
-    "# %%writefile rees46_schema_modified_2.pbtxt\n",
-    "\n",
-    "# feature {\n",
-    "#   name: \"seq\"\n",
-    "#   value_count {\n",
-    "#     min: 2\n",
-    "#   }\n",
-    "#   type: INT\n",
-    "#   int_domain {\n",
-    "#     name: \"seq\"\n",
-    "#     min: 1\n",
-    "#     max: 390000\n",
-    "#     is_categorical: true\n",
-    "#   }\n",
-    "#   annotation {\n",
-    "#     tag: \"item_id\"\n",
-    "#     tag: \"list\"\n",
-    "#     tag: \"categorical\"\n",
-    "#     tag: \"item\"\n",
-    "#   }\n",
-    "# }"
+    "b"
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 16,
-   "id": "a6ade14a",
+   "execution_count": 25,
+   "id": "81d2b071",
    "metadata": {},
-   "outputs": [],
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "50.1 ms ± 78.3 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)\n"
+     ]
+    }
+   ],
    "source": [
-    "from merlin.schema.io.tensorflow_metadata import TensorflowMetadata\n",
-    "\n",
-    "def get_model():\n",
-    "    mlp_block = mm.MLPBlock(\n",
-    "                    [d_model],\n",
-    "                    activation='relu',\n",
-    "                    no_activation_last_layer=True,\n",
-    "                )\n",
+    "%%timeit\n",
     "\n",
-    "    schema = TensorflowMetadata.from_proto_text_file(\n",
-    "        './',\n",
-    "        file_name='rees46_schema_modified.pbtxt'\n",
-    "    ).to_merlin_schema()\n",
-    "\n",
-    "    train.schema = schema\n",
-    "    \n",
-    "    schema_model = schema.select_by_tag(Tags.ITEM_ID)\n",
-    "    input_block = mm.InputBlockV2(\n",
-    "        schema_model,\n",
-    "        categorical=mm.Embeddings(\n",
-    "                schema_model.select_by_tag(Tags.CATEGORICAL),\n",
-    "                dim=item_embedding_dim,\n",
-    "                sequence_combiner=None,\n",
-    "            )\n",
-    "        )\n",
-    "\n",
-    "    train.schema = train.schema.select_by_name(seq_name)\n",
-    "\n",
-    "    xlnet_block = mm.XLNetBlock(d_model=d_model, n_head=n_head, n_layer=n_layer)\n",
-    "\n",
-    "    dense_block = mm.SequentialBlock(\n",
-    "        input_block,\n",
-    "        mlp_block,\n",
-    "        xlnet_block\n",
-    "    )\n",
-    "\n",
-    "    mlp_block2 = mm.MLPBlock(\n",
-    "                    [item_embedding_dim],\n",
-    "                    activation='relu',\n",
-    "                    no_activation_last_layer=True,\n",
-    "                )\n",
-    "\n",
-    "    prediction_task = mm.CategoricalOutput(\n",
-    "        to_call=input_block[\"categorical\"][target],\n",
-    "    )\n",
-    "\n",
-    "    model_transformer = mm.Model(dense_block, mlp_block2, prediction_task)\n",
-    "\n",
-    "    optimizer = tf.keras.optimizers.Adam(\n",
-    "        learning_rate=learning_rate,\n",
-    "    )\n",
-    "\n",
-    "    model_transformer.compile(run_eagerly=False, optimizer=optimizer, loss=\"categorical_crossentropy\",\n",
-    "                  metrics=mm.TopKMetricsAggregator.default_metrics(top_ks=[20])\n",
-    "                 )\n",
-    "    return model_transformer, xlnet_block"
+    "model_transformer.predict_step(b)"
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 17,
-   "id": "523fe2ac",
+   "execution_count": 26,
+   "id": "7b24e7fa",
    "metadata": {},
    "outputs": [
     {
-     "name": "stderr",
+     "name": "stdout",
      "output_type": "stream",
      "text": [
-      "/usr/local/lib/python3.8/dist-packages/merlin/schema/tags.py:149: UserWarning: Compound tags like Tags.ITEM_ID have been deprecated and will be removed in a future version. Please use the atomic versions of these tags, like [<Tags.ITEM: 'item'>, <Tags.ID: 'id'>].\n",
-      "  warnings.warn(\n",
-      "/usr/local/lib/python3.8/dist-packages/keras/initializers/initializers_v2.py:120: UserWarning: The initializer TruncatedNormal is unseeded and being called multiple times, which will return identical values  each time (even if the initializer is unseeded). Please update your code to provide a seed to the initializer, or avoid using the same initalizer instance more than once.\n",
-      "  warnings.warn(\n",
-      "2023-04-13 11:21:38.342588: I tensorflow/stream_executor/cuda/cuda_dnn.cc:424] Loaded cuDNN version 8700\n"
+      "297 ms ± 753 µs per loop (mean ± std. dev. of 7 runs, 1 loop each)\n"
      ]
-    },
+    }
+   ],
+   "source": [
+    "%%timeit\n",
+    "\n",
+    "with tf.device('/cpu:0'):\n",
+    "    model_transformer.predict_step(b)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 27,
+   "id": "5bd66ba8",
+   "metadata": {},
+   "outputs": [
     {
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "WARNING:tensorflow:Gradients do not exist for variables ['model/mask_emb:0', 'transformer/layer_._0/rel_attn/r_s_bias:0', 'transformer/layer_._0/rel_attn/seg_embed:0', 'transformer/layer_._1/rel_attn/r_s_bias:0', 'transformer/layer_._1/rel_attn/seg_embed:0', 'transformer/layer_._2/rel_attn/r_s_bias:0', 'transformer/layer_._2/rel_attn/seg_embed:0'] when minimizing the loss. If you're using `model.compile()`, did you forget to provide a `loss` argument?\n"
+      "WARNING:tensorflow:Skipping full serialization of Keras layer TFSharedEmbeddings(\n",
+      "  (_feature_shapes): Dict(\n",
+      "    (sess_pid_seq): TensorShape([128, None, 1])\n",
+      "  )\n",
+      "  (_feature_dtypes): Dict(\n",
+      "    (sess_pid_seq): tf.int32\n",
+      "  )\n",
+      "), because it is not built.\n"
      ]
     },
     {
      "name": "stderr",
      "output_type": "stream",
      "text": [
-      "/usr/local/lib/python3.8/dist-packages/tensorflow/python/framework/indexed_slices.py:444: UserWarning: Converting sparse IndexedSlices(IndexedSlices(indices=Tensor(\"gradient_tape/model/sequential_block_4/xl_net_block/prepare_transformer_inputs_4/RaggedToTensor_1/boolean_mask_1/GatherV2:0\", shape=(None,), dtype=int32), values=Tensor(\"gradient_tape/model/sequential_block_4/xl_net_block/prepare_transformer_inputs_4/RaggedToTensor_1/boolean_mask/GatherV2:0\", shape=(None, 192), dtype=float32), dense_shape=Tensor(\"gradient_tape/model/sequential_block_4/xl_net_block/prepare_transformer_inputs_4/RaggedToTensor_1/Shape:0\", shape=(2,), dtype=int32))) to a dense Tensor of unknown shape. This may consume a large amount of memory.\n",
-      "  warnings.warn(\n",
-      "/usr/local/lib/python3.8/dist-packages/tensorflow/python/framework/indexed_slices.py:436: UserWarning: Converting sparse IndexedSlices to a dense Tensor with 174720448 elements. This may consume a large amount of memory.\n",
-      "  warnings.warn(\n"
+      "WARNING:tensorflow:Skipping full serialization of Keras layer TFSharedEmbeddings(\n",
+      "  (_feature_shapes): Dict(\n",
+      "    (sess_pid_seq): TensorShape([128, None, 1])\n",
+      "  )\n",
+      "  (_feature_dtypes): Dict(\n",
+      "    (sess_pid_seq): tf.int32\n",
+      "  )\n",
+      "), because it is not built.\n"
      ]
     },
     {
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "WARNING:tensorflow:Gradients do not exist for variables ['model/mask_emb:0', 'transformer/layer_._0/rel_attn/r_s_bias:0', 'transformer/layer_._0/rel_attn/seg_embed:0', 'transformer/layer_._1/rel_attn/r_s_bias:0', 'transformer/layer_._1/rel_attn/seg_embed:0', 'transformer/layer_._2/rel_attn/r_s_bias:0', 'transformer/layer_._2/rel_attn/seg_embed:0'] when minimizing the loss. If you're using `model.compile()`, did you forget to provide a `loss` argument?\n",
-      "677/677 [==============================] - 106s 144ms/step - loss: 7.3129 - recall_at_20: 0.1424 - mrr_at_20: 0.0802 - ndcg_at_20: 0.0939 - map_at_20: 0.0802 - precision_at_20: 0.0071 - regularization_loss: 0.0000e+00 - loss_batch: 7.3149\n",
-      "84/84 [==============================] - 4s 27ms/step - loss: 8.5848 - recall_at_20: 0.2229 - mrr_at_20: 0.0736 - ndcg_at_20: 0.1066 - map_at_20: 0.0736 - precision_at_20: 0.0111 - regularization_loss: 0.0000e+00 - loss_batch: 8.5971\n"
+      "WARNING:tensorflow:Skipping full serialization of Keras layer Dropout(\n",
+      "  (_feature_shapes): Dict(\n",
+      "    (sess_pid_seq): TensorShape([128, None, 1])\n",
+      "  )\n",
+      "  (_feature_dtypes): Dict(\n",
+      "    (sess_pid_seq): tf.int32\n",
+      "  )\n",
+      "), because it is not built.\n"
      ]
     },
     {
-     "data": {
-      "text/plain": [
-       "{'loss': 8.584781646728516,\n",
-       " 'recall_at_20': 0.2308632731437683,\n",
-       " 'mrr_at_20': 0.07471762597560883,\n",
-       " 'ndcg_at_20': 0.10908268392086029,\n",
-       " 'map_at_20': 0.07471762597560883,\n",
-       " 'precision_at_20': 0.011543160304427147,\n",
-       " 'regularization_loss': 0.0,\n",
-       " 'loss_batch': 9.130510330200195}"
-      ]
-     },
-     "execution_count": 17,
-     "metadata": {},
-     "output_type": "execute_result"
-    }
-   ],
-   "source": [
-    "model_transformer, xlnet_block = get_model()\n",
-    "model_transformer.fit(\n",
-    "    train,\n",
-    "    batch_size=batch_size,\n",
-    "    epochs=n_epoch,\n",
-    "    pre=mm.SequencePredictNext(schema=train.schema, target=target, transformer=xlnet_block)\n",
-    ")\n",
-    "\n",
-    "predict_last = mm.SequencePredictLast(schema=valid.schema, target=target, transformer=xlnet_block)\n",
-    "model_transformer.evaluate(\n",
-    "    valid,\n",
-    "    batch_size=batch_size,\n",
-    "    pre=predict_last,\n",
-    "    return_dict=True\n",
-    ")\n",
-    "\n",
-    "# model_transformer.save('t4rec_model')"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 18,
-   "id": "5bd66ba8",
-   "metadata": {},
-   "outputs": [
-    {
-     "name": "stdout",
+     "name": "stderr",
      "output_type": "stream",
      "text": [
-      "WARNING:tensorflow:Skipping full serialization of Keras layer TFSharedEmbeddings(\n",
+      "WARNING:tensorflow:Skipping full serialization of Keras layer Dropout(\n",
       "  (_feature_shapes): Dict(\n",
       "    (sess_pid_seq): TensorShape([128, None, 1])\n",
       "  )\n",
       "  (_feature_dtypes): Dict(\n",
       "    (sess_pid_seq): tf.int32\n",
       "  )\n",
-      "), because it is not built.\n",
+      "), because it is not built.\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
       "WARNING:tensorflow:Skipping full serialization of Keras layer Dropout(\n",
       "  (_feature_shapes): Dict(\n",
       "    (sess_pid_seq): TensorShape([128, None, 1])\n",
@@ -724,7 +13835,13 @@
       "  (_feature_dtypes): Dict(\n",
       "    (sess_pid_seq): tf.int32\n",
       "  )\n",
-      "), because it is not built.\n",
+      "), because it is not built.\n"
+     ]
+    },
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
       "WARNING:tensorflow:Skipping full serialization of Keras layer Dropout(\n",
       "  (_feature_shapes): Dict(\n",
       "    (sess_pid_seq): TensorShape([128, None, 1])\n",
@@ -732,7 +13849,13 @@
       "  (_feature_dtypes): Dict(\n",
       "    (sess_pid_seq): tf.int32\n",
       "  )\n",
-      "), because it is not built.\n",
+      "), because it is not built.\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
       "WARNING:tensorflow:Skipping full serialization of Keras layer Dropout(\n",
       "  (_feature_shapes): Dict(\n",
       "    (sess_pid_seq): TensorShape([128, None, 1])\n",
@@ -747,6 +13870,14 @@
      "name": "stderr",
      "output_type": "stream",
      "text": [
+      "WARNING:tensorflow:Skipping full serialization of Keras layer Dropout(\n",
+      "  (_feature_shapes): Dict(\n",
+      "    (sess_pid_seq): TensorShape([128, None, 1])\n",
+      "  )\n",
+      "  (_feature_dtypes): Dict(\n",
+      "    (sess_pid_seq): tf.int32\n",
+      "  )\n",
+      "), because it is not built.\n",
       "WARNING:absl:Found untraced functions such as model_context_layer_call_fn, model_context_layer_call_and_return_conditional_losses, sequence_predict_next_layer_call_fn, sequence_predict_next_layer_call_and_return_conditional_losses, sequence_predict_last_layer_call_fn while saving (showing 5 of 114). These functions will not be directly callable after loading.\n"
      ]
     },
@@ -754,15 +13885,15 @@
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "INFO:tensorflow:Assets written to: /tmp/tmpkph1f3_r/model.savedmodel/assets\n"
+      "INFO:tensorflow:Assets written to: /tmp/tmpvsz5e5b2/model.savedmodel/assets\n"
      ]
     },
     {
      "name": "stderr",
      "output_type": "stream",
      "text": [
-      "INFO:tensorflow:Assets written to: /tmp/tmpkph1f3_r/model.savedmodel/assets\n",
-      "/usr/local/lib/python3.8/dist-packages/merlin/models/tf/utils/tf_utils.py:100: CustomMaskWarning: Custom mask layers require a config and must override get_config. When loading, the custom mask layer must be passed to the custom_objects argument.\n",
+      "INFO:tensorflow:Assets written to: /tmp/tmpvsz5e5b2/model.savedmodel/assets\n",
+      "/usr/local/lib/python3.8/dist-packages/merlin/models/tf/utils/tf_utils.py:101: CustomMaskWarning: Custom mask layers require a config and must override get_config. When loading, the custom mask layer must be passed to the custom_objects argument.\n",
       "  config[key] = tf.keras.utils.serialize_keras_object(maybe_value)\n",
       "/usr/local/lib/python3.8/dist-packages/merlin/models/tf/core/combinators.py:288: CustomMaskWarning: Custom mask layers require a config and must override get_config. When loading, the custom mask layer must be passed to the custom_objects argument.\n",
       "  config[i] = tf.keras.utils.serialize_keras_object(layer)\n",
@@ -816,7 +13947,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 19,
+   "execution_count": 33,
    "id": "3ef1e5fc",
    "metadata": {},
    "outputs": [],
@@ -830,7 +13961,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 20,
+   "execution_count": 28,
    "id": "e2a7b6ee",
    "metadata": {},
    "outputs": [],
@@ -843,7 +13974,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 21,
+   "execution_count": 29,
    "id": "55ad012c",
    "metadata": {},
    "outputs": [
@@ -884,7 +14015,7 @@
        "    <tr>\n",
        "      <th>0</th>\n",
        "      <td>sess_pid_seq</td>\n",
-       "      <td>(Tags.CATEGORICAL, Tags.ITEM, Tags.ID, Tags.IT...</td>\n",
+       "      <td>(Tags.LIST, Tags.ITEM_ID, Tags.CATEGORICAL, Ta...</td>\n",
        "      <td>DType(name='int64', element_type=&lt;ElementType....</td>\n",
        "      <td>True</td>\n",
        "      <td>True</td>\n",
@@ -899,10 +14030,10 @@
        "</div>"
       ],
       "text/plain": [
-       "[{'name': 'sess_pid_seq', 'tags': {<Tags.CATEGORICAL: 'categorical'>, <Tags.ITEM: 'item'>, <Tags.ID: 'id'>, <Tags.ITEM_ID: 'item_id'>, <Tags.LIST: 'list'>}, 'properties': {'domain': {'min': 1, 'max': 390000, 'name': 'sess_pid_seq'}, 'value_count': {'min': 2, 'max': None}}, 'dtype': DType(name='int64', element_type=<ElementType.Int: 'int'>, element_size=64, element_unit=None, signed=True, shape=Shape(dims=(Dimension(min=0, max=None), Dimension(min=2, max=None)))), 'is_list': True, 'is_ragged': True}]"
+       "[{'name': 'sess_pid_seq', 'tags': {<Tags.LIST: 'list'>, <Tags.ITEM_ID: 'item_id'>, <Tags.CATEGORICAL: 'categorical'>, <Tags.ITEM: 'item'>, <Tags.ID: 'id'>}, 'properties': {'domain': {'min': 1, 'max': 390000, 'name': 'sess_pid_seq'}, 'value_count': {'min': 2, 'max': None}}, 'dtype': DType(name='int64', element_type=<ElementType.Int: 'int'>, element_size=64, element_unit=None, signed=True, shape=Shape(dims=(Dimension(min=0, max=None), Dimension(min=2, max=None)))), 'is_list': True, 'is_ragged': True}]"
       ]
      },
-     "execution_count": 21,
+     "execution_count": 29,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -913,7 +14044,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 22,
+   "execution_count": 30,
    "id": "1a39b4f8",
    "metadata": {},
    "outputs": [
@@ -1042,7 +14173,7 @@
      "output_type": "stream",
      "text": [
       "INFO:tensorflow:Assets written to: /workspace/models_for_benchmarking/1_predicttensorflowtriton/1/model.savedmodel/assets\n",
-      "/usr/local/lib/python3.8/dist-packages/merlin/models/tf/utils/tf_utils.py:100: CustomMaskWarning: Custom mask layers require a config and must override get_config. When loading, the custom mask layer must be passed to the custom_objects argument.\n",
+      "/usr/local/lib/python3.8/dist-packages/merlin/models/tf/utils/tf_utils.py:101: CustomMaskWarning: Custom mask layers require a config and must override get_config. When loading, the custom mask layer must be passed to the custom_objects argument.\n",
       "  config[key] = tf.keras.utils.serialize_keras_object(maybe_value)\n",
       "/usr/local/lib/python3.8/dist-packages/merlin/models/tf/core/combinators.py:288: CustomMaskWarning: Custom mask layers require a config and must override get_config. When loading, the custom mask layer must be passed to the custom_objects argument.\n",
       "  config[i] = tf.keras.utils.serialize_keras_object(layer)\n",
@@ -1078,35 +14209,17 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 23,
-   "id": "1720a5af",
-   "metadata": {},
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "ls: cannot access '/workspace/models_for_benchmarking/1': No such file or directory\r\n"
-     ]
-    }
-   ],
-   "source": [
-    "ls /workspace/models_for_benchmarking/1"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 24,
+   "execution_count": 31,
    "id": "d7cdc6cc",
    "metadata": {},
    "outputs": [
     {
      "data": {
       "text/plain": [
-       "<subprocess.Popen at 0x7fd4c501f0a0>"
+       "<subprocess.Popen at 0x7fc2ffc722b0>"
       ]
      },
-     "execution_count": 24,
+     "execution_count": 31,
      "metadata": {},
      "output_type": "execute_result"
     },
@@ -1114,89 +14227,88 @@
      "name": "stderr",
      "output_type": "stream",
      "text": [
-      "I0413 11:24:28.716029 1527 pinned_memory_manager.cc:240] Pinned memory pool is created at '0x7f7f2a000000' with size 268435456\n",
-      "I0413 11:24:28.716361 1527 cuda_memory_manager.cc:105] CUDA memory pool is created on device 0 with size 67108864\n",
-      "I0413 11:24:28.718446 1527 model_lifecycle.cc:459] loading: 0_transformworkflowtriton:1\n",
-      "I0413 11:24:28.718465 1527 model_lifecycle.cc:459] loading: 1_predicttensorflowtriton:1\n",
-      "I0413 11:24:28.718478 1527 model_lifecycle.cc:459] loading: executor_model:1\n",
-      "I0413 11:24:28.924940 1527 tensorflow.cc:2536] TRITONBACKEND_Initialize: tensorflow\n",
-      "I0413 11:24:28.924955 1527 tensorflow.cc:2546] Triton TRITONBACKEND API version: 1.10\n",
-      "I0413 11:24:28.924960 1527 tensorflow.cc:2552] 'tensorflow' TRITONBACKEND API version: 1.10\n",
-      "I0413 11:24:28.924962 1527 tensorflow.cc:2576] backend configuration:\n",
+      "I0509 01:55:17.511153 1205 pinned_memory_manager.cc:240] Pinned memory pool is created at '0x7ff516000000' with size 268435456\n",
+      "I0509 01:55:17.511472 1205 cuda_memory_manager.cc:105] CUDA memory pool is created on device 0 with size 67108864\n",
+      "I0509 01:55:17.513574 1205 model_lifecycle.cc:459] loading: executor_model:1\n",
+      "I0509 01:55:17.513595 1205 model_lifecycle.cc:459] loading: 0_transformworkflowtriton:1\n",
+      "I0509 01:55:17.513608 1205 model_lifecycle.cc:459] loading: 1_predicttensorflowtriton:1\n",
+      "I0509 01:55:17.693342 1205 tensorflow.cc:2536] TRITONBACKEND_Initialize: tensorflow\n",
+      "I0509 01:55:17.693362 1205 tensorflow.cc:2546] Triton TRITONBACKEND API version: 1.10\n",
+      "I0509 01:55:17.693365 1205 tensorflow.cc:2552] 'tensorflow' TRITONBACKEND API version: 1.10\n",
+      "I0509 01:55:17.693368 1205 tensorflow.cc:2576] backend configuration:\n",
       "{\"cmdline\":{\"auto-complete-config\":\"true\",\"min-compute-capability\":\"6.000000\",\"backend-directory\":\"/opt/tritonserver/backends\",\"default-max-batch-size\":\"4\"}}\n",
-      "2023-04-13 11:24:30.207841: I tensorflow/core/platform/cpu_feature_guard.cc:194] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  SSE3 SSE4.1 SSE4.2 AVX\n",
+      "2023-05-09 01:55:18.992767: I tensorflow/core/platform/cpu_feature_guard.cc:194] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  SSE3 SSE4.1 SSE4.2 AVX\n",
       "To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.\n",
-      "2023-04-13 11:24:32.085748: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:24:32.086174: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:24:32.086365: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:55:20.814292: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:55:20.814710: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:55:20.814876: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
       "/usr/local/lib/python3.8/dist-packages/merlin/dtypes/mappings/torch.py:43: UserWarning: PyTorch dtype mappings did not load successfully due to an error: No module named 'torch'\n",
       "  warn(f\"PyTorch dtype mappings did not load successfully due to an error: {exc.msg}\")\n",
-      "I0413 11:24:33.803267 1527 python_be.cc:1856] TRITONBACKEND_ModelInstanceInitialize: executor_model_0 (GPU device 0)\n",
-      "2023-04-13 11:24:35.316462: I tensorflow/core/platform/cpu_feature_guard.cc:194] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  SSE3 SSE4.1 SSE4.2 AVX\n",
+      "I0509 01:55:22.571307 1205 tensorflow.cc:2642] TRITONBACKEND_ModelInitialize: 1_predicttensorflowtriton (version 1)\n",
+      "2023-05-09 01:55:22.571962: I tensorflow/cc/saved_model/reader.cc:45] Reading SavedModel from: /workspace/models_for_benchmarking/1_predicttensorflowtriton/1/model.savedmodel\n",
+      "2023-05-09 01:55:22.592315: I tensorflow/cc/saved_model/reader.cc:89] Reading meta graph with tags { serve }\n",
+      "2023-05-09 01:55:22.592352: I tensorflow/cc/saved_model/reader.cc:130] Reading SavedModel debug info (if present) from: /workspace/models_for_benchmarking/1_predicttensorflowtriton/1/model.savedmodel\n",
+      "2023-05-09 01:55:22.592474: I tensorflow/core/platform/cpu_feature_guard.cc:194] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  SSE3 SSE4.1 SSE4.2 AVX\n",
       "To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.\n",
-      "2023-04-13 11:24:37.126873: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:24:37.127251: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:24:37.127427: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "I0413 11:24:37.157059 1527 tensorflow.cc:2642] TRITONBACKEND_ModelInitialize: 1_predicttensorflowtriton (version 1)\n",
-      "I0413 11:24:37.157179 1527 model_lifecycle.cc:694] successfully loaded 'executor_model' version 1\n",
-      "2023-04-13 11:24:37.157805: I tensorflow/cc/saved_model/reader.cc:45] Reading SavedModel from: /workspace/models_for_benchmarking/1_predicttensorflowtriton/1/model.savedmodel\n",
-      "2023-04-13 11:24:37.178699: I tensorflow/cc/saved_model/reader.cc:89] Reading meta graph with tags { serve }\n",
-      "2023-04-13 11:24:37.178742: I tensorflow/cc/saved_model/reader.cc:130] Reading SavedModel debug info (if present) from: /workspace/models_for_benchmarking/1_predicttensorflowtriton/1/model.savedmodel\n",
-      "2023-04-13 11:24:37.178876: I tensorflow/core/platform/cpu_feature_guard.cc:194] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  SSE3 SSE4.1 SSE4.2 AVX\n",
+      "2023-05-09 01:55:22.593417: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:55:22.609446: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:55:22.609627: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:55:22.855175: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:55:22.855338: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:55:22.855479: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:55:22.855607: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1637] Created device /job:localhost/replica:0/task:0/device:GPU:0 with 29840 MB memory:  -> device: 0, name: Quadro RTX 8000, pci bus id: 0000:08:00.0, compute capability: 7.5\n",
+      "2023-05-09 01:55:22.913337: I tensorflow/compiler/mlir/mlir_graph_optimization_pass.cc:354] MLIR V1 optimization pass is not enabled\n",
+      "2023-05-09 01:55:22.922530: I tensorflow/cc/saved_model/loader.cc:231] Restoring SavedModel bundle.\n",
+      "2023-05-09 01:55:23.337695: I tensorflow/cc/saved_model/loader.cc:215] Running initialization op on SavedModel bundle at path: /workspace/models_for_benchmarking/1_predicttensorflowtriton/1/model.savedmodel\n",
+      "2023-05-09 01:55:23.403830: I tensorflow/cc/saved_model/loader.cc:325] SavedModel load for tags { serve }; Status: success: OK. Took 831878 microseconds.\n",
+      "2023-05-09 01:55:24.746386: I tensorflow/core/platform/cpu_feature_guard.cc:194] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  SSE3 SSE4.1 SSE4.2 AVX\n",
       "To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.\n",
-      "2023-04-13 11:24:37.179781: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:24:37.196068: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:24:37.196289: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:24:37.196570: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:24:37.196747: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:24:37.196909: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:24:37.197031: I tensorflow/core/common_runtime/gpu/gpu_process_state.cc:222] Using CUDA malloc Async allocator for GPU: 0\n",
-      "2023-04-13 11:24:37.203975: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1637] Created device /job:localhost/replica:0/task:0/device:GPU:0 with 38618 MB memory:  -> device: 0, name: Quadro RTX 8000, pci bus id: 0000:08:00.0, compute capability: 7.5\n",
-      "2023-04-13 11:24:37.262568: I tensorflow/compiler/mlir/mlir_graph_optimization_pass.cc:354] MLIR V1 optimization pass is not enabled\n",
-      "2023-04-13 11:24:37.271889: I tensorflow/cc/saved_model/loader.cc:231] Restoring SavedModel bundle.\n",
-      "2023-04-13 11:24:37.678751: I tensorflow/cc/saved_model/loader.cc:215] Running initialization op on SavedModel bundle at path: /workspace/models_for_benchmarking/1_predicttensorflowtriton/1/model.savedmodel\n",
-      "2023-04-13 11:24:37.745105: I tensorflow/cc/saved_model/loader.cc:325] SavedModel load for tags { serve }; Status: success: OK. Took 587310 microseconds.\n",
-      "2023-04-13 11:24:39.105154: I tensorflow/core/platform/cpu_feature_guard.cc:194] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  SSE3 SSE4.1 SSE4.2 AVX\n",
-      "To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.\n",
-      "2023-04-13 11:24:40.997532: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:24:40.997994: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:24:40.998186: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:55:26.581369: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:55:26.581724: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:55:26.581886: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
       "/usr/local/lib/python3.8/dist-packages/merlin/dtypes/mappings/torch.py:43: UserWarning: PyTorch dtype mappings did not load successfully due to an error: No module named 'torch'\n",
       "  warn(f\"PyTorch dtype mappings did not load successfully due to an error: {exc.msg}\")\n",
-      "I0413 11:24:42.684588 1527 tensorflow.cc:2691] TRITONBACKEND_ModelInstanceInitialize: 1_predicttensorflowtriton_0 (GPU device 0)\n",
-      "2023-04-13 11:24:42.684902: I tensorflow/cc/saved_model/reader.cc:45] Reading SavedModel from: /workspace/models_for_benchmarking/1_predicttensorflowtriton/1/model.savedmodel\n",
-      "2023-04-13 11:24:42.702205: I tensorflow/cc/saved_model/reader.cc:89] Reading meta graph with tags { serve }\n",
-      "2023-04-13 11:24:42.702239: I tensorflow/cc/saved_model/reader.cc:130] Reading SavedModel debug info (if present) from: /workspace/models_for_benchmarking/1_predicttensorflowtriton/1/model.savedmodel\n",
-      "2023-04-13 11:24:42.702447: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:24:42.702659: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:24:42.702822: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:24:42.703025: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:24:42.703189: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:24:42.703311: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1637] Created device /job:localhost/replica:0/task:0/device:GPU:0 with 38618 MB memory:  -> device: 0, name: Quadro RTX 8000, pci bus id: 0000:08:00.0, compute capability: 7.5\n",
-      "2023-04-13 11:24:42.742722: I tensorflow/cc/saved_model/loader.cc:231] Restoring SavedModel bundle.\n"
+      "I0509 01:55:28.344195 1205 python_be.cc:1856] TRITONBACKEND_ModelInstanceInitialize: executor_model_0 (GPU device 0)\n",
+      "2023-05-09 01:55:29.628356: I tensorflow/core/platform/cpu_feature_guard.cc:194] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  SSE3 SSE4.1 SSE4.2 AVX\n",
+      "To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.\n",
+      "2023-05-09 01:55:31.434543: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:55:31.434993: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:55:31.435198: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "I0509 01:55:31.465538 1205 tensorflow.cc:2691] TRITONBACKEND_ModelInstanceInitialize: 1_predicttensorflowtriton_0 (GPU device 0)\n",
+      "I0509 01:55:31.465701 1205 model_lifecycle.cc:694] successfully loaded 'executor_model' version 1\n",
+      "2023-05-09 01:55:31.465951: I tensorflow/cc/saved_model/reader.cc:45] Reading SavedModel from: /workspace/models_for_benchmarking/1_predicttensorflowtriton/1/model.savedmodel\n",
+      "2023-05-09 01:55:31.490532: I tensorflow/cc/saved_model/reader.cc:89] Reading meta graph with tags { serve }\n",
+      "2023-05-09 01:55:31.490575: I tensorflow/cc/saved_model/reader.cc:130] Reading SavedModel debug info (if present) from: /workspace/models_for_benchmarking/1_predicttensorflowtriton/1/model.savedmodel\n",
+      "2023-05-09 01:55:31.490777: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:55:31.491003: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:55:31.491186: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:55:31.491411: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:55:31.491588: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:55:31.491744: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1637] Created device /job:localhost/replica:0/task:0/device:GPU:0 with 29840 MB memory:  -> device: 0, name: Quadro RTX 8000, pci bus id: 0000:08:00.0, compute capability: 7.5\n",
+      "2023-05-09 01:55:31.549442: I tensorflow/cc/saved_model/loader.cc:231] Restoring SavedModel bundle.\n"
      ]
     },
     {
      "name": "stderr",
      "output_type": "stream",
      "text": [
-      "2023-04-13 11:24:43.330311: I tensorflow/cc/saved_model/loader.cc:215] Running initialization op on SavedModel bundle at path: /workspace/models_for_benchmarking/1_predicttensorflowtriton/1/model.savedmodel\n",
-      "2023-04-13 11:24:43.395816: I tensorflow/cc/saved_model/loader.cc:325] SavedModel load for tags { serve }; Status: success: OK. Took 710922 microseconds.\n",
-      "I0413 11:24:43.395921 1527 python_be.cc:1856] TRITONBACKEND_ModelInstanceInitialize: 0_transformworkflowtriton_0 (GPU device 0)\n",
-      "I0413 11:24:43.396107 1527 model_lifecycle.cc:694] successfully loaded '1_predicttensorflowtriton' version 1\n",
-      "2023-04-13 11:24:44.668497: I tensorflow/core/platform/cpu_feature_guard.cc:194] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  SSE3 SSE4.1 SSE4.2 AVX\n",
+      "2023-05-09 01:55:32.146750: I tensorflow/cc/saved_model/loader.cc:215] Running initialization op on SavedModel bundle at path: /workspace/models_for_benchmarking/1_predicttensorflowtriton/1/model.savedmodel\n",
+      "2023-05-09 01:55:32.213463: I tensorflow/cc/saved_model/loader.cc:325] SavedModel load for tags { serve }; Status: success: OK. Took 747520 microseconds.\n",
+      "I0509 01:55:32.213572 1205 python_be.cc:1856] TRITONBACKEND_ModelInstanceInitialize: 0_transformworkflowtriton_0 (GPU device 0)\n",
+      "I0509 01:55:32.213757 1205 model_lifecycle.cc:694] successfully loaded '1_predicttensorflowtriton' version 1\n",
+      "2023-05-09 01:55:33.476455: I tensorflow/core/platform/cpu_feature_guard.cc:194] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  SSE3 SSE4.1 SSE4.2 AVX\n",
       "To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.\n",
-      "2023-04-13 11:24:46.525315: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:24:46.525768: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "2023-04-13 11:24:46.525978: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
-      "I0413 11:24:46.583396 1527 model_lifecycle.cc:694] successfully loaded '0_transformworkflowtriton' version 1\n",
-      "I0413 11:24:46.583508 1527 server.cc:563] \n",
+      "2023-05-09 01:55:35.263779: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:55:35.264127: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "2023-05-09 01:55:35.264284: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:996] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero\n",
+      "I0509 01:55:35.317101 1205 model_lifecycle.cc:694] successfully loaded '0_transformworkflowtriton' version 1\n",
+      "I0509 01:55:35.317235 1205 server.cc:563] \n",
       "+------------------+------+\n",
       "| Repository Agent | Path |\n",
       "+------------------+------+\n",
       "+------------------+------+\n",
       "\n",
-      "I0413 11:24:46.583587 1527 server.cc:590] \n",
+      "I0509 01:55:35.317307 1205 server.cc:590] \n",
       "+------------+-----------------------------------------------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------+\n",
       "| Backend    | Path                                                            | Config                                                                                                                                                        |\n",
       "+------------+-----------------------------------------------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------+\n",
@@ -1204,7 +14316,7 @@
       "| tensorflow | /opt/tritonserver/backends/tensorflow2/libtriton_tensorflow2.so | {\"cmdline\":{\"auto-complete-config\":\"true\",\"min-compute-capability\":\"6.000000\",\"backend-directory\":\"/opt/tritonserver/backends\",\"default-max-batch-size\":\"4\"}} |\n",
       "+------------+-----------------------------------------------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------+\n",
       "\n",
-      "I0413 11:24:46.583634 1527 server.cc:633] \n",
+      "I0509 01:55:35.317350 1205 server.cc:633] \n",
       "+---------------------------+---------+--------+\n",
       "| Model                     | Version | Status |\n",
       "+---------------------------+---------+--------+\n",
@@ -1213,9 +14325,9 @@
       "| executor_model            | 1       | READY  |\n",
       "+---------------------------+---------+--------+\n",
       "\n",
-      "I0413 11:24:46.610538 1527 metrics.cc:864] Collecting metrics for GPU 0: Quadro RTX 8000\n",
-      "I0413 11:24:46.610778 1527 metrics.cc:757] Collecting CPU metrics\n",
-      "I0413 11:24:46.610913 1527 tritonserver.cc:2264] \n",
+      "I0509 01:55:35.343214 1205 metrics.cc:864] Collecting metrics for GPU 0: Quadro RTX 8000\n",
+      "I0509 01:55:35.343395 1205 metrics.cc:757] Collecting CPU metrics\n",
+      "I0509 01:55:35.343534 1205 tritonserver.cc:2264] \n",
       "+----------------------------------+------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+\n",
       "| Option                           | Value                                                                                                                                                                                                |\n",
       "+----------------------------------+------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+\n",
@@ -1234,16 +14346,16 @@
       "| exit_timeout                     | 30                                                                                                                                                                                                   |\n",
       "+----------------------------------+------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+\n",
       "\n",
-      "I0413 11:24:46.611676 1527 grpc_server.cc:4819] Started GRPCInferenceService at 0.0.0.0:8001\n",
-      "I0413 11:24:46.611833 1527 http_server.cc:3477] Started HTTPService at 0.0.0.0:8000\n",
-      "I0413 11:24:46.652586 1527 http_server.cc:184] Started Metrics Service at 0.0.0.0:8002\n"
+      "I0509 01:55:35.344357 1205 grpc_server.cc:4819] Started GRPCInferenceService at 0.0.0.0:8001\n",
+      "I0509 01:55:35.344507 1205 http_server.cc:3477] Started HTTPService at 0.0.0.0:8000\n",
+      "I0509 01:55:35.385232 1205 http_server.cc:184] Started Metrics Service at 0.0.0.0:8002\n"
      ]
     },
     {
      "name": "stderr",
      "output_type": "stream",
      "text": [
-      "2023-04-13 11:25:37.504455: I tensorflow/stream_executor/cuda/cuda_dnn.cc:424] Loaded cuDNN version 8700\n"
+      "2023-05-09 01:56:23.448369: I tensorflow/stream_executor/cuda/cuda_dnn.cc:424] Loaded cuDNN version 8700\n"
      ]
     }
    ],