openvinotoolkit · ilya-lavrenov · Dec 14, 2023 · Dec 13, 2023 · Dec 13, 2023 · Dec 13, 2023
diff --git a/text_generation/casual_lm/cpp/CMakeLists.txt → text_generation/causal_lm/cpp/CMakeLists.txt b/text_generation/casual_lm/cpp/CMakeLists.txt → text_generation/causal_lm/cpp/CMakeLists.txt
@@ -2,25 +2,25 @@
 # SPDX-License-Identifier: Apache-2.0
 
 cmake_minimum_required(VERSION 3.15)
-project(casual_lm)
+project(causal_lm)
 
 # Build user_ov_extensions
 list(APPEND CUSTOM_OPERATIONS tokenizer)
 add_subdirectory(../../../thirdparty/openvino_contrib/modules/custom_operations/ "${CMAKE_CURRENT_BINARY_DIR}/custom_operations/")
 
-add_executable(casual_lm casual_lm.cpp)
-target_compile_definitions(casual_lm PRIVATE USER_OV_EXTENSIONS_PATH=\"$<TARGET_FILE:user_ov_extensions>\")
+add_executable(causal_lm causal_lm.cpp)
+target_compile_definitions(causal_lm PRIVATE USER_OV_EXTENSIONS_PATH=\"$<TARGET_FILE:user_ov_extensions>\")
 find_package(OpenVINO REQUIRED COMPONENTS Runtime)
-target_link_libraries(casual_lm PRIVATE openvino::runtime user_ov_extensions)
-set_target_properties(casual_lm PROPERTIES CXX_STANDARD 17)
-set_target_properties(casual_lm PROPERTIES CXX_STANDARD_REQUIRED ON)
+target_link_libraries(causal_lm PRIVATE openvino::runtime user_ov_extensions)
+set_target_properties(causal_lm PROPERTIES CXX_STANDARD 17)
+set_target_properties(causal_lm PROPERTIES CXX_STANDARD_REQUIRED ON)
 if(MSVC)
     target_compile_options(
-        casual_lm PRIVATE
+        causal_lm PRIVATE
         /Wall  # Display all warnings
         /wd4710 /wd4711  # Disable the inline warnings
         /EHsc  # Enable standard C++ stack unwinding, assume functions with extern "C" never throw
     )
 else()
-    target_compile_options(casual_lm PRIVATE -Wall)  # Display all warnings
+    target_compile_options(causal_lm PRIVATE -Wall)  # Display all warnings
 endif()
diff --git a/text_generation/casual_lm/cpp/README.md → text_generation/causal_lm/cpp/README.md b/text_generation/casual_lm/cpp/README.md → text_generation/causal_lm/cpp/README.md
@@ -53,8 +53,8 @@ python ./convert_tokenizers.py ./Llama-2-7b-hf/
 
 ## Run
 
-Usage: `casual_lm <openvino_model.xml> <tokenizer.xml> <detokenizer.xml> "<prompt>"`
+Usage: `causal_lm <openvino_model.xml> <tokenizer.xml> <detokenizer.xml> "<prompt>"`
 
-Example: `./build/casual_lm ./Llama-2-7b-hf/openvino_model.xml ./tokenizer.xml ./detokenizer.xml "Why is the Sun yellow?"`
+Example: `./build/causal_lm ./Llama-2-7b-hf/openvino_model.xml ./tokenizer.xml ./detokenizer.xml "Why is the Sun yellow?"`
 
 To enable Unicode characters for Windows cmd open `Region` settings from `Control panel`. `Administrative`->`Change system locale`->`Beta: Use Unicode UTF-8 for worldwide language support`->`OK`. Reboot.
diff --git a/text_generation/casual_lm/cpp/casual_lm.cpp → text_generation/causal_lm/cpp/causal_lm.cpp b/text_generation/casual_lm/cpp/casual_lm.cpp → text_generation/causal_lm/cpp/causal_lm.cpp
@@ -39,13 +39,10 @@ int main(int argc, char* argv[]) try {
         }},
         {1, ov::PartialShape{
             BATCH_SIZE, -1
-        }},
-        {2, ov::PartialShape{
-	    BATCH_SIZE, -1
         }}
     };
     std::vector<ov::Output<ov::Node>> inputs = model->inputs();
-    for (size_t idx = 3; idx < inputs.size(); ++idx) {
+    for (size_t idx = 2; idx < inputs.size(); ++idx) {
         ov::PartialShape shape = inputs.at(idx).get_partial_shape();
         shape[0] = BATCH_SIZE;
         shapes.emplace(idx, shape);
@@ -59,23 +56,18 @@ int main(int argc, char* argv[]) try {
     std::copy_n(input_ids.data<const int64_t>(), input_ids.get_size(), ireq.get_tensor("input_ids").data<int64_t>());
     ireq.get_tensor("attention_mask").set_shape(attention_mask.get_shape());
     std::fill_n(ireq.get_tensor("attention_mask").data<int64_t>(), attention_mask.get_size(), 1);
-    ireq.get_tensor("position_ids").set_shape(input_ids.get_shape());
-    std::iota(ireq.get_tensor("position_ids").data<int64_t>(), ireq.get_tensor("position_ids").data<int64_t>() + ireq.get_tensor("position_ids").get_size(), 0);
     ireq.infer();
     size_t vocab_size = ireq.get_tensor("logits").get_shape().back();
     float* logits = ireq.get_tensor("logits").data<float>() + (input_ids.get_size() - 1) * vocab_size;
     int64_t out_token = std::max_element(logits, logits + vocab_size) - logits;
-
     ireq.get_tensor("input_ids").set_shape({BATCH_SIZE, 1});
-    ireq.get_tensor("position_ids").set_shape({BATCH_SIZE, 1});
     constexpr int64_t SPECIAL_EOS_TOKEN = 2;  // There's no way to extract the value from the detokenizer for now
     while (out_token != SPECIAL_EOS_TOKEN) {
         ireq.get_tensor("input_ids").data<int64_t>()[0] = out_token;
         ireq.get_tensor("attention_mask").set_shape({BATCH_SIZE, ireq.get_tensor("attention_mask").get_shape()[1] + 1});
         std::fill_n(ireq.get_tensor("attention_mask").data<int64_t>(), ireq.get_tensor("attention_mask").get_size(), 1);
-        ireq.get_tensor("position_ids").data<int64_t>()[0] = ireq.get_tensor("attention_mask").get_size() - 2;
-        for (size_t idx = 3; idx < inputs.size(); ++idx) {
-            ireq.set_input_tensor(idx, ireq.get_output_tensor(idx - 2));
+        for (size_t idx = 2; idx < inputs.size(); ++idx) {
+            ireq.set_input_tensor(idx, ireq.get_output_tensor(idx - 1));
         }
         ireq.start_async();
         print_token(detokenizer, out_token);

diff --git a/...ation/casual_lm/cpp/convert_tokenizers.py → ...ation/causal_lm/cpp/convert_tokenizers.py b/...ation/casual_lm/cpp/convert_tokenizers.py → ...ation/causal_lm/cpp/convert_tokenizers.py
diff --git a/...eneration/casual_lm/cpp/set_up_and_run.sh → ...eneration/causal_lm/cpp/set_up_and_run.sh b/...eneration/casual_lm/cpp/set_up_and_run.sh → ...eneration/causal_lm/cpp/set_up_and_run.sh
@@ -13,7 +13,7 @@ function abs_path() {
 cd "`abs_path`"
 
 mkdir ./ov/
-curl https://storage.openvinotoolkit.org/repositories/openvino/packages/2023.1/linux/l_openvino_toolkit_ubuntu20_2023.1.0.12185.47b736f63ed_x86_64.tgz | tar --directory ./ov/ --strip-components 1 -xz
+curl https://storage.openvinotoolkit.org/repositories/openvino/packages/2023.2/linux/l_openvino_toolkit_ubuntu20_2023.2.0.13089.cfd42bd2cb0_x86_64.tgz | tar --directory ./ov/ --strip-components 1 -xz
 sudo ./ov/install_dependencies/install_openvino_dependencies.sh
 
 source ./ov/setupvars.sh
@@ -23,4 +23,4 @@ cmake --build ./build/ --config Release -j
 wait
 
 python ./convert_tokenizers.py ./open_llama_3b_v2/
-./build/casual_lm ./open_llama_3b_v2/openvino_model.xml ./tokenizer.xml ./detokenizer.xml "return 0"
+./build/causal_lm ./open_llama_3b_v2/openvino_model.xml ./tokenizer.xml ./detokenizer.xml "Why is the Sun yellow?"