ai-edge-torch/ai_edge_torch/generative at main · google-ai-edge/ai-edge-torch · GitHub

 def get_sample_prefill_inputs() -> Tuple[torch.Tensor, torch.Tensor]:
   idx = torch.unsqueeze(torch.arange(0, 100), 0)
   input_pos = torch.arange(0, 100)
   return idx, input_pos
 def get_sample_decode_inputs() -> Tuple[torch.Tensor, torch.Tensor]:
   idx = torch.tensor([[1]], dtype=torch.long)
   input_pos = torch.tensor([10], dtype=torch.int64)
   return idx, input_pos
 print('converting toy model to tflite with 2 signatures (prefill + decode)')
 edge_model = (
     ai_edge_torch.signature('prefill', model, (idx, input_pos))
     .signature('decode', model, (decode_idx, decode_input_pos))
     .convert()
 )
 edge_model.export('/tmp/toy_kv_cache.tflite')
Name		Name	Last commit message	Last commit date
parent directory ..
doc		doc
examples		examples
fx_passes		fx_passes
layers		layers
quantize		quantize
screenshots		screenshots
test		test
tools		tools
utilities		utilities
README.md		README.md
__init__.py		__init__.py
	def get_sample_prefill_inputs() -> Tuple[torch.Tensor, torch.Tensor]:
	idx = torch.unsqueeze(torch.arange(0, 100), 0)
	input_pos = torch.arange(0, 100)
	return idx, input_pos
	def get_sample_decode_inputs() -> Tuple[torch.Tensor, torch.Tensor]:
	idx = torch.tensor([[1]], dtype=torch.long)
	input_pos = torch.tensor([10], dtype=torch.int64)
	return idx, input_pos
	print('converting toy model to tflite with 2 signatures (prefill + decode)')
	edge_model = (
	ai_edge_torch.signature('prefill', model, (idx, input_pos))
	.signature('decode', model, (decode_idx, decode_input_pos))
	.convert()
	)
	edge_model.export('/tmp/toy_kv_cache.tflite')