stWhisper.py

import streamlit as st
from whisper_cpp import Whisper
from ffmpeg import FFmpeg
import os
import datetime
import datetime
import time

@st.cache_resource 
def create_whisper():   
    whisper = Whisper("models/ggml-tiny.en-q8_0.bin")
    return whisper

@st.cache_resource
def ffmpegconvert(x):
    ffmpeg = FFmpeg().input(x).output("temp.wav", {"codec:a": "pcm_s16le",
                                                            'ar':16000,
                                                            'ac':1})
    ffmpeg.execute()
    pass

if "gentime" not in st.session_state:
    st.session_state.gentime = "**:green[none yet]**"
if "audiofile" not in st.session_state:
    st.session_state.audiofile = ''    

def main():
    st.set_page_config(layout="wide", page_title="AI Whisper Transcriber")
    whisper = create_whisper()
    st.write("# 🎙️✍️ Transcribe your Audio files with whisper.CPP\n\n\n")
    st.markdown('\n---\n', unsafe_allow_html=True)
    st.sidebar.write("## Upload an audio file :gear:")
    file1=None
    transcribe_btn = st.button('✨ **Start AI Magic**', type='primary')
    st.markdown('\n\n')
    message1 = st.empty()
    message11 = st.empty()
    message2 = st.empty()
    message3 = st.empty()
    audioplayer = st.empty()
    transcribed = st.empty()

    # Upload the audio file
    file1 = st.sidebar.file_uploader("Upload Audio file", type=["mp3", "wav"],accept_multiple_files=False)
    gentimetext = st.sidebar.empty()

    if (transcribe_btn and file1):
        with st.spinner("Transcribing..."):
            print(file1.name)
            if 'mp3' in file1.name:
                print('The file is an MP3: starting ffmpeg')
                message1.info(' Your Audio file is a MP3: we are going to convert it!',icon='⏳')
                out = ffmpegconvert(file1.name)
                message11.success(' Audio file correcty encoded into WAV 16k Mono',icon='✅')
                start = datetime.datetime.now()
                print('Start transcribing...')
                whisper.transcribe('temp.wav', 
                                diarize=False,
                                print_progress=False) 
                delta = datetime.datetime.now() - start
                st.session_state.gentime = f"**:green[{str(delta)}]**"
                gentimetext.write(st.session_state.gentime)
                message2.success(' Audio transcribed by AI',icon='✅')
                print('removing temp files...')
                try:
                    os.remove('temp.wav')
                except:
                    pass    
                print('writing text file out...')
                result = whisper.output('AITranscribed',output_txt=True,output_srt=True)
                st.toast('Output files **AITranscribed** saved!', icon='🎉')
                time.sleep(1.2)
                st.toast('**text** file saved', icon='📃')
                time.sleep(1.2)
                st.toast('**subtitles** file saved', icon='🪩')
                transcribed.write(result)                
                transcribed.write(result)
                print('completed')

            else:             
                start = datetime.datetime.now()
                whisper.transcribe(file1.name, 
                                diarize=False,
                                print_progress=False) #spanish.wav 
                delta = datetime.datetime.now() - start
                st.session_state.gentime = f"**:green[{str(delta)}]**" 
                gentimetext.write(st.session_state.gentime)
                message2.success(' Audio transcribed by AI',icon='✅')                
                result = whisper.output('AITranscribed',output_txt=True,output_srt=True)
                st.toast('Output files **AITranscribed** saved!', icon='🎉')
                time.sleep(1.2)
                st.toast('**text** file saved', icon='📃')
                time.sleep(1.2)
                st.toast('**subtitles** file saved', icon='🪩')
                transcribed.write(result)
                try:
                    os.remove('temp.wav')
                except:
                    pass

    if  not file1:
        message3.warning("  Upload an audio file", icon='⚠️')
    if file1:
        if 'mp3' in file1.name:
            audioplayer.audio(file1.name, format="audio/mpeg")
        else:
            audioplayer.audio(file1.name, format="audio/wav")


if __name__ == "__main__":
    main()