fork: whisper-demo-for-web
基于 WebRCT + whisper 的语音识别 demo
基于flet + modelscope 的实时语言识别与翻译
- 实时识别时,保存历史音频使用Whisper优化识别内容
- Flet客户端可以选择音频设备再监听(Electron/Node是否有选择音频设备的库)
- 语言角色识别
web
- 构建工具:
vite
- 框架:
React
- 组件库:
antd
- 语音采集:
recordrtc
,webm-to-wav-converter
- 客户端生成:
flet
python
- 服务器框架:
uvicorn
,fastapi
- 音频处理:
librosa
,numpy
- 字词转换:
zhconv
- 语音采集:
soundfile
,sounddevice
cd ./web
pnpm install
pnpm run dev
cd ./python
pip install -r requirements.txt
python main.py
cd ./python
pip install -r requirements.txt
flet run flet_main.py
在浏览器中访问 http://localhost:5173/
-
找不到动态链接库,我使用的是miniforge3,所以需要手动指定lib
export LD_LIBRARY_PATH="/home/user/miniforge3/lib:$LD_LIBRARY_PATH"