Whisper (OpenAI STT model)
OpenAI 에서 오늘 공개한 STT 모델, Whisper (논문 코드)
We’ve trained and are open-sourcing a neural net called Whisper that approaches human level robustness and accuracy on English speech recognition.
- automatic speech recognition (ASR) system
- 웹에서 수집한 680,000 hours of multilingual and multitask supervised data
- 다양한 언어를 영어로 번역해서 제공한다..!
- Whisper architecture : End-to-end approach
- Decoder
- 논문 리뷰 전이라 블로그 읽고 간단하게 작성