Whisper
Siirry navigaatioon
Siirry hakuun
Tätä artikkelia tai sen osaa on pyydetty päivitettäväksi, koska sen sisältö on osin vanhentunut. Voit auttaa Wikipediaa parantamalla artikkelia. Lisää tietoa saattaa olla keskustelusivulla. Tarkennus: V3 on julkaistu marraskuussa 2023 |
Whisper | |
---|---|
Kehittäjä | OpenAI |
Kehityshistoria | |
Ensijulkaisu | 21. syyskuuta 2022 |
Tiedot | |
Ohjelmistotyyppi | käännössovellus |
Alusta | OpenAI |
Lisenssi | MIT-lisenssi |
Aiheesta muualla | |
Verkkosivusto |
Whisper on OpenAI:n kehittämä automaattinen puheentunnistusjärjestelmä. Whisper on julkaistu lokakuussa 2022. Järjestelmä voi tuottaa tekstiä äänisyötteistä. Whisper on kehitetty 680 000 tunnin monikielisellä verkkoaineistolla. Whisper mahdollistaa käännösversiot 99 kielelle sekä kääntämisen englanniksi.[1][2]
Ominaisuudet
[muokkaa | muokkaa wikitekstiä]Whisperin merkittävin ominaisuus on sen kestävyydessä. Monipuolisen harjoitusaineiston avulla järjestelmä pystyy ymmärtämään ja siirtämään puhetta eri aksenttien välillä. Whisper toimii myös meluisassa ympäristössä. Whisper kykenee kääntämään puhetta useilla eri kielillä. Whisper on toteutettu enkooderi-dekooderi-muuntajana ja se käsittelee syötettyä ääntä 30 sekunnin mittaisina kokonaisuuksina.[3]
Lähteet
[muokkaa | muokkaa wikitekstiä]- ↑ Introducing Whisper OpenAI. 21.9.2022. Viitattu 18.2.2024. (englanniksi)
- ↑ Cochard, David: Whisper : Speech Recognition Model Capable of Recognizing 99 Languages Medium. 13.11.2023. Viitattu 18.2.2024. (englanniksi)
- ↑ Kumar, Akhil: Whisper: A Breakthrough in Automatic Speech Recognition Medium. 10.10.2023. Viitattu 18.2.2024. (englanniksi)