Veni AI

OpenAI Whisper

OpenAI'nin Konuşma Tanıma Modeli. 99 dilde otomatik transkripsiyon ile sektörün en iyisi.

Hemen Dene
SCROLL
01

Whisper Nedir?

Whisper, OpenAI tarafından geliştirilen dünya çapında lider konuşmayı metne dönüştürme (Speech-to-Text) modelidir. Model, 680,000 saat çok dilli ve çok görevli eğitim verisiyle eğitilmiştir. 99 farklı dilde %95+ doğruluk oranı ile konuşmaları metne dönüştürebilir. Whisper, sadece transkripsiyon değil, aynı zamanda çeviri ve dil tanıma gibi görevleri de mükemmel bir şekilde gerçekleştirir. Gürültülü ortamlarda bile yüksek doğruluk sağlar. Podcast transkripsiyon, video altyazı oluşturma, sesli asistan uygulamaları, müşteri hizmetleri kayıtları ve erişilebilirlik çözümleri için ideal bir seçimdir.

02

Teknik Özellikler

Bağlam Penceresi

30 saniye ses segmenti

Max Output

transkript metni

Eğitim Kesimi

2024

Aktif

Aktif

03

Yetenekler

99 dilde transkripsiyon
Çok dilli destek
Otomatik dil tanıma
Çeviri (İngilizce'ye)
Noktalama işaretleri
Timestamp desteği
Gürültü filtreleme
Konuşmacı diarizasyonu
Gerçek zamanlı transkripsiyon
Batch processing
04

Benchmark Skorları

Accuracy
95%
Language Support
99
Noise Tolerance
92%
Processing Speed
0.5x
Word Error Rate
5%
05

Avantajlar & Dezavantajlar

Avantajlar

  • 99 dilde mükemmel destek
  • Yüksek doğruluk oranı
  • Gürültüye karşı dayanıklı
  • Timestamp desteği
  • Otomatik dil tanıma
  • Çeviri özelliği

Dezavantajlar

  • 25MB dosya boyutu limiti
  • Çok konuşmacılı ortamlarda zorluk
  • Ağır aksanlar bazen sorun çıkarabilir
06

Özellikler

01

Çok Dilli Destek

99 farklı dilde profesyonel kalitede transkripsiyon.

02

Yüksek Doğruluk

%95+ doğruluk oranı ile sektör standardı.

03

Gürültü Toleransı

Gürültülü ortamlarda bile güvenilir performans.

04

Otomatik Dil Tanıma

Konuşulan dili otomatik olarak tespit eder.

05

Timestamp Desteği

Her kelime veya segment için zaman damgası.

06

Çeviri Özelliği

Herhangi bir dilden İngilizce'ye direkt çeviri.

07

Kullanım Alanları

01

Podcast Transkripsiyon

Podcast'leri otomatik olarak metne dönüştürme.

02

Video Altyazı

YouTube, film ve eğitim videoları için altyazı oluşturma.

03

Müşteri Hizmetleri

Telefon görüşmelerinin transkripsiyon ve analizi.

04

Sesli Asistanlar

Sesli komut ve sorguları metne dönüştürme.

05

Erişilebilirlik

İşitme engelliler için gerçek zamanlı altyazı.

08

Örnek Kod

python
from openai import OpenAI

client = OpenAI()

# Ses dosyasını transkript et
with open("audio.mp3", "rb") as audio_file:
    transcript = client.audio.transcriptions.create(
        model="whisper-1",
        file=audio_file,
        response_format="text"
    )

print(transcript)

# Timestamp ile transkript
with open("audio.mp3", "rb") as audio_file:
    transcript = client.audio.transcriptions.create(
        model="whisper-1",
        file=audio_file,
        response_format="verbose_json",
        timestamp_granularities=["word"]
    )

print(transcript)
09

Sık Sorulan Sorular

10

Benzer Modeller