@dovid כתב בTTS ונרמול דאטה:
@יהודי-טוב משונה, יש מצב שהתהפך לך התוצאות?
אני ממש לפני כמה ימים השוויתי את גוגל וOpenAI והשני היה טוב הרבה יותר.
אני בדקתי מלא הקלטות, ולא היה אפילו אחת לטובת גוגל.
אולי השתמשתי במודול אחר
מצרף את הקוד שבדקתי
//OpenAI
const openAi = await openaiConf.audio.transcriptions.create({
file: fs.createReadStream(tempFilePath),
model: "whisper-1",
response_format: "verbose_json",
language: "he",
});
//Google
const file = fs.readFileSync(tempFilePath);
const [responseGoogle] = await googleConf.recognize({
audio: { content: Buffer.from(file).toString('base64') },
config: { languageCode: 'iw-IL' },
});
אגב בכותרת כתבת בטעות TTS במקום STT.
תיקנתי