text to speech - Speech to text
-
text to speech - Speech to text אני מחפש שני שירותים אלו בחינם או במחיר הזול ביותר שאפשר (להשתמש באסטרקס)
אני מניח שיש כאן הרבה אנשים עם נסיון בנושא, אז אשמח אם תוכלו לשתף אותי.
דרך אגב, ראיתי שיש שירותים חינמיים, כמו טקסט קישוראך איכות הקול לא ממש טוב. אם יש לכם המלצות על שירותים חינמיים באיכות טובה יותר, אשמח לשמוע גם על כך.
-
@google3
tts -
https://ttsfree.com/ יש חינם, API רק בתוכניות בתשלום הפלוס הגדול שזה עובד על המנועים של גוגל ומיקרוסופט.עברית יש כרגע רק במיקרוסופט, אם כי אני מאמין שבקרוב גם בגוגל יתעדכן כי הבנתי שבגוגל עצמם כבר קיים בעברית (שמועה - לא בדקתי).
בנוסף, אתה יכול ללכת יש למקורות גוגל ומיקרוסופט (יש קרדיט חודשי מינימלי) שם יהיה לך גם stt.
https://cloud.google.com/speech-to-text
https://cloud.google.com/text-to-speech
https://azure.microsoft.com/en-us/products/cognitive-services/text-to-speech/
https://azure.microsoft.com/en-us/products/cognitive-services/speech-to-text/יצויין שבSTT גוגל השיגו תוצאות יותר טובות לפי הבדיקה שלי, וזה עובד מעולה גם בעברית (ללא רעשי רקע, עם רעשים זה קצת מתחיל להתבלבל).
-
@אביי ראה כאן שכבר יש תמיכה רשמית בTTS בעברית בAPI של גוגל,
לגבי הAPI של ttsfree.com:- צריך להגיע לכמויות גדולות של TTS בשביל שישתלם לשלם להם 20$ לחודש ולקבל שימוש ללא הגבלה, ולא בשל מייקרוסופט/גוגל ולשלם לפי שימוש,
זאת מלבד הטריקים הרגילים של 300$ שמקבלים בחשבון גוגל חדש ל90 יום, וכעין זה יש גם במייקרוסופט (Azure), או חשבון עמותה אם יש. - נכון לעכשיו לא מופיע, לפחות בממשק, הקולות החדשים בעברית של גוגל (למרות שבתיעוד של גוגל הם מופיעים בהחלט)
כיוון שזה היה לי קצת מסובך בזמנו למצוא את הלינק שבו אפשר לנסות את הSTT של מייקרוסופט, מצרף אותו:
https://speech.microsoft.com/portal/speechtotexttool - צריך להגיע לכמויות גדולות של TTS בשביל שישתלם לשלם להם 20$ לחודש ולקבל שימוש ללא הגבלה, ולא בשל מייקרוסופט/גוגל ולשלם לפי שימוש,
-
@אביי כתב בtext to speech - Speech to text:
https://ttsfree.com/ יש חינם, API רק בתוכניות בתשלום הפלוס הגדול שזה עובד על המנועים של גוגל ומיקרוסופט.
לא הכרתי הAPI שלהם, וזה נראה מאוד תמוה.
במייקרוסופט המחיר הוא 16 דולר למליון תווים, ואילו הם נותנים 10 מליון תווים שאמורים לעלות 160 דולר, ב20 דולר.
מה הפשט?
שלחתי להם מייל לבקש פרטים, אבל אם אתה משתמש בזה אשמח שתגיד לי אם באמת עובד שם הקולות הneural ואם אכן נותנים את ה10 מליון תווים -
@שואף כתב בtext to speech - Speech to text:
אבל אם אתה משתמש בזה אשמח שתגיד לי אם באמת עובד שם הקולות הneural
לא השתמשתי בAPI שלהם כי זה לא שווה לי, לכמות שאני משתמש מספיק לי החינמי שאני מקבל ישירות ממיקרוספט/גוגל.
אבל השתמשתי כמה פעמים בממשק האתר כדי ליצור קבצי שמע מטקסט (מיקרוסופט), וזה יוצא ממש מעולה (לא שמתי לב להבדל בין זה לבין מה שיוצא בAPI של מיקרוסופט עצמם, אם לזה התכוונת)
אמנם שמתי לב בכללי בtts עצבי, שלמרות שהקול נשמע די אנושי וההגיה נכונה ומדויקת (באנ' תמיד בעברית היו כמה פשלות) בקטע של המהירות היא תמיד אחידה לכל המשפט, ואם יש מילים שבנ"א הוגים אותם מהר יותר משאר חלקי המשפט כאן זה נאמר אותו הדבר.
-
תודה לכל העונים
למעשה עד כה נעזרתי רק ב-text to speech, לכוראה אשתמש בגוגל (עם כל מוני טריקים) או באתר ttsfree.com (ולכוראה אתברר לי עם הזמן שזה לא ממש 10 מליון תווים)
אבל כעת אני צריך עזרה עם - speech to text
לפי החישובים שלי, למליון דקות speech to text זה יעלה לי בערך $16,666.67. זה מחיר די גבוה, (גם גוגל וגם מקרוסופט מבקשים כמעט דולר לשעה)
האם מישהו יכול להמליץ על שירות שמציע פתרון speech to text במחיר יותר סביר או כמובן הכי טוב חינם ? אשמח לשמוע את חוות הדעת וההמלצות שלכם.
תודה רבה!