דילוג לתוכן
  • דף הבית
  • קטגוריות
  • פוסטים אחרונים
  • משתמשים
  • חיפוש
  • חוקי הפורום
כיווץ
תחומים

תחומים - פורום חרדי מקצועי

💡 רוצה לזכור קריאת שמע בזמן? לחץ כאן!
  1. דף הבית
  2. אינטרנט
  3. תמלול הקלטות לעברית - בדיוק מלא

תמלול הקלטות לעברית - בדיוק מלא

מתוזמן נעוץ נעול הועבר אינטרנט
20 פוסטים 6 כותבים 233 צפיות 5 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • dovidD dovid

    @צדיק-תמים
    https://speech.googleapis.com/v1/speech
    אם אתה משתמש בAI, תוכל להביא לו את הפלט של elevenlabs, יכול להיות שהוא יגיע עם זה לתוצאות עוד יותר טובות.

    צדיק תמיםצ מנותק
    צדיק תמיםצ מנותק
    צדיק תמים
    כתב נערך לאחרונה על ידי
    #10

    @dovid אי אפשר להשוות מודל STT מהדור הישן למודל טרנספורמר עדכני של elevenlabs או GPT
    פרומפט מתאים היה משפר את התוצאה עוד יותר כמו אתר אלף בוט שהובא לעיל

    Don’t comment bad code — rewrite it." — Brian W. Kernighan and P. J. Plaugher"
    טיפים

    תגובה 1 תגובה אחרונה
    1
    • dovidD מנותק
      dovidD מנותק
      dovid
      ניהול
      כתב נערך לאחרונה על ידי
      #11

      @צדיק-תמים כשכתבתי גוגל הבנת שאני מתכוון לג'מיני?
      גם GPT אני מתכוון לAPI הייעודי שלהם לזיהוי טקסט,
      ברור לי שGPT עצמו ייתן תוצאה טובה יותר.

      • מנטור אישי בתכנות והמסתעף – להתקדם לשלב הבא!
      • בכל נושא אפשר ליצור קשר dovid@tchumim.com
      ש תגובה 1 תגובה אחרונה
      1
      • dovidD dovid

        @צדיק-תמים כשכתבתי גוגל הבנת שאני מתכוון לג'מיני?
        גם GPT אני מתכוון לAPI הייעודי שלהם לזיהוי טקסט,
        ברור לי שGPT עצמו ייתן תוצאה טובה יותר.

        ש מנותק
        ש מנותק
        ששא
        כתב נערך לאחרונה על ידי
        #12

        @dovid @צדיק-תמים לא הבנתי, יש אפשרות לתמלל בגוגל עם המודול של ג'מיני פרו (בAPI)? כי לפי מה שהביא @צדיק-תמים זה מאוד מדויק ומובן

        צדיק תמיםצ תגובה 1 תגובה אחרונה
        1
        • ש ששא

          @dovid @צדיק-תמים לא הבנתי, יש אפשרות לתמלל בגוגל עם המודול של ג'מיני פרו (בAPI)? כי לפי מה שהביא @צדיק-תמים זה מאוד מדויק ומובן

          צדיק תמיםצ מנותק
          צדיק תמיםצ מנותק
          צדיק תמים
          כתב נערך לאחרונה על ידי
          #13

          @ששא ודאי שאפשר
          ופרומפט מתאים ישפר את התוצאה עוד יותר
          יש מגבלות קצב כל עוד החשבון שלך לא הוציא X כסף (תגגל gemini rate limits)

          Don’t comment bad code — rewrite it." — Brian W. Kernighan and P. J. Plaugher"
          טיפים

          ש תגובה 1 תגובה אחרונה
          0
          • צדיק תמיםצ צדיק תמים

            @ששא ודאי שאפשר
            ופרומפט מתאים ישפר את התוצאה עוד יותר
            יש מגבלות קצב כל עוד החשבון שלך לא הוציא X כסף (תגגל gemini rate limits)

            ש מנותק
            ש מנותק
            ששא
            כתב נערך לאחרונה על ידי
            #14

            @צדיק-תמים כתב בתמלול הקלטות לעברית - בדיוק מלא:

            ופרומפט מתאים

            דהיינו?

            לא הוציא X כסף

            לא הבנתי

            תגגל gemini rate limits

            מגבלות די נמוכות - 1,500 ליום זה ממש לא הרבה...

            צדיק תמיםצ תגובה 1 תגובה אחרונה
            0
            • ש ששא

              @צדיק-תמים כתב בתמלול הקלטות לעברית - בדיוק מלא:

              ופרומפט מתאים

              דהיינו?

              לא הוציא X כסף

              לא הבנתי

              תגגל gemini rate limits

              מגבלות די נמוכות - 1,500 ליום זה ממש לא הרבה...

              צדיק תמיםצ מנותק
              צדיק תמיםצ מנותק
              צדיק תמים
              כתב נערך לאחרונה על ידי
              #15

              @ששא
              פרומפט הכוונה לבקש במפורט את סגנון הפלט הרצוי, רקע על הדובר, מילים רלוונטיות, כל הדברים שמשפרים תפוקה של מודל שפה כמו גמיני
              49c342f3-58e9-44ca-8485-60babbccee35-CleanShot 2026-02-20 at 01.32.22@2x.png
              לא יודע מאיפה המספר 1500

              Don’t comment bad code — rewrite it." — Brian W. Kernighan and P. J. Plaugher"
              טיפים

              ש תגובה 1 תגובה אחרונה
              0
              • צדיק תמיםצ צדיק תמים

                @ששא
                פרומפט הכוונה לבקש במפורט את סגנון הפלט הרצוי, רקע על הדובר, מילים רלוונטיות, כל הדברים שמשפרים תפוקה של מודל שפה כמו גמיני
                49c342f3-58e9-44ca-8485-60babbccee35-CleanShot 2026-02-20 at 01.32.22@2x.png
                לא יודע מאיפה המספר 1500

                ש מנותק
                ש מנותק
                ששא
                כתב נערך לאחרונה על ידי
                #16

                @צדיק-תמים כתב בתמלול הקלטות לעברית - בדיוק מלא:

                לא יודע מאיפה המספר 1500

                1.זה לא קשור לדף הזה?
                2.ממש לא הבנתי מה אומר המלל שם ומה פירושם
                ואשמח גם אם אחרי ההסבר תוכל גם להגיד לי אם אתה יודע מה באמת המגבלה

                צדיק תמיםצ תגובה 1 תגובה אחרונה
                0
                • ש ששא

                  @צדיק-תמים כתב בתמלול הקלטות לעברית - בדיוק מלא:

                  לא יודע מאיפה המספר 1500

                  1.זה לא קשור לדף הזה?
                  2.ממש לא הבנתי מה אומר המלל שם ומה פירושם
                  ואשמח גם אם אחרי ההסבר תוכל גם להגיד לי אם אתה יודע מה באמת המגבלה

                  צדיק תמיםצ מנותק
                  צדיק תמיםצ מנותק
                  צדיק תמים
                  כתב נערך לאחרונה על ידי
                  #17

                  @ששא מה הקשר Code Assist?
                  אין מגבלה אחת, זה תלוי מודל ותלוי בהיסטוריית התשלומים של החשבון

                  Don’t comment bad code — rewrite it." — Brian W. Kernighan and P. J. Plaugher"
                  טיפים

                  תגובה 1 תגובה אחרונה
                  0
                  • dovidD מנותק
                    dovidD מנותק
                    dovid
                    ניהול
                    כתב נערך לאחרונה על ידי dovid
                    #18

                    יש שתי נקודות שבמקרים מסויימים יכולים להיות סיבות למה לא להשתמש בג'מיני (או כל LLM מולטי), אלא בAPI ייעודי:
                    א. מחיר - הLLM יותר יקר ופחות ניתן לחיזוי בלי ניסיון בפועל.
                    ב. טמפרטורה ודטרמניזם - הLLM עלול - תיאורטית לפחות - להפתיע לרעה, או בכלל להפתיע.

                    יכול להיות שאני טועה בשניהם (כלומר שיש דרך להעריך בקלות את המחיר, ושכיום או תמיד היה ניתן להדק את הודאות של הפלט ל99.99 אחוזים), אני התמודדתי עם שני הדברים האלה כמה פעמים. גם בתרגום טקסט לטקסט, וגם באילוץ מבנה תשובה ששמה לכאורה לא יכולים להיות הפתעות.

                    • מנטור אישי בתכנות והמסתעף – להתקדם לשלב הבא!
                    • בכל נושא אפשר ליצור קשר dovid@tchumim.com
                    NH.LOCALN תגובה 1 תגובה אחרונה
                    1
                    • dovidD dovid

                      יש שתי נקודות שבמקרים מסויימים יכולים להיות סיבות למה לא להשתמש בג'מיני (או כל LLM מולטי), אלא בAPI ייעודי:
                      א. מחיר - הLLM יותר יקר ופחות ניתן לחיזוי בלי ניסיון בפועל.
                      ב. טמפרטורה ודטרמניזם - הLLM עלול - תיאורטית לפחות - להפתיע לרעה, או בכלל להפתיע.

                      יכול להיות שאני טועה בשניהם (כלומר שיש דרך להעריך בקלות את המחיר, ושכיום או תמיד היה ניתן להדק את הודאות של הפלט ל99.99 אחוזים), אני התמודדתי עם שני הדברים האלה כמה פעמים. גם בתרגום טקסט לטקסט, וגם באילוץ מבנה תשובה ששמה לכאורה לא יכולים להיות הפתעות.

                      NH.LOCALN מנותק
                      NH.LOCALN מנותק
                      NH.LOCAL
                      כתב נערך לאחרונה על ידי NH.LOCAL
                      #19

                      @dovid כתב בתמלול הקלטות לעברית - בדיוק מלא:

                      יש שתי נקודות שבמקרים מסויימים יכולים להיות סיבות למה לא להשתמש בג'מיני (או כל LLM מולטי), אלא בAPI ייעודי:
                      א. מחיר - הLLM יותר יקר ופחות ניתן לחיזוי בלי ניסיון בפועל.
                      ב. טמפרטורה ודטרמניזם - הLLM עלול - תיאורטית לפחות - להפתיע לרעה, או בכלל להפתיע.

                      יכול להיות שאני טועה בשניהם (כלומר שיש דרך להעריך בקלות את המחיר, ושכיום או תמיד היה ניתן להדק את הודאות של הפלט ל99.99 אחוזים), אני התמודדתי עם שני הדברים האלה כמה פעמים. גם בתרגום טקסט לטקסט, וגם באילוץ מבנה תשובה ששמה לכאורה לא יכולים להיות הפתעות.

                      אני רואה שהזכירו את האתר שלי לעיל

                      כמה הערות מנסיוני כאחד שהשקיע הרבה בירור ועבודה של חודשים בנושא:

                      • בשונה מהמקובל - למודלים כמו וויספר ודומיהם יש הזיות לא פחות ממודלים מבוססי LLM
                        באופן אישי נתקלתי בהזיות האלו בשימוש די בסיסי אפילו עבור תמלול תוכן באנגלית
                        הנה לדוגמה כתבה בנושא שנתקלתי בה בעבר

                      • LLMs אכן הוזים לפעמים כאשר מדובר על תוכן שפחות נמצא בנתוני האימון, כמו יידיש או הברה אשכנזית כבדה
                        אבל בעברית סטנדרטית עם איכות הקלטה סבירה, רמת הדיוק שלהם קרובה מאוד ל-100%, ברמה שיתכן שניתן לוותר אפילו על הגייה אנושית (אם כי לא הייתי סומך על זה בעיניים עצומות)

                      • המחיר הוא אכן שיקול משמעותי ולשימוש יומיומי בסיסי בהחלט אין טעם בשימוש ב-LLMs, אבל עבור כל מה שמעבר (עריכת ספרים, תמלול סרטונים ליוטיוב, תמלול פודקאסטים), אין ספק ששימוש ב-LLMs (או באתר שלי...) יהיה הרבה יותר יעיל ויחסוך הרבה עבודה, ביחוד עבור מי שגם ככה משקיע מאות ואלפי שקלים עבור תמלול אנושי

                      • הכוכבית היחידה הוא תמלול כתוביות לפי זמנים - שבו LLMs בהחלט עשויים להזות ולהמציא זמנים או לא לדייק בהם
                        גם יצירת תוכן בפורמט קבוע כמו SRT עדיין בעייתית וגורמת להרבה תקלות

                      @dovid כתב בתמלול הקלטות לעברית - בדיוק מלא:

                      @צדיק-תמים כשכתבתי גוגל הבנת שאני מתכוון לג'מיני?
                      גם GPT אני מתכוון לAPI הייעודי שלהם לזיהוי טקסט,
                      ברור לי שGPT עצמו ייתן תוצאה טובה יותר.

                      • מידע בונוס: האיכות של GPT עבור תמלול לא מרשימה בכלל ולא שווה הרבה. נראה ש-OpenAI די הזניחו תכונות מולטי-מודאליות מסויימות בשונה מגוגל
                        למעשה, נראה לי שהמודל האחרון שתומך ב-API של TTS הוא GPT 4o

                      אלף בוט - תמלול מדויק לתוכן תורני
                      https://alef-bot.top

                      ש תגובה 1 תגובה אחרונה
                      6
                      • NH.LOCALN NH.LOCAL

                        @dovid כתב בתמלול הקלטות לעברית - בדיוק מלא:

                        יש שתי נקודות שבמקרים מסויימים יכולים להיות סיבות למה לא להשתמש בג'מיני (או כל LLM מולטי), אלא בAPI ייעודי:
                        א. מחיר - הLLM יותר יקר ופחות ניתן לחיזוי בלי ניסיון בפועל.
                        ב. טמפרטורה ודטרמניזם - הLLM עלול - תיאורטית לפחות - להפתיע לרעה, או בכלל להפתיע.

                        יכול להיות שאני טועה בשניהם (כלומר שיש דרך להעריך בקלות את המחיר, ושכיום או תמיד היה ניתן להדק את הודאות של הפלט ל99.99 אחוזים), אני התמודדתי עם שני הדברים האלה כמה פעמים. גם בתרגום טקסט לטקסט, וגם באילוץ מבנה תשובה ששמה לכאורה לא יכולים להיות הפתעות.

                        אני רואה שהזכירו את האתר שלי לעיל

                        כמה הערות מנסיוני כאחד שהשקיע הרבה בירור ועבודה של חודשים בנושא:

                        • בשונה מהמקובל - למודלים כמו וויספר ודומיהם יש הזיות לא פחות ממודלים מבוססי LLM
                          באופן אישי נתקלתי בהזיות האלו בשימוש די בסיסי אפילו עבור תמלול תוכן באנגלית
                          הנה לדוגמה כתבה בנושא שנתקלתי בה בעבר

                        • LLMs אכן הוזים לפעמים כאשר מדובר על תוכן שפחות נמצא בנתוני האימון, כמו יידיש או הברה אשכנזית כבדה
                          אבל בעברית סטנדרטית עם איכות הקלטה סבירה, רמת הדיוק שלהם קרובה מאוד ל-100%, ברמה שיתכן שניתן לוותר אפילו על הגייה אנושית (אם כי לא הייתי סומך על זה בעיניים עצומות)

                        • המחיר הוא אכן שיקול משמעותי ולשימוש יומיומי בסיסי בהחלט אין טעם בשימוש ב-LLMs, אבל עבור כל מה שמעבר (עריכת ספרים, תמלול סרטונים ליוטיוב, תמלול פודקאסטים), אין ספק ששימוש ב-LLMs (או באתר שלי...) יהיה הרבה יותר יעיל ויחסוך הרבה עבודה, ביחוד עבור מי שגם ככה משקיע מאות ואלפי שקלים עבור תמלול אנושי

                        • הכוכבית היחידה הוא תמלול כתוביות לפי זמנים - שבו LLMs בהחלט עשויים להזות ולהמציא זמנים או לא לדייק בהם
                          גם יצירת תוכן בפורמט קבוע כמו SRT עדיין בעייתית וגורמת להרבה תקלות

                        @dovid כתב בתמלול הקלטות לעברית - בדיוק מלא:

                        @צדיק-תמים כשכתבתי גוגל הבנת שאני מתכוון לג'מיני?
                        גם GPT אני מתכוון לAPI הייעודי שלהם לזיהוי טקסט,
                        ברור לי שGPT עצמו ייתן תוצאה טובה יותר.

                        • מידע בונוס: האיכות של GPT עבור תמלול לא מרשימה בכלל ולא שווה הרבה. נראה ש-OpenAI די הזניחו תכונות מולטי-מודאליות מסויימות בשונה מגוגל
                          למעשה, נראה לי שהמודל האחרון שתומך ב-API של TTS הוא GPT 4o
                        ש מנותק
                        ש מנותק
                        ששא
                        כתב נערך לאחרונה על ידי
                        #20

                        @NH.LOCAL כמי שעסקת בתחום, על מה את ממליץ הכי טוב - בapi או בai?
                        גוגל? ויספר? openAi (דיבור לטקסט)? gpt? מייקרוסופט? ג'מיני?

                        תגובה 1 תגובה אחרונה
                        1
                        תגובה
                        • תגובה כנושא
                        התחברו כדי לפרסם תגובה
                        • מהישן לחדש
                        • מהחדש לישן
                        • הכי הרבה הצבעות


                        בא תתחבר לדף היומי!
                        • התחברות

                        • אין לך חשבון עדיין? הרשמה

                        • התחברו או הירשמו כדי לחפש.
                        • פוסט ראשון
                          פוסט אחרון
                        0
                        • דף הבית
                        • קטגוריות
                        • פוסטים אחרונים
                        • משתמשים
                        • חיפוש
                        • חוקי הפורום