דילוג לתוכן
  • דף הבית
  • קטגוריות
  • פוסטים אחרונים
  • משתמשים
  • חיפוש
  • חוקי הפורום
כיווץ
תחומים

תחומים - פורום חרדי מקצועי

💡 רוצה לזכור קריאת שמע בזמן? לחץ כאן!
  1. דף הבית
  2. אינטרנט
  3. תמלול הקלטות לעברית - בדיוק מלא

תמלול הקלטות לעברית - בדיוק מלא

מתוזמן נעוץ נעול הועבר אינטרנט
23 פוסטים 7 כותבים 303 צפיות 6 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • ש ששא

    @dovid @צדיק-תמים לא הבנתי, יש אפשרות לתמלל בגוגל עם המודול של ג'מיני פרו (בAPI)? כי לפי מה שהביא @צדיק-תמים זה מאוד מדויק ומובן

    צדיק תמיםצ מנותק
    צדיק תמיםצ מנותק
    צדיק תמים
    כתב נערך לאחרונה על ידי
    #13

    @ששא ודאי שאפשר
    ופרומפט מתאים ישפר את התוצאה עוד יותר
    יש מגבלות קצב כל עוד החשבון שלך לא הוציא X כסף (תגגל gemini rate limits)

    Don’t comment bad code — rewrite it." — Brian W. Kernighan and P. J. Plaugher"
    טיפים

    ש תגובה 1 תגובה אחרונה
    0
    • צדיק תמיםצ צדיק תמים

      @ששא ודאי שאפשר
      ופרומפט מתאים ישפר את התוצאה עוד יותר
      יש מגבלות קצב כל עוד החשבון שלך לא הוציא X כסף (תגגל gemini rate limits)

      ש מנותק
      ש מנותק
      ששא
      כתב נערך לאחרונה על ידי
      #14

      @צדיק-תמים כתב בתמלול הקלטות לעברית - בדיוק מלא:

      ופרומפט מתאים

      דהיינו?

      לא הוציא X כסף

      לא הבנתי

      תגגל gemini rate limits

      מגבלות די נמוכות - 1,500 ליום זה ממש לא הרבה...

      צדיק תמיםצ תגובה 1 תגובה אחרונה
      0
      • ש ששא

        @צדיק-תמים כתב בתמלול הקלטות לעברית - בדיוק מלא:

        ופרומפט מתאים

        דהיינו?

        לא הוציא X כסף

        לא הבנתי

        תגגל gemini rate limits

        מגבלות די נמוכות - 1,500 ליום זה ממש לא הרבה...

        צדיק תמיםצ מנותק
        צדיק תמיםצ מנותק
        צדיק תמים
        כתב נערך לאחרונה על ידי
        #15

        @ששא
        פרומפט הכוונה לבקש במפורט את סגנון הפלט הרצוי, רקע על הדובר, מילים רלוונטיות, כל הדברים שמשפרים תפוקה של מודל שפה כמו גמיני
        49c342f3-58e9-44ca-8485-60babbccee35-CleanShot 2026-02-20 at 01.32.22@2x.png
        לא יודע מאיפה המספר 1500

        Don’t comment bad code — rewrite it." — Brian W. Kernighan and P. J. Plaugher"
        טיפים

        ש תגובה 1 תגובה אחרונה
        0
        • צדיק תמיםצ צדיק תמים

          @ששא
          פרומפט הכוונה לבקש במפורט את סגנון הפלט הרצוי, רקע על הדובר, מילים רלוונטיות, כל הדברים שמשפרים תפוקה של מודל שפה כמו גמיני
          49c342f3-58e9-44ca-8485-60babbccee35-CleanShot 2026-02-20 at 01.32.22@2x.png
          לא יודע מאיפה המספר 1500

          ש מנותק
          ש מנותק
          ששא
          כתב נערך לאחרונה על ידי
          #16

          @צדיק-תמים כתב בתמלול הקלטות לעברית - בדיוק מלא:

          לא יודע מאיפה המספר 1500

          1.זה לא קשור לדף הזה?
          2.ממש לא הבנתי מה אומר המלל שם ומה פירושם
          ואשמח גם אם אחרי ההסבר תוכל גם להגיד לי אם אתה יודע מה באמת המגבלה

          צדיק תמיםצ תגובה 1 תגובה אחרונה
          0
          • ש ששא

            @צדיק-תמים כתב בתמלול הקלטות לעברית - בדיוק מלא:

            לא יודע מאיפה המספר 1500

            1.זה לא קשור לדף הזה?
            2.ממש לא הבנתי מה אומר המלל שם ומה פירושם
            ואשמח גם אם אחרי ההסבר תוכל גם להגיד לי אם אתה יודע מה באמת המגבלה

            צדיק תמיםצ מנותק
            צדיק תמיםצ מנותק
            צדיק תמים
            כתב נערך לאחרונה על ידי
            #17

            @ששא מה הקשר Code Assist?
            אין מגבלה אחת, זה תלוי מודל ותלוי בהיסטוריית התשלומים של החשבון

            Don’t comment bad code — rewrite it." — Brian W. Kernighan and P. J. Plaugher"
            טיפים

            תגובה 1 תגובה אחרונה
            0
            • dovidD מנותק
              dovidD מנותק
              dovid
              ניהול
              כתב נערך לאחרונה על ידי dovid
              #18

              יש שתי נקודות שבמקרים מסויימים יכולים להיות סיבות למה לא להשתמש בג'מיני (או כל LLM מולטי), אלא בAPI ייעודי:
              א. מחיר - הLLM יותר יקר ופחות ניתן לחיזוי בלי ניסיון בפועל.
              ב. טמפרטורה ודטרמניזם - הLLM עלול - תיאורטית לפחות - להפתיע לרעה, או בכלל להפתיע.

              יכול להיות שאני טועה בשניהם (כלומר שיש דרך להעריך בקלות את המחיר, ושכיום או תמיד היה ניתן להדק את הודאות של הפלט ל99.99 אחוזים), אני התמודדתי עם שני הדברים האלה כמה פעמים. גם בתרגום טקסט לטקסט, וגם באילוץ מבנה תשובה ששמה לכאורה לא יכולים להיות הפתעות.

              • מנטור אישי בתכנות והמסתעף – להתקדם לשלב הבא!
              • בכל נושא אפשר ליצור קשר dovid@tchumim.com
              NH.LOCALN תגובה 1 תגובה אחרונה
              1
              • dovidD dovid

                יש שתי נקודות שבמקרים מסויימים יכולים להיות סיבות למה לא להשתמש בג'מיני (או כל LLM מולטי), אלא בAPI ייעודי:
                א. מחיר - הLLM יותר יקר ופחות ניתן לחיזוי בלי ניסיון בפועל.
                ב. טמפרטורה ודטרמניזם - הLLM עלול - תיאורטית לפחות - להפתיע לרעה, או בכלל להפתיע.

                יכול להיות שאני טועה בשניהם (כלומר שיש דרך להעריך בקלות את המחיר, ושכיום או תמיד היה ניתן להדק את הודאות של הפלט ל99.99 אחוזים), אני התמודדתי עם שני הדברים האלה כמה פעמים. גם בתרגום טקסט לטקסט, וגם באילוץ מבנה תשובה ששמה לכאורה לא יכולים להיות הפתעות.

                NH.LOCALN מנותק
                NH.LOCALN מנותק
                NH.LOCAL
                כתב נערך לאחרונה על ידי NH.LOCAL
                #19

                @dovid כתב בתמלול הקלטות לעברית - בדיוק מלא:

                יש שתי נקודות שבמקרים מסויימים יכולים להיות סיבות למה לא להשתמש בג'מיני (או כל LLM מולטי), אלא בAPI ייעודי:
                א. מחיר - הLLM יותר יקר ופחות ניתן לחיזוי בלי ניסיון בפועל.
                ב. טמפרטורה ודטרמניזם - הLLM עלול - תיאורטית לפחות - להפתיע לרעה, או בכלל להפתיע.

                יכול להיות שאני טועה בשניהם (כלומר שיש דרך להעריך בקלות את המחיר, ושכיום או תמיד היה ניתן להדק את הודאות של הפלט ל99.99 אחוזים), אני התמודדתי עם שני הדברים האלה כמה פעמים. גם בתרגום טקסט לטקסט, וגם באילוץ מבנה תשובה ששמה לכאורה לא יכולים להיות הפתעות.

                אני רואה שהזכירו את האתר שלי לעיל

                כמה הערות מנסיוני כאחד שהשקיע הרבה בירור ועבודה של חודשים בנושא:

                • בשונה מהמקובל - למודלים כמו וויספר ודומיהם יש הזיות לא פחות ממודלים מבוססי LLM
                  באופן אישי נתקלתי בהזיות האלו בשימוש די בסיסי אפילו עבור תמלול תוכן באנגלית
                  הנה לדוגמה כתבה בנושא שנתקלתי בה בעבר

                • LLMs אכן הוזים לפעמים כאשר מדובר על תוכן שפחות נמצא בנתוני האימון, כמו יידיש או הברה אשכנזית כבדה
                  אבל בעברית סטנדרטית עם איכות הקלטה סבירה, רמת הדיוק שלהם קרובה מאוד ל-100%, ברמה שיתכן שניתן לוותר אפילו על הגייה אנושית (אם כי לא הייתי סומך על זה בעיניים עצומות)

                • המחיר הוא אכן שיקול משמעותי ולשימוש יומיומי בסיסי בהחלט אין טעם בשימוש ב-LLMs, אבל עבור כל מה שמעבר (עריכת ספרים, תמלול סרטונים ליוטיוב, תמלול פודקאסטים), אין ספק ששימוש ב-LLMs (או באתר שלי...) יהיה הרבה יותר יעיל ויחסוך הרבה עבודה, ביחוד עבור מי שגם ככה משקיע מאות ואלפי שקלים עבור תמלול אנושי

                • הכוכבית היחידה הוא תמלול כתוביות לפי זמנים - שבו LLMs בהחלט עשויים להזות ולהמציא זמנים או לא לדייק בהם
                  גם יצירת תוכן בפורמט קבוע כמו SRT עדיין בעייתית וגורמת להרבה תקלות

                @dovid כתב בתמלול הקלטות לעברית - בדיוק מלא:

                @צדיק-תמים כשכתבתי גוגל הבנת שאני מתכוון לג'מיני?
                גם GPT אני מתכוון לAPI הייעודי שלהם לזיהוי טקסט,
                ברור לי שGPT עצמו ייתן תוצאה טובה יותר.

                • מידע בונוס: האיכות של GPT עבור תמלול לא מרשימה בכלל ולא שווה הרבה. נראה ש-OpenAI די הזניחו תכונות מולטי-מודאליות מסויימות בשונה מגוגל
                  למעשה, נראה לי שהמודל האחרון שתומך ב-API של TTS הוא GPT 4o

                אלף בוט - תמלול מדויק לתוכן תורני
                https://alef-bot.top

                ש תגובה 1 תגובה אחרונה
                6
                • NH.LOCALN NH.LOCAL

                  @dovid כתב בתמלול הקלטות לעברית - בדיוק מלא:

                  יש שתי נקודות שבמקרים מסויימים יכולים להיות סיבות למה לא להשתמש בג'מיני (או כל LLM מולטי), אלא בAPI ייעודי:
                  א. מחיר - הLLM יותר יקר ופחות ניתן לחיזוי בלי ניסיון בפועל.
                  ב. טמפרטורה ודטרמניזם - הLLM עלול - תיאורטית לפחות - להפתיע לרעה, או בכלל להפתיע.

                  יכול להיות שאני טועה בשניהם (כלומר שיש דרך להעריך בקלות את המחיר, ושכיום או תמיד היה ניתן להדק את הודאות של הפלט ל99.99 אחוזים), אני התמודדתי עם שני הדברים האלה כמה פעמים. גם בתרגום טקסט לטקסט, וגם באילוץ מבנה תשובה ששמה לכאורה לא יכולים להיות הפתעות.

                  אני רואה שהזכירו את האתר שלי לעיל

                  כמה הערות מנסיוני כאחד שהשקיע הרבה בירור ועבודה של חודשים בנושא:

                  • בשונה מהמקובל - למודלים כמו וויספר ודומיהם יש הזיות לא פחות ממודלים מבוססי LLM
                    באופן אישי נתקלתי בהזיות האלו בשימוש די בסיסי אפילו עבור תמלול תוכן באנגלית
                    הנה לדוגמה כתבה בנושא שנתקלתי בה בעבר

                  • LLMs אכן הוזים לפעמים כאשר מדובר על תוכן שפחות נמצא בנתוני האימון, כמו יידיש או הברה אשכנזית כבדה
                    אבל בעברית סטנדרטית עם איכות הקלטה סבירה, רמת הדיוק שלהם קרובה מאוד ל-100%, ברמה שיתכן שניתן לוותר אפילו על הגייה אנושית (אם כי לא הייתי סומך על זה בעיניים עצומות)

                  • המחיר הוא אכן שיקול משמעותי ולשימוש יומיומי בסיסי בהחלט אין טעם בשימוש ב-LLMs, אבל עבור כל מה שמעבר (עריכת ספרים, תמלול סרטונים ליוטיוב, תמלול פודקאסטים), אין ספק ששימוש ב-LLMs (או באתר שלי...) יהיה הרבה יותר יעיל ויחסוך הרבה עבודה, ביחוד עבור מי שגם ככה משקיע מאות ואלפי שקלים עבור תמלול אנושי

                  • הכוכבית היחידה הוא תמלול כתוביות לפי זמנים - שבו LLMs בהחלט עשויים להזות ולהמציא זמנים או לא לדייק בהם
                    גם יצירת תוכן בפורמט קבוע כמו SRT עדיין בעייתית וגורמת להרבה תקלות

                  @dovid כתב בתמלול הקלטות לעברית - בדיוק מלא:

                  @צדיק-תמים כשכתבתי גוגל הבנת שאני מתכוון לג'מיני?
                  גם GPT אני מתכוון לAPI הייעודי שלהם לזיהוי טקסט,
                  ברור לי שGPT עצמו ייתן תוצאה טובה יותר.

                  • מידע בונוס: האיכות של GPT עבור תמלול לא מרשימה בכלל ולא שווה הרבה. נראה ש-OpenAI די הזניחו תכונות מולטי-מודאליות מסויימות בשונה מגוגל
                    למעשה, נראה לי שהמודל האחרון שתומך ב-API של TTS הוא GPT 4o
                  ש מנותק
                  ש מנותק
                  ששא
                  כתב נערך לאחרונה על ידי
                  #20

                  @NH.LOCAL כמי שעסקת בתחום, על מה את ממליץ הכי טוב - בapi או בai?
                  גוגל? ויספר? openAi (דיבור לטקסט)? gpt? מייקרוסופט? ג'מיני?

                  תגובה 1 תגובה אחרונה
                  1
                  • shragaS מנותק
                    shragaS מנותק
                    shraga
                    כתב נערך לאחרונה על ידי
                    #21

                    מישהו ניסה את https://www.ivrit.ai/ ביחס למודלים האחרים שהוזכרו כאן? האם יש להם ערך מוסף משמעותי אם בכלל?

                    תגובה 1 תגובה אחרונה
                    0
                    • צדיק תמיםצ מנותק
                      צדיק תמיםצ מנותק
                      צדיק תמים
                      כתב נערך לאחרונה על ידי צדיק תמים
                      #22

                      הוא מבוסס על whisper, איכותית הוא פחות טוב מג'מיני אבל ייתכן שביחס עלות תועלת הוא עדיף

                      Don’t comment bad code — rewrite it." — Brian W. Kernighan and P. J. Plaugher"
                      טיפים

                      nigunN תגובה 1 תגובה אחרונה
                      1
                      • צדיק תמיםצ צדיק תמים

                        הוא מבוסס על whisper, איכותית הוא פחות טוב מג'מיני אבל ייתכן שביחס עלות תועלת הוא עדיף

                        nigunN מנותק
                        nigunN מנותק
                        nigun
                        כתב נערך לאחרונה על ידי
                        #23

                        @צדיק-תמים כתב בתמלול הקלטות לעברית - בדיוק מלא:

                        הוא מבוסס על whisper, איכותית הוא פחות טוב מג'מיני אבל ייתכן שביחס עלות תועלת הוא עדיף

                        אולי אפשר להשתמש בו כדי לקבל חתימות זמן מדוייקות ואז לשלוח לג'מיני לתיקון (לג'מיני אין חתימות זמן מדוייקות)

                        מייל: nigun@duck.com

                        תגובה 1 תגובה אחרונה
                        0
                        תגובה
                        • תגובה כנושא
                        התחברו כדי לפרסם תגובה
                        • מהישן לחדש
                        • מהחדש לישן
                        • הכי הרבה הצבעות


                        • 1
                        • 2
                        בא תתחבר לדף היומי!
                        • התחברות

                        • אין לך חשבון עדיין? הרשמה

                        • התחברו או הירשמו כדי לחפש.
                        • פוסט ראשון
                          פוסט אחרון
                        0
                        • דף הבית
                        • קטגוריות
                        • פוסטים אחרונים
                        • משתמשים
                        • חיפוש
                        • חוקי הפורום