דילוג לתוכן
  • דף הבית
  • קטגוריות
  • פוסטים אחרונים
  • משתמשים
  • חיפוש
  • חוקי הפורום
כיווץ
תחומים

תחומים - פורום חרדי מקצועי

💡 רוצה לזכור קריאת שמע בזמן? לחץ כאן!
  1. דף הבית
  2. אינטרנט
  3. תמלול הקלטות לעברית - בדיוק מלא

תמלול הקלטות לעברית - בדיוק מלא

מתוזמן נעוץ נעול הועבר אינטרנט
20 פוסטים 6 כותבים 233 צפיות 5 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • צדיק תמיםצ צדיק תמים

    @dovid איזה מודל של גוגל?
    לי יצא משהו אחר לגמרי עם Gemini 3 Pro Preview (פרומפט: תתמלל בקפדנות)

    הקדוש ברוך הוא אמר לו אחר כך, ויאמר השם אל משה שלח ידך ואחוז בזנבו, תחזיק את זה - מיד נהפך בחזרה למטה. קודם נהיה מהמטה נחש, אחר כך מהנחש נהיה מטה.

    אומר רב שמשון רפאל הירש: המהות של המטה, מה זה מטה? זה משענת שהבן אדם נשען על זה, הוא נסמך על זה. נחש הוא בדיוק ההיפך, הגמרא אומרת אין אדם דר עם נחש בכפיפה אחת, אי אפשר לחיות עם זה. נחש זה בדיוק ההיפך. מטה זה המשענת שבן אדם נסמך על זה, נשען על זה, ומצד שני הנחש זה הדבר שכולם בורחים מזה.

    וזה האות והסימן שאין עוד מלבדו. תראה את המטה הזה? זה נהפך לנחש. הנחש הזה - נהפך למטה. תגיד, השונא הזה, הרודף הזה - הוא יכול להיות המשענת שלך. והמשענת שלך יכולה להיהפך לשונא. הכל זה תלוי רק בי.

    את זה הקדוש ברוך הוא אמר למשה רבינו כשהוא אמר להקדוש ברוך הוא "והן לא יאמינו לי". ככה הוא אמר למשה רבינו. משה רבינו אמר להקדוש ברוך הוא "והן לא יאמינו לי", מה אני אומר להם? "כי יאמרו לא נראה אליך השם". אמר לו הקדוש ברוך הוא: תרים את המטה הזה שיש, "האייבישטער" בעולם. שהמטה הזה...

    הלשון שלו אומר: "נמצא שדבר השם אל משה הוא כך: נשלח תעודת האות הלזה על ידי עוקר או איחוד והייחוד(?), אשר אם יחפוץ בכך - יוכל לגרום לדבר עצמו שעליו האדם נשען ונתמך, המטה, וזה יהיה כלי מריתו למרוד בו". המטה הזה יהיה הנחש המורד. "ומצד שני הוא אומר, להיפך, אם יחפוץ אחרת - יוכל לקחת כוח מתנגד ושונא שהאדם ירא ממנו ונס מפניו, ולתת בידו כמשענת נוכה וככלי העושה את רצונו". כמו שהנחש נהפך למטה. זה הקדוש ברוך הוא ירמז (?). השונא הכי גדול הוא יכול להיות המטה שלך, והמטה שלך... המטה, תבין שרק הקדוש ברוך הוא.

    אומרים שה"הייליגער רוז'ינער" אמר, כשהיה לו רדיפות מ... מלכות הרשעה במדינת רוסיה, הוא היה נרדף מהם. אז הוא אמר: דוד המלך, כשהתעורר עליו קנאת שאול, שאול המלך, וקמו וביקשו את נפשו, רצו... רצו להרוג אותו. עם כל זה, מה הוא אמר דוד המלך? "שרים רדפוני חינם". כל הרדיפות של השרים האלו, של שאול המלך ואנשי ביתו, זה בחינם, כי הם לא יכולים להזיק לשום דבר. אני לא מפחד מהם. זה בחינם. רק מה? "ומדברך פחד ליבי", אני מפחד כי אתה שלחת עליהם, כי זה יצא מאיתו יתברך. "ומדברך" - בגלל הגזירה שלך הם רודפים אחרי, על זה פחד ליבי. "שרים רדפוני" - מה שהם רודפים אותי - "חינם", אני לא מפחד מזה, כי הם לא יכולים לעשות שום דבר. רק מה? "ומדברך פחד ליבי", כי זה הגזירה שלך, לכן פחד ליבי.

    וזה כתוב השבוע באמת בפרשה מיד אחרי שני: "ופרעה הקריב, וישאו בני ישראל את עיניהם והנה מצרים נוסע אחריהם, וייראו מאוד ויצעקו בני ישראל אל השם". השואלים, איך כתוב "וישאו בני ישראל את עיניהם והנה מצרים נוסע אחריהם"? שואלים למה לא כתוב "ויראו בני ישראל והנה מצרים נוסע אחריהם"? למה "וישאו בני ישראל את עיניהם"? רק זה הפירוש אומר, שכשכלל ישראל ראו את מצרים נוסע אחריהם, אז נשאו עיניהם כלפי מעלה. "וישאו בני ישראל את עיניהם" - זה לא המצרים, זה "האייבישטער". אין כוח ביד המצרים לרדוף אם השם לא ציווה, אם לא נגזר זאת מן השמיים. ולכן "ויצעקו בני ישראל אל השם", לכן צעקו להקדוש ברוך הוא. כי "וישאו בני ישראל את עיניהם", הם הבינו שזה מהקדוש ברוך הוא. לדעת בכל עת ובכל דבר לחיות בזה, שזה הקדוש ברוך הוא ורק מהקדוש ברוך הוא.

    פרשת המן. כולם יודעים, יום שלישי בשלח, סגולה של פרשת המן. וזה מה שכתוב, אתם יודעים שבהלכה כתוב בשולחן ערוך בסימן א', כתוב סימן א' סעיף ה': "טוב לומר" - בכל יום, המחבר אומר - "טוב לומר פרשת העקידה ופרשת המן". אומר הט"ז, שמה העניין בפרשת המן? שהוא כדי שיאמין האדם שכל מזונותיו באים בהשגחה מלמעלה. כדי להאמין שהכל בא... געלט, כסף, מגיע... מאני (Money), מגיע מלמעלה. הכל רק מלמעלה.

    אומר על זה המשנה ברורה בסעיף קטן י"ג, מסביר את זה קצת יותר: "להורות שריבוי ההשתדלות לא יועיל מאומה". שום דבר לא יועיל לך ריבוי ההשתדלות, כי כך היה בפרשת המן. מה היה? "וימודו בעומר, לא העדיף המרבה והממעיט לא החסיר". כל אחד היה צריך לקבל עומר לגולגולת. זה שלקח הרבה וזה לקח מעט - אותו דבר, מדדו אחר כך בבית, ראו - היה עומר לגולגולת, שום דבר לא עזר.

    האמת היא, כתוב ברבינו בחיי אומר בפרשת השבוע, או ב... כתוב זה הלשון: "וקבלה ביד חכמים: כי כל האומר פרשת המן בכל יום - מובטח לו, מובטח לו, שלא יבוא לידי... שלא יבוא לעולם לידי חסרון מזונות". אף פעם הוא לא יבוא לידי חסרון מזונות. קבלה ביד חכמים. עוד הפעם: "כי כל האומר פרשת המן בכל יום, מובטח לו שלא יבוא לעולם לידי חסרון מזונות".

    התשב"ץ בסימן רנ"ו אומר בשם ירושלמי, מביא ירושלמי, שכל האומר פרשת המן בכל יום מובטח לו שלא יתמעטו מזונותיו, והתשב"ץ מוסיף שתי מילים: "ואני ערב". הוא "ואני ערב". שמה? שעל הבטחה - מובטח לו שלא יתמעטו מזונותיו.

    איך אומרים פרשת המן? הציבור מתחיל, אומרים "ויאמר השם אל משה הנני ממטיר". אומרים מה זה "ממטיר"? "הנני ממטיר לכם לחם מן השמים". מה זה ממטיר? שממטיר זה מטר. גשם. כשהולך ברחוב ויש גשם, יש גשם חזק - אתה רוצה לעצור את זה שיהיה יותר חלש, אתה יכול? לא. ואם יש חלש אתה רוצה שיהיה יותר חזק - אתה רוצה, אתה יכול? לא. אותו דבר לחם מן השמים. אתה לא יכול שום דבר. יש מצווה של השתדלות, אבל ריבוי ההשתדלות לא יועיל מאומה. אתה לא יכול שום דבר לעשות.

    על זה אמרו חז"ל: "מאן דיהיב חיי", הגמרא אומרת בתענית דף ח', מי שנותן חיים - "יהיב מזוני". מה הפירוש? שיהיה עשיר הכי גדול, המלך הכי גדול, עשיר, טריליונר - הוא יכול להוסיף עוד יום בחיים? לחיות? לא. אותו דבר "יהיב מזוני", "מאן דיהיב חיי יהיב מזוני", עוד דולר גם לא יכול להוסיף. שום דבר. יש מצווה של השתדלות אבל אנחנו חייבים להאמין שהכל קצוב מהשמיים.

    ברור שצריכים לעשות השתדלות. ברור. אבל זה כמו, אתם יודעים, שהולכים השבוע בשבת שירה הולכים לתת לציפורים לאכול. לציפורים. למה נותנים לציפורים? עוד מעט נראה אולי את הטעם האמיתי... אבל לא נותנים לציפורים... ראיתם איך ציפור אוכל? הייתם? עם הראש, מכופף את הראש - ומיד מעלה. כמו קפיץ. מוריד ומיד מעלה. מוריד ומיד מעלה. ככה תעשה את ההשתדלות. השתדלות צריך לעשות, אבל מיד תשא עיניו לשמיים. תרים את העיניים לשמיים. תרים את הראש למעלה. "וישאו בני ישראל". תאמין שהכל מהקדוש ברוך הוא. לעשות השתדלות אבל להאמין מיד שהכל מהקדוש ברוך הוא.

    לעשות השתדלות, ודאי צריך לעשות השתדלות. ודאי צריך לעשות השתדלות.

    dovidD מנותק
    dovidD מנותק
    dovid
    ניהול
    כתב נערך לאחרונה על ידי
    #9

    @צדיק-תמים
    https://speech.googleapis.com/v1/speech
    אם אתה משתמש בAI, תוכל להביא לו את הפלט של elevenlabs, יכול להיות שהוא יגיע עם זה לתוצאות עוד יותר טובות.

    • מנטור אישי בתכנות והמסתעף – להתקדם לשלב הבא!
    • בכל נושא אפשר ליצור קשר dovid@tchumim.com
    צדיק תמיםצ תגובה 1 תגובה אחרונה
    1
    • dovidD dovid

      @צדיק-תמים
      https://speech.googleapis.com/v1/speech
      אם אתה משתמש בAI, תוכל להביא לו את הפלט של elevenlabs, יכול להיות שהוא יגיע עם זה לתוצאות עוד יותר טובות.

      צדיק תמיםצ מנותק
      צדיק תמיםצ מנותק
      צדיק תמים
      כתב נערך לאחרונה על ידי
      #10

      @dovid אי אפשר להשוות מודל STT מהדור הישן למודל טרנספורמר עדכני של elevenlabs או GPT
      פרומפט מתאים היה משפר את התוצאה עוד יותר כמו אתר אלף בוט שהובא לעיל

      Don’t comment bad code — rewrite it." — Brian W. Kernighan and P. J. Plaugher"
      טיפים

      תגובה 1 תגובה אחרונה
      1
      • dovidD מנותק
        dovidD מנותק
        dovid
        ניהול
        כתב נערך לאחרונה על ידי
        #11

        @צדיק-תמים כשכתבתי גוגל הבנת שאני מתכוון לג'מיני?
        גם GPT אני מתכוון לAPI הייעודי שלהם לזיהוי טקסט,
        ברור לי שGPT עצמו ייתן תוצאה טובה יותר.

        • מנטור אישי בתכנות והמסתעף – להתקדם לשלב הבא!
        • בכל נושא אפשר ליצור קשר dovid@tchumim.com
        ש תגובה 1 תגובה אחרונה
        1
        • dovidD dovid

          @צדיק-תמים כשכתבתי גוגל הבנת שאני מתכוון לג'מיני?
          גם GPT אני מתכוון לAPI הייעודי שלהם לזיהוי טקסט,
          ברור לי שGPT עצמו ייתן תוצאה טובה יותר.

          ש מנותק
          ש מנותק
          ששא
          כתב נערך לאחרונה על ידי
          #12

          @dovid @צדיק-תמים לא הבנתי, יש אפשרות לתמלל בגוגל עם המודול של ג'מיני פרו (בAPI)? כי לפי מה שהביא @צדיק-תמים זה מאוד מדויק ומובן

          צדיק תמיםצ תגובה 1 תגובה אחרונה
          1
          • ש ששא

            @dovid @צדיק-תמים לא הבנתי, יש אפשרות לתמלל בגוגל עם המודול של ג'מיני פרו (בAPI)? כי לפי מה שהביא @צדיק-תמים זה מאוד מדויק ומובן

            צדיק תמיםצ מנותק
            צדיק תמיםצ מנותק
            צדיק תמים
            כתב נערך לאחרונה על ידי
            #13

            @ששא ודאי שאפשר
            ופרומפט מתאים ישפר את התוצאה עוד יותר
            יש מגבלות קצב כל עוד החשבון שלך לא הוציא X כסף (תגגל gemini rate limits)

            Don’t comment bad code — rewrite it." — Brian W. Kernighan and P. J. Plaugher"
            טיפים

            ש תגובה 1 תגובה אחרונה
            0
            • צדיק תמיםצ צדיק תמים

              @ששא ודאי שאפשר
              ופרומפט מתאים ישפר את התוצאה עוד יותר
              יש מגבלות קצב כל עוד החשבון שלך לא הוציא X כסף (תגגל gemini rate limits)

              ש מנותק
              ש מנותק
              ששא
              כתב נערך לאחרונה על ידי
              #14

              @צדיק-תמים כתב בתמלול הקלטות לעברית - בדיוק מלא:

              ופרומפט מתאים

              דהיינו?

              לא הוציא X כסף

              לא הבנתי

              תגגל gemini rate limits

              מגבלות די נמוכות - 1,500 ליום זה ממש לא הרבה...

              צדיק תמיםצ תגובה 1 תגובה אחרונה
              0
              • ש ששא

                @צדיק-תמים כתב בתמלול הקלטות לעברית - בדיוק מלא:

                ופרומפט מתאים

                דהיינו?

                לא הוציא X כסף

                לא הבנתי

                תגגל gemini rate limits

                מגבלות די נמוכות - 1,500 ליום זה ממש לא הרבה...

                צדיק תמיםצ מנותק
                צדיק תמיםצ מנותק
                צדיק תמים
                כתב נערך לאחרונה על ידי
                #15

                @ששא
                פרומפט הכוונה לבקש במפורט את סגנון הפלט הרצוי, רקע על הדובר, מילים רלוונטיות, כל הדברים שמשפרים תפוקה של מודל שפה כמו גמיני
                49c342f3-58e9-44ca-8485-60babbccee35-CleanShot 2026-02-20 at 01.32.22@2x.png
                לא יודע מאיפה המספר 1500

                Don’t comment bad code — rewrite it." — Brian W. Kernighan and P. J. Plaugher"
                טיפים

                ש תגובה 1 תגובה אחרונה
                0
                • צדיק תמיםצ צדיק תמים

                  @ששא
                  פרומפט הכוונה לבקש במפורט את סגנון הפלט הרצוי, רקע על הדובר, מילים רלוונטיות, כל הדברים שמשפרים תפוקה של מודל שפה כמו גמיני
                  49c342f3-58e9-44ca-8485-60babbccee35-CleanShot 2026-02-20 at 01.32.22@2x.png
                  לא יודע מאיפה המספר 1500

                  ש מנותק
                  ש מנותק
                  ששא
                  כתב נערך לאחרונה על ידי
                  #16

                  @צדיק-תמים כתב בתמלול הקלטות לעברית - בדיוק מלא:

                  לא יודע מאיפה המספר 1500

                  1.זה לא קשור לדף הזה?
                  2.ממש לא הבנתי מה אומר המלל שם ומה פירושם
                  ואשמח גם אם אחרי ההסבר תוכל גם להגיד לי אם אתה יודע מה באמת המגבלה

                  צדיק תמיםצ תגובה 1 תגובה אחרונה
                  0
                  • ש ששא

                    @צדיק-תמים כתב בתמלול הקלטות לעברית - בדיוק מלא:

                    לא יודע מאיפה המספר 1500

                    1.זה לא קשור לדף הזה?
                    2.ממש לא הבנתי מה אומר המלל שם ומה פירושם
                    ואשמח גם אם אחרי ההסבר תוכל גם להגיד לי אם אתה יודע מה באמת המגבלה

                    צדיק תמיםצ מנותק
                    צדיק תמיםצ מנותק
                    צדיק תמים
                    כתב נערך לאחרונה על ידי
                    #17

                    @ששא מה הקשר Code Assist?
                    אין מגבלה אחת, זה תלוי מודל ותלוי בהיסטוריית התשלומים של החשבון

                    Don’t comment bad code — rewrite it." — Brian W. Kernighan and P. J. Plaugher"
                    טיפים

                    תגובה 1 תגובה אחרונה
                    0
                    • dovidD מנותק
                      dovidD מנותק
                      dovid
                      ניהול
                      כתב נערך לאחרונה על ידי dovid
                      #18

                      יש שתי נקודות שבמקרים מסויימים יכולים להיות סיבות למה לא להשתמש בג'מיני (או כל LLM מולטי), אלא בAPI ייעודי:
                      א. מחיר - הLLM יותר יקר ופחות ניתן לחיזוי בלי ניסיון בפועל.
                      ב. טמפרטורה ודטרמניזם - הLLM עלול - תיאורטית לפחות - להפתיע לרעה, או בכלל להפתיע.

                      יכול להיות שאני טועה בשניהם (כלומר שיש דרך להעריך בקלות את המחיר, ושכיום או תמיד היה ניתן להדק את הודאות של הפלט ל99.99 אחוזים), אני התמודדתי עם שני הדברים האלה כמה פעמים. גם בתרגום טקסט לטקסט, וגם באילוץ מבנה תשובה ששמה לכאורה לא יכולים להיות הפתעות.

                      • מנטור אישי בתכנות והמסתעף – להתקדם לשלב הבא!
                      • בכל נושא אפשר ליצור קשר dovid@tchumim.com
                      NH.LOCALN תגובה 1 תגובה אחרונה
                      1
                      • dovidD dovid

                        יש שתי נקודות שבמקרים מסויימים יכולים להיות סיבות למה לא להשתמש בג'מיני (או כל LLM מולטי), אלא בAPI ייעודי:
                        א. מחיר - הLLM יותר יקר ופחות ניתן לחיזוי בלי ניסיון בפועל.
                        ב. טמפרטורה ודטרמניזם - הLLM עלול - תיאורטית לפחות - להפתיע לרעה, או בכלל להפתיע.

                        יכול להיות שאני טועה בשניהם (כלומר שיש דרך להעריך בקלות את המחיר, ושכיום או תמיד היה ניתן להדק את הודאות של הפלט ל99.99 אחוזים), אני התמודדתי עם שני הדברים האלה כמה פעמים. גם בתרגום טקסט לטקסט, וגם באילוץ מבנה תשובה ששמה לכאורה לא יכולים להיות הפתעות.

                        NH.LOCALN מנותק
                        NH.LOCALN מנותק
                        NH.LOCAL
                        כתב נערך לאחרונה על ידי NH.LOCAL
                        #19

                        @dovid כתב בתמלול הקלטות לעברית - בדיוק מלא:

                        יש שתי נקודות שבמקרים מסויימים יכולים להיות סיבות למה לא להשתמש בג'מיני (או כל LLM מולטי), אלא בAPI ייעודי:
                        א. מחיר - הLLM יותר יקר ופחות ניתן לחיזוי בלי ניסיון בפועל.
                        ב. טמפרטורה ודטרמניזם - הLLM עלול - תיאורטית לפחות - להפתיע לרעה, או בכלל להפתיע.

                        יכול להיות שאני טועה בשניהם (כלומר שיש דרך להעריך בקלות את המחיר, ושכיום או תמיד היה ניתן להדק את הודאות של הפלט ל99.99 אחוזים), אני התמודדתי עם שני הדברים האלה כמה פעמים. גם בתרגום טקסט לטקסט, וגם באילוץ מבנה תשובה ששמה לכאורה לא יכולים להיות הפתעות.

                        אני רואה שהזכירו את האתר שלי לעיל

                        כמה הערות מנסיוני כאחד שהשקיע הרבה בירור ועבודה של חודשים בנושא:

                        • בשונה מהמקובל - למודלים כמו וויספר ודומיהם יש הזיות לא פחות ממודלים מבוססי LLM
                          באופן אישי נתקלתי בהזיות האלו בשימוש די בסיסי אפילו עבור תמלול תוכן באנגלית
                          הנה לדוגמה כתבה בנושא שנתקלתי בה בעבר

                        • LLMs אכן הוזים לפעמים כאשר מדובר על תוכן שפחות נמצא בנתוני האימון, כמו יידיש או הברה אשכנזית כבדה
                          אבל בעברית סטנדרטית עם איכות הקלטה סבירה, רמת הדיוק שלהם קרובה מאוד ל-100%, ברמה שיתכן שניתן לוותר אפילו על הגייה אנושית (אם כי לא הייתי סומך על זה בעיניים עצומות)

                        • המחיר הוא אכן שיקול משמעותי ולשימוש יומיומי בסיסי בהחלט אין טעם בשימוש ב-LLMs, אבל עבור כל מה שמעבר (עריכת ספרים, תמלול סרטונים ליוטיוב, תמלול פודקאסטים), אין ספק ששימוש ב-LLMs (או באתר שלי...) יהיה הרבה יותר יעיל ויחסוך הרבה עבודה, ביחוד עבור מי שגם ככה משקיע מאות ואלפי שקלים עבור תמלול אנושי

                        • הכוכבית היחידה הוא תמלול כתוביות לפי זמנים - שבו LLMs בהחלט עשויים להזות ולהמציא זמנים או לא לדייק בהם
                          גם יצירת תוכן בפורמט קבוע כמו SRT עדיין בעייתית וגורמת להרבה תקלות

                        @dovid כתב בתמלול הקלטות לעברית - בדיוק מלא:

                        @צדיק-תמים כשכתבתי גוגל הבנת שאני מתכוון לג'מיני?
                        גם GPT אני מתכוון לAPI הייעודי שלהם לזיהוי טקסט,
                        ברור לי שGPT עצמו ייתן תוצאה טובה יותר.

                        • מידע בונוס: האיכות של GPT עבור תמלול לא מרשימה בכלל ולא שווה הרבה. נראה ש-OpenAI די הזניחו תכונות מולטי-מודאליות מסויימות בשונה מגוגל
                          למעשה, נראה לי שהמודל האחרון שתומך ב-API של TTS הוא GPT 4o

                        אלף בוט - תמלול מדויק לתוכן תורני
                        https://alef-bot.top

                        ש תגובה 1 תגובה אחרונה
                        6
                        • NH.LOCALN NH.LOCAL

                          @dovid כתב בתמלול הקלטות לעברית - בדיוק מלא:

                          יש שתי נקודות שבמקרים מסויימים יכולים להיות סיבות למה לא להשתמש בג'מיני (או כל LLM מולטי), אלא בAPI ייעודי:
                          א. מחיר - הLLM יותר יקר ופחות ניתן לחיזוי בלי ניסיון בפועל.
                          ב. טמפרטורה ודטרמניזם - הLLM עלול - תיאורטית לפחות - להפתיע לרעה, או בכלל להפתיע.

                          יכול להיות שאני טועה בשניהם (כלומר שיש דרך להעריך בקלות את המחיר, ושכיום או תמיד היה ניתן להדק את הודאות של הפלט ל99.99 אחוזים), אני התמודדתי עם שני הדברים האלה כמה פעמים. גם בתרגום טקסט לטקסט, וגם באילוץ מבנה תשובה ששמה לכאורה לא יכולים להיות הפתעות.

                          אני רואה שהזכירו את האתר שלי לעיל

                          כמה הערות מנסיוני כאחד שהשקיע הרבה בירור ועבודה של חודשים בנושא:

                          • בשונה מהמקובל - למודלים כמו וויספר ודומיהם יש הזיות לא פחות ממודלים מבוססי LLM
                            באופן אישי נתקלתי בהזיות האלו בשימוש די בסיסי אפילו עבור תמלול תוכן באנגלית
                            הנה לדוגמה כתבה בנושא שנתקלתי בה בעבר

                          • LLMs אכן הוזים לפעמים כאשר מדובר על תוכן שפחות נמצא בנתוני האימון, כמו יידיש או הברה אשכנזית כבדה
                            אבל בעברית סטנדרטית עם איכות הקלטה סבירה, רמת הדיוק שלהם קרובה מאוד ל-100%, ברמה שיתכן שניתן לוותר אפילו על הגייה אנושית (אם כי לא הייתי סומך על זה בעיניים עצומות)

                          • המחיר הוא אכן שיקול משמעותי ולשימוש יומיומי בסיסי בהחלט אין טעם בשימוש ב-LLMs, אבל עבור כל מה שמעבר (עריכת ספרים, תמלול סרטונים ליוטיוב, תמלול פודקאסטים), אין ספק ששימוש ב-LLMs (או באתר שלי...) יהיה הרבה יותר יעיל ויחסוך הרבה עבודה, ביחוד עבור מי שגם ככה משקיע מאות ואלפי שקלים עבור תמלול אנושי

                          • הכוכבית היחידה הוא תמלול כתוביות לפי זמנים - שבו LLMs בהחלט עשויים להזות ולהמציא זמנים או לא לדייק בהם
                            גם יצירת תוכן בפורמט קבוע כמו SRT עדיין בעייתית וגורמת להרבה תקלות

                          @dovid כתב בתמלול הקלטות לעברית - בדיוק מלא:

                          @צדיק-תמים כשכתבתי גוגל הבנת שאני מתכוון לג'מיני?
                          גם GPT אני מתכוון לAPI הייעודי שלהם לזיהוי טקסט,
                          ברור לי שGPT עצמו ייתן תוצאה טובה יותר.

                          • מידע בונוס: האיכות של GPT עבור תמלול לא מרשימה בכלל ולא שווה הרבה. נראה ש-OpenAI די הזניחו תכונות מולטי-מודאליות מסויימות בשונה מגוגל
                            למעשה, נראה לי שהמודל האחרון שתומך ב-API של TTS הוא GPT 4o
                          ש מנותק
                          ש מנותק
                          ששא
                          כתב נערך לאחרונה על ידי
                          #20

                          @NH.LOCAL כמי שעסקת בתחום, על מה את ממליץ הכי טוב - בapi או בai?
                          גוגל? ויספר? openAi (דיבור לטקסט)? gpt? מייקרוסופט? ג'מיני?

                          תגובה 1 תגובה אחרונה
                          1
                          תגובה
                          • תגובה כנושא
                          התחברו כדי לפרסם תגובה
                          • מהישן לחדש
                          • מהחדש לישן
                          • הכי הרבה הצבעות


                          בא תתחבר לדף היומי!
                          • התחברות

                          • אין לך חשבון עדיין? הרשמה

                          • התחברו או הירשמו כדי לחפש.
                          • פוסט ראשון
                            פוסט אחרון
                          0
                          • דף הבית
                          • קטגוריות
                          • פוסטים אחרונים
                          • משתמשים
                          • חיפוש
                          • חוקי הפורום