דילוג לתוכן
  • דף הבית
  • קטגוריות
  • פוסטים אחרונים
  • משתמשים
  • חיפוש
  • חוקי הפורום
כיווץ
תחומים

תחומים - פורום חרדי מקצועי

💡 רוצה לזכור קריאת שמע בזמן? לחץ כאן!
  1. דף הבית
  2. תכנות
  3. STT ונרמול דאטה

STT ונרמול דאטה

מתוזמן נעוץ נעול הועבר תכנות
8 פוסטים 5 כותבים 840 צפיות
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • יהודי טובי מנותק
    יהודי טובי מנותק
    יהודי טוב
    כתב ב נערך לאחרונה על ידי יהודי טוב
    #1

    אני מקבל הקלטה ואני רוצה לשמור את זה כנתונים מסודרים.

    לשם הדוגמא אני מקבל הקלטה של תהליך של טיול הקלטה בסגנון
    "טיול XXX מתחילים במקום X ממשיכים כ10 דקות עד שמגיעים למיקום Y וממשיכים עוד 30 דקות עד לנקודת היעד"
    ואני רוצה לקבל אוביקט כזה

    {
      "title": "טיול XXX",
      "points": [
        {
          "name": "מקום X",
          "timeToNext": 10
        },
        {
          "name": "מיקום Y",
          "timeToNext": 30
        },
        {
          "name": "נקודת היעד",
          "timeToNext": null
        }
      ]
    }
    
    
    1. האם אני צריך להשתמש בSTT ואז עם AI לסדר את הנתונים.
      או שיש משהו שמיועד לזה.

    2. איזה שירות STT הכי טוב בעברית.

    3. איזה מודל AI יכול הכי להתאים לזה.

    אמור להיות לי משהו כמו 50 הקלטות בחודש, ולא אכפת לי לשלם על זה.
    אני רוצה להטמיע את זה בפרויקט node שירוץ על שרת של firebase (שזה לא נותן לי שרת ממש, - במובן שיש לי מחשב - אלא רק מריץ את הפרויקט)

    תודה רבה

    צדיק תמיםצ WWWW 2 תגובות תגובה אחרונה
    0
    • צדיק תמיםצ מנותק
      צדיק תמיםצ מנותק
      צדיק תמים
      השיב ליהודי טוב ב נערך לאחרונה על ידי
      #2

      @יהודי-טוב כתב בTTS ונרמול דאטה:

      איזה שירות STT הכי טוב בעברית.

      הבנתי ש AWS Transcribe הכי טוב כיום

      @יהודי-טוב כתב בTTS ונרמול דאטה:

      איזה מודל AI יכול הכי להתאים לזה.

      כל מודל LLM איכותי עם פרומפט מתאים
      הטובים הם Claude או GPT, אח"כ יש לך את Gemini שיש לו שכבה חינמית נדיבה מאוד ואיכות סבירה

      Don’t comment bad code — rewrite it." — Brian W. Kernighan and P. J. Plaugher"
      טיפים

      תגובה 1 תגובה אחרונה
      3
      • WWWW מנותק
        WWWW מנותק
        WWW
        השיב ליהודי טוב ב נערך לאחרונה על ידי
        #3

        @יהודי-טוב אומרים שזה הכי טוב בעברית:
        https://www.ivrit.ai/he/174-2/

        WWW.netfree@gmail.com || קשבק! החזר כספי לבנק על רכישות באינטרנט || עונים על סקרים ומרוויחים כסף!

        יהודי טובי תגובה 1 תגובה אחרונה
        1
        • יהודי טובי מנותק
          יהודי טובי מנותק
          יהודי טוב
          השיב לWWW ב נערך לאחרונה על ידי
          #4

          @WWW כתב בTTS ונרמול דאטה:

          @יהודי-טוב אומרים שזה הכי טוב בעברית:
          https://www.ivrit.ai/he/174-2/

          בדקתי בינתיים רק בגוגל ובopenAI
          התמלול הזה מאוד דומה לתמלול של openAI (הגיוני שזה על מודול שלהם)
          כשגוגל יותר טוב בהרבה..

          נתתי גם לGPT להשוות לי בין התמלולים והוא גם היה לטובת גוגל....,
          לא יצא לי בינתיים לבדוק בAWS

          בדקתי הקלטה אחת בשלשתם, ויכול להיות שזה לא בדיקה אמינה - שבהקלטה הזו היו נתונים שגוגל פענח בקלות יותר....

          קומפיונטק תגובה 1 תגובה אחרונה
          0
          • dovidD מנותק
            dovidD מנותק
            dovid ניהול
            כתב ב נערך לאחרונה על ידי
            #5

            @יהודי-טוב משונה, יש מצב שהתהפך לך התוצאות?
            אני ממש לפני כמה ימים השוויתי את גוגל וOpenAI והשני היה טוב הרבה יותר.
            אני בדקתי מלא הקלטות, ולא היה אפילו אחת לטובת גוגל.
            אגב בכותרת כתבת בטעות TTS במקום STT.

            מנטור אישי למתכנתים (ולא רק) – להתקדם לשלב הבא!

            בכל נושא אפשר ליצור קשר dovid@tchumim.com

            יהודי טובי תגובה 1 תגובה אחרונה
            2
            • קומפיונטק מנותק
              קומפיונטק מנותק
              קומפיונט
              השיב ליהודי טוב ב נערך לאחרונה על ידי
              #6

              @יהודי-טוב כתב בTTS ונרמול דאטה:

              התמלול הזה מאוד דומה לתמלול של openAI (הגיוני שזה על מודול שלהם)

              המודל של OpenAI נקרא whisper והפרויקט הנ"ל של העברית הוא גם whisper שעבר fine-tuning על הרבה נתונים בעברית.

              אגב יצא לי לבדוק את whisper עם whisper.cpp (שזה זמן ריצה של whisper) והתוצאות היו ממש טובות, לסרטון אקראי של 10 דקות התמלול היה מצוין עם טעויות בודדות, אבל בגרסאות הקטנות יותר (מתחת ל - medium) התמלול היה על הפנים.

              תגובה 1 תגובה אחרונה
              1
              • יהודי טובי מנותק
                יהודי טובי מנותק
                יהודי טוב
                השיב לdovid ב נערך לאחרונה על ידי
                #7

                @dovid כתב בTTS ונרמול דאטה:

                @יהודי-טוב משונה, יש מצב שהתהפך לך התוצאות?
                אני ממש לפני כמה ימים השוויתי את גוגל וOpenAI והשני היה טוב הרבה יותר.
                אני בדקתי מלא הקלטות, ולא היה אפילו אחת לטובת גוגל.

                אולי השתמשתי במודול אחר

                מצרף את הקוד שבדקתי

                        //OpenAI
                        const openAi = await openaiConf.audio.transcriptions.create({
                            file: fs.createReadStream(tempFilePath), 
                            model: "whisper-1",
                            response_format: "verbose_json",
                            language: "he",
                        });
                
                        //Google
                        const file = fs.readFileSync(tempFilePath);
                        const [responseGoogle] = await googleConf.recognize({
                            audio: { content: Buffer.from(file).toString('base64') },
                            config: { languageCode: 'iw-IL' },
                        });
                

                אגב בכותרת כתבת בטעות TTS במקום STT.

                תיקנתי

                תגובה 1 תגובה אחרונה
                0
                • dovidD מנותק
                  dovidD מנותק
                  dovid ניהול
                  כתב ב נערך לאחרונה על ידי
                  #8

                  @יהודי-טוב אני כתבתי את השאילתה בעצמי, אבל תכלס זה בדיוק אותו דבר.
                  יש כן הבדל שאני לא ציינתי שפה עברית, קשה להאמין שזה יותר טוב.
                  כנראה שזה לא הקלטה מייצגת, אבל אפילו על מקרה אחד קשה לי להאמין שגוגל היו טובים יותר.

                  מנטור אישי למתכנתים (ולא רק) – להתקדם לשלב הבא!

                  בכל נושא אפשר ליצור קשר dovid@tchumim.com

                  תגובה 1 תגובה אחרונה
                  0
                  • צדיק תמיםצ צדיק תמים התייחס לנושא זה ב

                  בא תתחבר לדף היומי!
                  • התחברות

                  • אין לך חשבון עדיין? הרשמה

                  • התחברו או הירשמו כדי לחפש.
                  • פוסט ראשון
                    פוסט אחרון
                  0
                  • דף הבית
                  • קטגוריות
                  • פוסטים אחרונים
                  • משתמשים
                  • חיפוש
                  • חוקי הפורום